Obtenir le programme | Dernières nouveautés |
ISLAND :
Programme de simulation d'expériences de cartographie physique de chromosomes par la méthode d'ancrage |
---|
Fonction | Références | Usage |
Ce programme permet de déterminer ou d'estimer le résultat d'expériences de cartographie physique de génomes par la méthode d'ancrage, en calculant le nombre (moyen) d'îles ancrées obtenues, leur longueur moyenne ainsi que la proportion (moyenne) de génome non recouvert par les îles ancrées.
Les positions des clones et des ancres le long du génome sont :
- soit lues dans des fichiers fournis par l'utilisateur,
- soit simulées à partir de paramètres indiqués par l'utilisateur.
Les clones contenant au moins une ancre en commun sont assemblés en îles ancrées.
Le programme est écrit en C++.
L'utilisateur fournit les 2 fichiers suivants :
Attention :
ce fichier doit être trié selon les valeurs décroissantes des positions
de fin de clones.
Pour ce faire, le shell-script
sort.clones
est disponible dans le package
pour constituer ce fichier à partir d'un fichier non trié.
Attention :
ce fichier doit être trié selon les valeurs décroissantes des positions
des ancres.
Pour ce faire, le shell-script
sort.anchors
est disponible dans le package
pour constituer ce fichier à partir d'un fichier non trié.
Références:
Usage:
positions des clones et des ancres
lues dans des fichiers
positions des clones et des ancres
simulées
Les entrées
Les sorties
Utilisation
Exemple
- la longueur du génome étudié,
- et pour chaque clone, en partant de la fin du génome, la position
(sur le génome) du début du clone, suivie de la position de sa fin.
- la longueur du génome étudié
(la même que sur le fichier des clones),
- la position sur le génome de chaque ancre, en partant de la fin du génome.
Par une commande Unix | À partir d'un programme d'appel |
island -c[lones] nom-du-fichier-des-clones -a[nchors] nom-du-fichier-des-ancres [-f[rench]]Le fichier des clones et le fichier des ancres sont 2 fichiers en entrée, non modifiés en sortie.
Les résultats sont imprimés sur la sortie standard.
Quand l'option -french est positionnée, les messages apparaissent en français. Par défaut, ils sont en anglais.
On peut appeler island à partir d'un programme ou d'un système d'accueil, après compilation des fichiers-source C++ fournis dans le package et édition de liens des fichiers-objet créés avec le programme ou le système d'appel.
Deux possibilités sont offertes :
appeler directement le programme qui effectue les calculs : dans ce cas, les résultats sont transmis dans des arguments.
Dans tous les cas,
une variable globale doit être déclarée et initialisée
dans le programme d'appel :
La déclaration du programme à appeler est la suivante :
int french=0;
La valeur 0 signifie que les messages sont en anglais.
Si on désire des messages en français, french
doit être initialisée à la valeur 1.
avec affichage des résultats :
void main_lecture(char* ficclone, char * ficancre);
Les arguments ficclone et
ficancre contiennent respectivement
le pathname du fichier où sont indiquées les positions des clones
et le pathname du fichier où sont indiquées les positions
des ancres.
La déclaration du programme à appeler est la suivante :
void commun(int SIZE, int M, int N, int inter, double Ginit, double Np, double max, double min, ifstream& ificclone, ifstream& ificancre, ofstream& ofic, double& NbMoy, double& LgMoy, double& OceanMoy, double& VarNbIle, double& VarLgIle, double& VarOcean)
Remarque :
Les valeurs des écart-types obtenues dans les autres modes
d'utilisation du programme sont égales à sqrt(Variance/SIZE).
Premières lignes du fichier des clones, fichier appelé CLONES :
Premières lignes du fichier des ancres, fichier appelé ANCRES :
Exécution :
Résultat :
Un dialogue est établi avec l'utilisateur, par lequel
celui-ci fournit les paramètres suivants :
(Les commentaires ne font pas partie du fichier)
100000 <----- longueur du génome en paires de bases
99805 99920 <----- débuts puis fins de clones
99749 99894 <----- ....
99762 99877 <----- .... triés par fins décroissantes
(Les commentaires ne font pas partie du fichier)
100000 <----- longueur du génome en paires de bases
99927 <----- positions d'ancres
99865 <----- ....
99563 <----- .... triées par valeurs décroissantes
island -clones CLONES -anchors ANCRES -french
Ce programme calcule certaines propriétés de la carte physique
d'un génome de taille 100000 construite par la méthode d'ancrage.
Les positions des clones et des ancres sont lues respectivement
dans les fichiers CLONES et ANCRES.
Nombre de clones considérés : 2334
Nombre d'ancres considérées : 514
Voici les résultats :
On obtient 193 îles ancrées,
d'une longueur moyenne de 519.466 bases
et couvrant 88.0718 pourcent du génome.
Les conditions expérimentales
Les entrées
Les sorties
Utilisation
Exemple
Par une commande Unix | À partir d'un programme d'appel |
island [-d[etail] nom-de-fichier ] [-f[rench]]L'option -detail provoque l'écriture, dans le fichier du nom spécifié, des trois quantités d'intérêt à chaque itération.
Quand l'option -french est positionnée, les messages apparaissent en français. Par défaut, ils sont en anglais.
Les résultats sont imprimés sur la sortie standard.
Comme dans le cas où les positions des clones et des ancres sont lues sur des fichiers, on peut appeler island à partir d'un programme ou d'un système d'accueil : voir le paragraphe A.3.2.
La déclaration du programme à appeler est la suivante :
void main_simul(char* fic);L'argument fic contient le pathname du fichier où l'on désire stocker les trois quantités d'intérêt à chaque itération. Si on ne désire pas stocker ces valeurs, fic doit être égal à NULL.
Remarque : fic correspond à la valeur de l'option -detail de la commande island.
Appel de la commande Unix :
island -frenchCe qui apparaît sur l'écran (ou la sortie standard) :
Ce programme calcule certaines propriétés de la carte physique d'un génome construite par la méthode d'ancrage. Entrez les données nécessaires à la réalisation de cette expérience. Combien d'itérations voulez-vous effectuer (>0) ? 100 Quelle est la longueur du génome (en paires de bases) ? 100000000 Quel est le nombre moyen d'ancres (>0) ? 500 Quel est le nombre moyen de clones (>0) ? 2300 Combien y a t-il de plages (>0) ? 20 Quelle est la longueur des longs clones (en bases) ? 350000 Quelle est la longueur des courts clones (en bases) ? 150000 Quelle est la variabilité des longueurs au sein d'une plage de clones (en bases) ? 100000 Longueur du génome (bp) : 1e+08 Nombre moyen d'ancres : 500 Nombre moyen de clones : 2300 Nombre de plages : 20 Longueur moyenne des longs clones (bp) : 350000 Longueur moyenne des courts clones (bp) : 150000 Variabilité des longueurs de clones (bp) : 100000 RÉSULTATS: Nombre moyen d'îles ancrées : 175.02 (+/- 0.7970) Longueur moyenne des îles ancrées (bp) : 540575.02 (+/- 1934.8311) Proportion moyenne d'océans : 0.16 (+/- 0.0018)