English version Écrivez-nous

Pour trier les fichiers en entrée de island



Les fichiers en entrée de island doivent être triés: le fichier des positions des clones selon les valeurs décroissantes des positions de fin de clones et le fichier des positions des ancres selon les valeurs décroissantes des positions des ancres.

Les shell-scripts sort.clones et sort.anchors sont disponibles dans le package pour constituer ces fichiers à partir de fichiers non triés.


Le shell-script sort.clones

Fonction Syntaxe Restrictions Exemple

Fonction:

Effectuer un tri décroissant de la deuxième colonne d'un fichier à partir de la deuxième ligne.

Syntaxe :
sort.clones < nom-du-fichier-à-trier > nom-du-fichier-trié

Restrictions d'usage:

Le fichier en entrée doit respecter la structure suivante:
- la première ligne contient la longueur du génome en paires de bases,
- chacune des lignes suivantes comporte :

  1. la position de début d'un clone,
  2. un ou plusieurs caractères blancs,
  3. la position de fin du clone,
  4. éventuellement, un commentaire précédé d'un caractère dieze, lui-même, précédé d'un ou plusieurs caractères blancs.

Les nombres doivent être écrits en notation "point fixe", (c'est-à-dire non exponentielle).

Exemple:

 sort.clones < CLONES > CLONES-TRIES

Le fichier en entrée, le fichier des clones appelé CLONES, est trié par valeurs croissantes des débuts de clones. Il ne peut donc pas être utilisé en entrée de island. Le fichier en sortie, le fichier appelé CLONES-TRIES, sera trié par valeurs décroissantes des fins de clones et pourra donc être utilisé en entrée de island.

Premières lignes du fichier CLONES :
(Seul le commentaire précédé de # fait partie du fichier)

100000          # longueur du génome en paires de bases
320 335         <----  débuts puis fins de clones
350 365         <----     ....
425 440         <----        .... triés par débuts croissants

Premières lignes du fichier CLONES-TRIES :

100000          # longueur du génome en paires de bases
425 440         
350 365         
320 335         

Sommaire

Le shell-script sort.anchors

Fonction Syntaxe Restrictions Exemple

Fonction:

Effectuer un tri décroissant de la première colonne d'un fichier à partir de la deuxième ligne.

Syntaxe :
sort.anchors < nom-du-fichier-à-trier > nom-du-fichier-trié

Restrictions d'usage:

Le fichier en entrée doit respecter la structure suivante:
- la première ligne contient la longueur du génome en paires de bases,
- chacune des lignes suivantes comporte :

  1. la position d'une ancre,
  2. éventuellement, un commentaire précédé d'un caractère dieze, lui-même, précédé d'un ou plusieurs caractères blancs.

Les nombres doivent être écrits en notation "point fixe", (c'est-à-dire non exponentielle).

Exemple:

 sort.anchors < ANCRES > ANCRES-TRIEES

Le fichier en entrée, le fichier des ancres appelé ANCRES, est trié par valeurs croissantes des positions. Il ne peut donc pas être utilisé en entrée de island. Le fichier en sortie, le fichier appelé ANCRES-TRIEES, sera trié par valeurs décroissantes et pourra donc être utilisé en entrée de island.

Premières lignes du fichier ANCRES :
(Seul le commentaire précédé de # fait partie du fichier)

100000          # longueur du génome en paires de bases
   150          <---- positions d'ancres
   294          <----    ....
   663          <----       .... triées par valeurs croissantes

Premières lignes du fichier ANCRES-TRIEES :

100000          # longueur du génome en paires de bases
   663     
   294     
   150     

Sommaire


Dernière version : 18 juin 1998