Write us Décharger le logiciel Quoi de neuf

seq.graph
Programme de représentation graphique de séquences d'ADN et/ou de plages de régions homogènes

Mots-clés: séquence d'ADN; hétérogénéité des séquences d'ADN; graphique; annotation;
Auteurs:
SSB
Copyright

Sommaire:


Fonction
Syntaxe
Arguments obligatoires
Arguments facultatifs
Fichier de configuration
Fichier séquence
Fichier des plages
Exemples
Décharger le système
Références

Fonction :

Ce programme créé un fichier format Gif contenant une image représentant une séquence d'ADN, avec, sur option:

Remarque: Ce fichier Gif peut être visualisé en utilisant un "browser" comme Netscape ou un utilitaire comme xv.

Retour au sommaire

Les annotations dont les positions peuvent être représentées sont les suivantes:
( Les termes en fonte "typewritter" correspondent à la terminologie GenBank.)

Retour au sommaire

Les plages de régions homogènes et les probabilités associées:

Les plages sont représentées par des bandes de deux manières :

Les bornes de ces plages, ainsi que la valeur du régime correspondant, peuvent être sauvegardées dans un fichier ascii (voir l'argument -plage et l'exemple 1).

Pour chaque régime, les probabilités sont représentées par une courbe au dessus de la séquence correspondante.

Chaque régime est représenté par une couleur différente.

Retour au sommaire



Syntaxe:


seq.graph -gif fichier-format-Gif 
         [-seq fichier-format-GenBank]
         [-rhom fichier-R'HOM [-plage fichier-des-plages] ]
         [-conf[ig] fichier-de-configuration] 


Arguments obligatoires:

-gif fichier-format-Gif
chemin d'accès au fichier dans lequel sera créée l'image en format Gif (fichier en sortie).

Retour au sommaire


Arguments facultatifs:

-seq fichier-GenBank
chemin d'accès au fichier contenant la séquence en format GenBank
Cette option est nécessaire pour la représentation et l'affichage des annotations.
(fichier en entrée).

-rhom fichier-R'HOM
chemin d'accès à un fichier créé par une exécution de l'un des programmes de R'HOM sur la séquence. Ce fichier doit contenir les résultats finaux ou les résultats d'un fichier .iter.
Cette option est nécessaire pour la représentation, l'affichage et la sortie des plages.
Attention: le nombre de modalités des régimes cachés sur ce fichier doit être inférieur ou égal à 4.
(fichier en entrée).

L'une de ces deux options est obligatoire.

Retour au sommaire

-plage fichier-des-plages
chemin d'accès au fichier de description des plages.
(fichier en sortie)

Sur ce fichier, le format d'impression est le suivant:
pour chaque plage,
- l'indice de la base de début de plage,
- l'indice de la base de fin de plage,
- la valeur du régime correspondant à la probabilité maximum,
- la valeur de la probabilité minimum et maximum pour ce régime sur la plage

Retour au sommaire

-conf[ig] fichier-de-configuration
chemin d'accès à un fichier dans lequel l'utilisateur indique, à l'aide de mots-clé, ses souhaits pour gérer la présentation, (fichier en entrée).

Remarque: lorsqu'un message d'erreur signale que la transformation en format Gif de l'image n'est pas possible, modifiez les paramètres de mise-en-page à l'aide de ce fichier, l'erreur pouvant être causée par un trop grand nombre de caractères par pixel.

Sur ce fichier, les mots-clé sont tous optionnels et peuvent apparaître dans n'importe quel ordre. Chacun doit être suivi de la valeur souhaitée. Sont considérés comme commentaires tout ce qui est introduit par n'importe quel caractère non-alphanumumérique, jusqu'au reste de la ligne (voir les exemples 2 et 3 ).

Retour au sommaire

Les mots-clé reconnus sont les suivants:

Retour au sommaire

Exemples:


Remarque: les séquences utilisées dans les exemples peuvent différer de celles stockées dans la base de données GenBank.

Exemple 1: tracé des probabilités des régimes cachés et des plages associées. Un fichier des plages est créé avec l'option -plage.

seq.graph est exécuté sur la séquence du phage lambda contenue dans le fichier lambda.gbk.
La commande d'exécution est la suivante:


seq.graph -gif lambda_em_2et.gif -rhom lambda_em_2et.M0 
          -plage lambda_em_2et.M0.plage

L'image Gif est créée dans le fichier lambda_em_2et.gif

L'option -plage permet de créer le fichier des plages lambda_em_2et.M0.plage :

LAMCG  
Probabilités et plages homogènes des 2 régimes cachés. Algorithme EM, modèle M1-M0, type 0. 

Début       Fin   Régime         Petat_min   Petat_max  

1      -     18        2           0.519564    0.801946   
19     -    191        1           0.506761    0.999174   
192    -   6072        2           0.507531    0.999911   
6073   -   6250        1           0.500442    0.882146  
etc...
 
Nombre de plages: 48
Pour chacune des plages sont donnés les indices de début et de fin de plage, le régime correspondant, les probabilités minimale et maximale (Petat_min et Petat_max) de la plage.

Retour au sommaire

Exemple 2: tracé des annotations GENBANK en plus des probabilités et des plages associées, en prenant compte des valeurs du fichier de configuration fic.conf. La commande d'exécution est la suivante:


seq.graph -gif lambda_em_2et_gbk.gif 
          -rhom lambda_em_2et.M0 
          -seq lambda.gbk 
           -conf fic.conf

Le fichier de configuration fic.conf, est le suivant:
start 43000   # on dessine le graphe à partir de la base 43000
bpl  2000     # on veut 2000 bases par ligne
# Fin du fichier de configuration.

L'image Gif est créée dans le fichier lambda_em_2et_gbk.gif

Retour au sommaire

Références :

Nous remercions également Franck Samson, de l'RGV (Unité de Recherche en Génomique Végétale) de l'INRA qui a conçu un prototype à partir duquel ce travail a été réalisé.

Retour au sommaire