![]() | Décharger le logiciel | Quoi de neuf |
seq.graph
Programme de représentation graphique de séquences d'ADN et/ou de plages de régions homogènes |
---|
Mots-clés:
séquence d'ADN; hétérogénéité des séquences d'ADN;
graphique; annotation;
Auteurs: SSB
Copyright
Ce programme créé un fichier format Gif contenant une image représentant une séquence d'ADN, avec, sur option:
Remarque: Ce fichier Gif peut être visualisé en utilisant un "browser" comme Netscape ou un utilitaire comme xv.
Les annotations dont les positions peuvent être représentées sont
les suivantes:
(
Les termes en fonte
"typewritter"
correspondent à la
terminologie GenBank.)
Les bornes de ces plages, ainsi que la valeur du régime correspondant, peuvent être sauvegardées dans un fichier ascii (voir l'argument -plage et l'exemple 1).
Chaque régime est représenté par une couleur différente.
seq.graph -gif fichier-format-Gif [-seq fichier-format-GenBank] [-rhom fichier-R'HOM [-plage fichier-des-plages] ] [-conf[ig] fichier-de-configuration]
Cette option est nécessaire pour la représentation,
l'affichage et la sortie des plages.
Attention: le nombre de modalités des régimes cachés sur ce fichier
doit être inférieur ou égal à 4.
(fichier en entrée).
Remarque:
lorsqu'un message d'erreur signale que la transformation en format Gif
de l'image n'est pas possible, modifiez les paramètres de mise-en-page
à l'aide de ce fichier, l'erreur pouvant être causée par un trop
grand nombre de caractères par pixel.
Sur ce fichier, les mots-clé sont tous optionnels et peuvent apparaître
dans n'importe quel ordre.
Chacun doit être
suivi de la valeur souhaitée.
Sont considérés comme commentaires tout
ce qui est introduit par n'importe quel caractère
non-alphanumumérique, jusqu'au reste de la ligne
(voir les exemples
2 et
3 ).
Les mots-clé reconnus sont les suivants:
pour gérer la présentation générale :
start :
indice de la première base à considérer, celle-ci incluse (par défaut,
la première base de la séquence)
pour gérer la présentation des annotations,
lorsque l'option -seq est positionnée :
pour gérer la présentation des plages des régimes,
lorsque l'option -rhom est positionnée :
dessinPl :
0 si on ne veut pas représenter les plages sur le dessin;
(par défaut, 1)
pour gérer la présentation des probabilités,
lorsque l'option -rhom est positionnée :
dessinPr :
0 si on ne veut pas représenter les probabilités sur le dessin;
(par défaut, 1)
notitle : 1 si on ne veut pas de titre sur
le dessin, 0 sinon (par défaut, 0)
seq.graph est exécuté sur la séquence du phage
lambda contenue dans le fichier
lambda.gbk.
L'option -plage permet de créer le fichier des plages lambda_em_2et.M0.plage :
L'image Gif
est créée dans le fichier lambda_em_2et_gbk.gif
stop :
indice de la dernière base à considérer, celle-ci incluse (par défaut,
la dernière base de la séquence)
bpl : nombre de bases par ligne (par défaut, 10000)
nlig : nombre de lignes;
si bpl est aussi indiqué, nlig prime et bpl
est ignoré.
(la valeur par défaut est determinée automatiquement
en fonction de bpl)
width : largeur de la page, en pixels
(par défaut : 400, ce qui correspond au format A4)
title : suivi du titre voulu ,
sur une seule ligne;
cette ligne peut être la même que celle où figure le mot-clé
title ou la suivante;
ignoré si notitle=1.
(par défaut, le nom du locus lu sur le
fichier GenBank
ou, à défaut, le titre lu sur le
fichier R'HOM.
ys :
hauteur supplémentaire en pixels entre les éléments de 2 lignes successives (par défaut, 0)
ut : hauteur supplémentaire en pixels entre le titre et les éléments de la première ligne, quand il y a un titre.
(par défaut, 0)
grad : échelle de graduation des bases
(par défaut, 10 intervalles de graduation par ligne)
mx : marge à gauche en pixels (par défaut, 30)
my : marge en haut en pixels (par défaut, 10)
printF, printmRNA, printtRNA, printrRNA, printR, printCDS,
printP :
1 si l'on veut afficher sur la sortie standard la position de
chacun des différents
types d'annotations et
des plages des régimes
Exemples:
Remarque:
les séquences utilisées dans les exemples peuvent différer de celles
stockées dans la base de données GenBank.
Exemple 1: tracé des probabilités des régimes cachés et des plages associées. Un fichier des plages est créé avec l'option -plage.
La commande d'exécution est la suivante:
seq.graph -gif lambda_em_2et.gif -rhom lambda_em_2et.M0
-plage lambda_em_2et.M0.plage
L'image Gif
est créée dans le fichier lambda_em_2et.gif
LAMCG
Probabilités et plages homogènes des 2 régimes cachés. Algorithme EM, modèle M1-M0, type 0.
Début Fin Régime Petat_min Petat_max
1 - 18 2 0.519564 0.801946
19 - 191 1 0.506761 0.999174
192 - 6072 2 0.507531 0.999911
6073 - 6250 1 0.500442 0.882146
etc...
Nombre de plages: 48
Pour chacune des plages sont donnés les indices de début et de fin de plage,
le régime correspondant, les probabilités minimale et maximale
(Petat_min et Petat_max) de la plage.
Exemple 2: tracé des annotations GENBANK en plus des probabilités et
des plages associées,
en prenant compte des valeurs du
fichier de configuration
fic.conf.
La commande d'exécution est la suivante:
seq.graph -gif lambda_em_2et_gbk.gif
-rhom lambda_em_2et.M0
-seq lambda.gbk
-conf fic.conf
Le fichier de configuration fic.conf, est le suivant:
start 43000 # on dessine le graphe à partir de la base 43000
bpl 2000 # on veut 2000 bases par ligne
# Fin du fichier de configuration.
Références :
Nous remercions également
Franck Samson, de
l'RGV (Unité de Recherche en Génomique Végétale)
de l'INRA
qui a conçu un prototype à partir duquel ce travail a été réalisé.