INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('68', 'dossier', '5MILLE', 'Corpus 5MILLE: brevets extraits de Questel par Frank Legherrier. Termes candidats extraits par Syntex (7 juin 2007), Yatea (6 avril 2007) et Lingway (10 avril 2007). Validation de termes par Annick Lacombe et Adrien Canteloube (11 avril 2007)', 'RB, AK, CN', 'termino epipagri', 'important', 'Probablement des pb légaux vàv de la termino extraite par Lingway.', NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('86', '68', '17 octobre 2007', '/home/mig/rbossy/recherche/EPIPAGRI/5MILLE', 'Questel, qpat-clean, Yatea XML, syntex CSV', '4.3G', 'Probablement des pb légaux vàv de la termino extraite par Lingway.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('18', 'corpus', 'A01H/C12R', 'brevets des classes ECLA A01H et C12R', 'SA', 'nouvelle termino validée par Sandra', 'moyen', NULL, '40013, 22343 (A01H), 17670 (C12R)', 'Hack Esp@cenet A01H, C12R, non reproductible car Esp@cenet a évolué', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('1', '18', '06/08/2008', '/home/mig/rbossy/programmation/perl/hack_espacenet/DATA', 'HTML Esp@cenet, liste de Patent Number', '117Mo', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('79', '18', 'corpusA01H.ttg (19 aout 2008)', '/home/mig/saubin/recherche/projets/epipagri/donnees/corpus', 'TreeTagger', '23Mo', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('80', '18', 'corpusC12R.ttg (19 aout 2008)', '/home/mig/saubin/recherche/projets/epipagri/donnees/corpus', 'TreeTagger', '29M', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('9', 'code', 'ahocorasick', 'Implémentation de l’algo de Aho-Corasick, API.', 'RB', 'Néant, potentiellement généralisé (projection de lexique).', 'faible', NULL, '1215', 'Java 6', 'Néant', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('2', '9', 'pré-alpha', '/home/mig/rbossy/programmation/java/ahocorasick', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('10', 'code', 'alignment', 'Implémentation de l’algo de Needleman-Wunsch et Smith-Waterman, API', 'RB', 'Traitement du corpus Ingenuity afin d''isoler les parties variables.', 'faible', NULL, '1046', 'Java 6', 'documentation développeur embyonnaire', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('3', '10', 'pré-alpha', '/home/mig/rbossy/programmation/java/alignment', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('57', 'code', 'alvis2tagINIST.xslt', 'Transforme un fichier Alvis Enriched Document en un fichier xml (conforme à wholeBioNE.dtd) pour annotation par l''INIST avec Cadixe.', 'FPa', NULL, NULL, NULL, '92', 'XSLT 1.0', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('65', '57', 'derniere_version', 'topaze:/projet/mig/textemig/Production/collaborations/INIST/3iemeEnvoi/alvis2tagINIST.xslt', 'xml', NULL, 'Utilisé pour préparer les documents préannotés envoyés à l''INIST (juin 2008)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('11', 'code', 'alvis-enriched-document2ttg.xslt', 'Transforme un fichier Alvis Enriched Document en fichier Tree Tagger.', 'RB', 'généralisé, sert dans la chaîne', 'moyen', NULL, '169', 'XSLT 1 .0', 'documentation utilisateur à évaluer', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('5', '11', 'version de travail', '/home/mig/rbossy/programmation/xslt/alvis-enriched-document2ttg.xslt', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('4', '11', 'dernière version stable', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/sofware/alvis-enriched', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('12', 'code', 'Alvis GUI', 'Interface Web du moteur Alvis', 'RB', 'moteur Microbio, Epipagri', 'important', NULL, '13487', 'Java, JavaScript', 'documentation utilisateur à évaluer', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('6', '12', 'dernière version du HIIT', '/home/mig/rbossy/programmation/java/AlvisGUI-0.5.6rc-src.zip', '', '120Mo compressé', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('71', 'code', 'Asium', 'Asium.', 'CN', NULL, NULL, NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('90', '71', 'Sources', '/home/mig/rbossy/recherche/faure.tgz', 'Sources contenue dans l''archive du home de D. Faure', '462M', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('23', 'corpus', 'bacterio200', '200 résumés Medline du domaine de la bactériologie et publiés entre 1959 et 2007', 'SA', 'evaluation segmentation', 'moyen', '', '200', 'selection sur critères dans Corpus34', '', ''); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('8', '23', 'avril 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/chaine-alvis/ressources/corpus/golden_bacterio200/segmentation_phrases/bacterio200-standard/', 'texte, segmenté en phrases (2170)', '321Ko', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('7', '23', 'mars 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/chaine-alvis/ressources/corpus/golden_bacterio200/xml_original/bacterio200/', 'XML', '1.55 Mo', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('17', 'lexique', 'Bacterionto', 'ontologie bacterio/biolmol', 'CN', 'moteur de recherche Microbio', 'important', NULL, '1459 classes', 'Transcript/Yatea/Fastr', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('9', '17', 'février 2007, premier moteur Microbio', '/home/mig/rbossy/recherche/ALVIS/ONTO', 'OWL, texte, avec et sans Subtilist et/ou espèces', '355Mo', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('19', 'corpus', 'Biolcorpus', 'pages Web concernant la biologie', 'RB', 'tests, évaluations', 'important', '', '16159', 'crawl par Combine, avril 2006. Non reproductible', '', ''); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('10', '19', 'avril 2006', 'mig121:/home/mig/rbossy/local/recherche/ALVIS/CORPUS/Biolcorpus_*', 'Alvis XML, sans et avec annotations, sans et avec annotations par BioAlma', '21Go', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('36', 'corpus', 'CCRCC_mai2008', 'Corpus, établi manuellement, des documents d''intérêt de Yann Letrillard (cancer du rein chez l''Humain) ', 'RB', NULL, 'faible', NULL, '172', 'PubMed', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('41', '36', 'PreAnnote_cadixe', '/home/mig/fpapazia/production/CCRCC/Hsapiens/preannote-2iemeEnvoi/ccrcc_DTD_inist.zip', 'xml Cadixe pour INIST (wholeBioNEb.dtd)', '208K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('62', 'document', 'CdC Gestion de Brevets', 'Cahier des charges pour un site de gestion de brevets. Il ne s''agit pas du CdC original de Epipagri mais celui rédiger pour faire évoluer epipagri.org.', 'CN, RB', NULL, NULL, NULL, '18', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('75', '62', 'v3 du 8 juin 2007', '/home/mig/rbossy/recherche/EPIPAGRI/GestionBrevet-v3.doc', 'MSDOC', '140K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('76', 'dossier', 'Chaine d''annotation', 'Divers documents sur l''état de la chaine d''annotation, les solutions alternatives et les besoins de l''équipe.', 'RB, SA', 'sûrement à l''avenir...', 'important', NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('95', '76', 'version de travail', '/home/mig/rbossy/recherche/QUAERO/chaine', 'TeX, MSDOC', '632K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('47', 'code', 'createdico_BacsuSyns.sh', 'Crée le dictionnaire unitek des synonymes chez B. subtilis.', 'JJ', 'Régulier', 'Moyen', 'Le script crée 5 fichiers en sortie à partir d''un dictionnaire à double entrée des synonymes chez B. subtilis : une liste des synonymes (notée nomdefichier_list.dict), un fichier unitek, un fichier .uni et les fichiers .bin et .inf qui sont tous deux transférés vers le répertoire Dela de la chaine Alvis.', '5 (107, dépendances incluses)', 'bash, python. Dépendance = dict_list.py', 'Documentation incluse dans le code', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('55', '47', 'Version 1 - 20/11/08', 'topaze:/home/mig/jjourde/Work/Gold_synonyms/', 'script shell', '4K (+4K de dépendance)', 'Le script doit être lancé sur Topaze car il appelle des fonctions situées dans le /projet'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('32', 'code', 'createdico_GenProt', 'Scripts de génération des dictionnaires de gènes et protéines prokaryote.', 'FPa', 'Les dictionnaires produits sont utilisés par TagEN et par RENBio.', 'Moyen', NULL, NULL, 'Perl/shell', 'svn cat svn+ssh://alvis/svn/text/trunk/REORGANISATION/projets/alvis/NE_dictionaries/dico_GenProt/ReadMe.txt', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('36', '32', 'dernière version', 'svn+ssh://alvis/svn/text/trunk/REORGANISATION/projets/alvis/NE_dictionaries/dico_GenProt/', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('38', 'code', 'createdico_Human', 'Scripts de création du dictionnaire de noms de gènes Humain', 'FPa', NULL, 'faible', NULL, NULL, 'Perl/shell', 'Notes sur la constitution du dico', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('43', '38', 'dernière version', 'file:///home/mig/fpapazia/production/CCRCC/Hsapiens/dico_genes/', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('33', 'code', 'createdico_Taxon', 'Scripts de génération du dictionnaire de Taxon pour TagEN.', 'FPa', NULL, 'Moyen', NULL, NULL, 'Perl/shell', 'svn cat svn+ssh://alvis/svn/text/trunk/REORGANISATION/projets/alvis/NE_dictionaries/dico_Taxons/ReadMe.txt', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('37', '33', 'dernière version', 'svn+ssh://alvis/svn/text/trunk/REORGANISATION/projets/alvis/NE_dictionaries/dico_Taxons/', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('60', 'autre', 'css_CadixeINIST', 'CSS des fichiers Cadixe pour annotation par l''INIST', 'FPa', NULL, NULL, NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('71', '60', 'version_etendue', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/config_cadixe/style-associe-au-schema5084/downloadFile/file/wholeBioNE.css', NULL, NULL, 'permet d''annoter formes courtes (proper) et formes longues (noms communs)'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('72', '60', 'version_initiale', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/config_cadixe/style-associe-au-schema/downloadFile/file/shortBioNE.css', NULL, NULL, 'permet d''annoter les formes courtes uniquement (proper)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('52', 'code', 'Dash tools', 'Outils pour: - mettre les termes sous leur forme canonique vis à vis des variations typo - calculer toutes les variations typo d''un terme', 'RB', 'Mise en forme des ressources pour annotation. Probablement rendus obsolètes par Mask.', 'faible', 'Voir Dashvar.', '73', 'Perl 5.8.5', 'Non', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('61', '52', '19 février 2007', '/home/mig/rbossy/recherche/ALVIS/TERMINO/terms_dash/scripts/dashtools.zip', NULL, NULL, 'Voir Dashvar.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('50', 'lexique', 'Dashvar', 'Variations typographiques de termes, en particulier tiret/espace/vide.', 'CN', 'BioAlvis, potentiellement généralisé en étiquetage termino.', 'important', NULL, '5252', 'Dérivation manuelle de la termino BioAlvis.', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('58', '50', '10 octobre 2007', '/home/mig/rbossy/recherche/ALVIS/TERMINO/terms_dash/terms_canon_head_vars-revisedCN.txt', '1 forme canonique / ligne', '200K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('39', 'lexique', 'dico_B.subtilis', 'Table de correspondance des noms de gènes de B.subtilis (établie manuellement par Elodie Marchadier et Anne Goelzer)', 'EM, AG', NULL, 'Important', NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('44', '39', 'dernière version', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/dico-b-subtilis/table-correspondance/downloadFile/file/TABCORRES.txt', 'texte tabulé', NULL, 'Dans l''ordre des colonnes : Ordered Locus Name, Uniprot Gene Name, Subtlist Accession Number, puis liste des synonymes actuels et/ou noms antérieurs au renomage.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('45', 'lexique', 'dico couples synonymes', 'Dictionnaire des couples de synonymes chez B. subtilis construit à partir d''un Gold de ces synonymes.', 'JJ', 'Référence', 'Moyen', 'Chaque couple est construit en associant un nom de gène actuel (col#2 du Gold) à l''un de ses synonymes (col#4 et +).', '1', 'Gold synonymes', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('52', '45', 'Version 1 - 03/10/08', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/dico-b-subtilis/dico-couples-synonymes/', 'texte tabulé', '12K', 'Construit en même temps que le Gold version 1'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('53', '45', 'Version 2 - 12/11/08', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/dico-b-subtilis/dico-couples-synonymes6124/', 'texte tabulé', '16K', 'Construit à partir du Gold version 2'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('72', 'document', 'Dossier Lucene', 'Document support sur l''évaluation de Lucene accompagné de quelques articles IR.', 'RB', NULL, 'moyen', NULL, '5', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('91', '72', 'version de travail', '/home/mig/rbossy/recherche/INDEXATION', 'TeX, PDF', '8.9M', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('58', 'autre', 'dtd_CadixeINIST', 'DTD des fichiers Cadixe pour annotation par l''INIST ', 'FPa', NULL, NULL, NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('68', '58', 'version_etendue', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/config_cadixe/schema-d-annotation8971/downloadFile/file/wholeBioNE.dtd', 'dtd', NULL, 'permet d''annoter formes courtes (proper) et formes longues (noms communs)'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('70', '58', 'version_initiale', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/config_cadixe/schema-d-annotation/downloadFile/file/shortBioNE.dtd', NULL, NULL, 'permet d''annoter les formes courtes uniquement (proper)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('48', 'autre', 'enriched-document.xsd', 'Schéma pour les fichiers Alvis Enriched Document.', 'RB', 'Généralisé', 'important', NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('56', '48', '1.6 valide les documents en entrée et sortie de chaine', '/home/mig/rbossy/recherche/ALVIS/enriched-document.xsd', 'XML Schema Definition', NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('91', 'code', 'extractRels.pl', 'extraction de relations syntaxiques d''un texte: lance les outils de segmentation, normalisation, étiquetage MS, lemmatisation, analyse syntaxique, abstraction des relations', 'SA', 'ExtraPloDocs, Challenge (?)', 'élevé', NULL, '133', 'Perl, outils TAL', 'README, rapports extraplodocs', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('105', '91', '21 février 2005', '/home/mig/saubin/ancien/sauvegarde/Challenge/ExtractRel.V3.1_Challenge_bis/extractRels.pl', 'Perl', NULL, 'les dates correspondent au Challenge LLL mais je ne peux pas certifier qu''il a été utilisé alors'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('46', 'code', 'generateDico.pl', 'Génère un dictionnaire de couples de synonymes à partir d''un Gold de ces synonymes chez B. subtilis', 'JJ', 'Régulier', 'Faible', 'Le tout premier dictionnaire est généré en même temps que le premier Gold parle script makegold.sh ; generateDico.pl génère les versions suivantes à partir des nouveaux Golds révisés à la main.', '102', 'perl', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('54', '46', 'Version 1 - Ocotbre 2008', 'topaze:/home/mig/jjourde/Work/Gold_synonyms/', 'script perl', '4K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('92', 'code', 'getLemma.pl', 'Reconstitue le corpus en formes fléchies et en formes lemmatisées à partir d''un fichier au format TreeTagger', 'SA', 'ExtraPloDocs, Challenge (?)', 'moyen', NULL, '326', 'Perl', 'README, manuelExtracteurRel', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('30', 'code', 'getPatentFromEspacenet.pl', 'script permettant de télécharger les brevets depuis EspaceNet (WebService) et de sélectionner les plus adaptés pour la constitution du corpus pour la termino (règles basées sur les priorités des codes pays, et la présence des abstract et claims en Anglais)', 'FPa, RB', 'Constitution des corpus pour les Termino des classes A01H et C12R (Aout 2008). ', 'Moyen', 'La liste des brevet de tête associés à une catégorie EPC doit avoir été constituée au préalable (ordonnée par priorité des codes pays)', '770', 'Perl', 'Mode opératoire général pour constituer un corpus', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('35', '30', 'aout2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/brevets/corpus/agrobiotech/scripts_constitution_cor/script-telechargement/downloadFile/file/getPatentFromEspacenet.pl', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('67', '30', '29 novembre 2007', '/home/mig/rbossy/recherche/EPIPAGRI/CdC FIST Lingway/epipagriSS/ops', NULL, NULL, 'Version plus ancienne, peut-être plus générique vav de OPS'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('31', 'code', 'getTitleAbstractClaimsFromQPat.xslt', 'Feuille XSLT permettant d''extraire depuis les fichiers de brevet XML les champs texte utilisé pour construire le corpus de termino (Titre, Abstract, claims)', 'FPa, RB', NULL, 'faible', NULL, '26', 'XSLT 1.0', 'Mode opératoire général pour constituer un corpus', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('34', '31', 'aout2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/brevets/corpus/agrobiotech/scripts_constitution_cor/feuille-d-extraction/downloadFile/file/getTitleAbstractClaimsFromQPat.xslt', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('41', 'lexique', 'Gold synonymes B. subtilis', 'Version Gold de la synonymie chez B. subtilis. Fusion des données de BSORF et de la table de correspondance d''Anne et Elodie (EloAnn).', 'JJ, EM, AG', 'Référence', 'Important', 'Après fusion des données pour la première version, les versions suivantes sont issues d''une correction à la main effectuée par Julien Jourde. Les versions du Gold s''accompagnent de leurs fichiers d''erreurs et de logs. Description du format : col#1 : code BSU col#2 : nom de gène actuel col#3 : code BG col. suivantes : liste des synonymes actuels et/ou noms antérieurs au renommage.', '1', 'Table EloAnn, BSORF', 'Création et suivi des modifications dans le rapport construction_gold_Bacsu.sxw', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('45', '41', 'Version 1 - 03/10/08', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/dico-b-subtilis/gold-synonymes-b/', 'texte tabulé', '92K', 'Issus de la fusion automatique par le script generateGold_Bacsu.pl Les versions du Gold s''accompagnent de leurs fichiers d''erreurs et de logs.'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('46', '41', 'Version 2 - 12/11/08', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/dico-b-subtilis/gold-synonymes-b5449/', 'texte tabulé', '100K', 'Correction manuelle de 209 variations par rapport à la version 1 Les versions du Gold s''accompagnent de leurs fichiers d''erreurs et de logs.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('69', 'autre', 'grapheUnitex_INIST', 'graphe Unitex (pour TagEN) utilisé pour la préannotation des documents destinés à l''INIST', 'FPa', NULL, NULL, NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('87', '69', 'version_juin2008', '/projet/mig/rbossy/alvis_test/NLP/tools/TagEN/unitex/English/Graphs/bio_inist2.grf', 'graphe unitex', NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('43', 'document', 'Guidelines Cadixe', 'Guidelines produits pour l''annotation manuelle par l''équipe du l''INIST.', 'FPa, JJ, AL', 'Généralisé', 'Important', 'Les guidelines sont révisés régulièrement. Chaque version est archivée.', '10', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('50', '43', 'Version 4', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/package-inist/guidelines-version-4/cpsdocument_view?portal_status_message=psm_content_created', 'doc (Microsoft Office)', '92.5K', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('48', '43', 'Version 5', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/package-inist/guidelines-version-5/', 'doc (Microsoft Office)', '107K', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('49', '43', 'Version 6 - Octobre 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/package-inist/guidelines-v4/', 'doc (Microsoft Office)', '113K', 'Corrections apportées par Julien Jourde'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('13', 'code', 'Hack Esp@cenet', 'Requête l''IHM d''esp@cenet avec une classe ECLA et récupère les pages HTML réponses.', 'RB', 'Création corpus A01H/C12R, fonctionne pour n''importe quelle classe ECLA', 'important', NULL, '402', 'Perl 5.8.5', 'documentation utilisateur', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('11', '13', 'version de travail', '/home/mig/rbossy/programmation/perl/hack_espacenet', '', '', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('12', '13', 'dernière version stable', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/sofware/hack-espacenet', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('25', 'corpus', 'INIST_juin2008', 'Destiné à être le nouveau corpus d''apprentissage de RENBio (= corpus bacterio plus représentatif que le corpus RENBio d''origine) ', 'FPa, JJ', 'Pas encore utilisé (nov2008, en cours d''annotation par l''INIST)', 'Important', 'sélection au hasard dans le corpus "Microbio (v1)", avec contrôle que les résumés ne contiennent que des citations de taxon prokaryote.', '500', 'Microbio (v1)', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('25', '25', 'PreAnnote_aed', 'topaze:/projet/mig/textemig/Production/Quareo_deliverable/CorpusINIST_preAnnotated_aed.tar.gz', 'alvis-enriched-document', '8.2M', 'documents préannotés par projection de dictionnaire gene+prot/taxons prokaryote/taxons eukaryote'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('24', '25', 'Brut', 'topaze:/projet/mig/textemig/Production/Quareo_deliverable/CorpusINIST_Raw.xml.gz', 'xml PubMed', '520K', 'documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('26', '25', 'PreAnnote_cadixe', 'topaze:/projet/mig/textemig/Production/collaborations/INIST/3iemeEnvoi/documents_B.zip', 'xml Cadixe pour INIST (wholeBioNE.dtd)', '584K', 'documents préannotés envoyés à l''INIST (24/06/2008)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('73', 'document', 'ISO 704:2000', 'Review of Content Standard ISO 704:2000. Terminology work -- Principles and methods.', 'SA, FP, RB', 'IHM validation termino?', '?', 'ressource non MIG', '8', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('92', '73', 'Jan 2008', '/home/mig/rbossy/recherche/ISO704.doc', 'MSDOC', '60K', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('74', 'dossier', 'jaze', 'Home de Jérôme Azé.', 'CN, RB', NULL, NULL, NULL, NULL, NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('93', '74', 'déc 2006', '/home/mig/rbossy/recherche/jaze-2006-12-04.tar.bz2', NULL, '3.2G compressé', 'beacoup d''espace pour rien (.mozilla)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('75', 'code', 'lp2lp', 'Transforme les étiquettes d''une analyse de LGP (jeu LGP -> jeu Sophie).', 'SA, RB', 'généralisé', 'important', NULL, '1356', 'GNU prolog', 'non', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('94', '75', '26 nov 2006', '/home/mig/rbossy/recherche/lp2lp/lp2lp', NULL, NULL, 'sources difficilement compilables.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('44', 'code', 'makegold.sh', 'Script shell générant un Gold des synonymes chez B. subtilis et un dictionnaire des couples de ces synonymes.', 'JJ', 'Unique', 'Important', 'Le script est court mais appelle 2 autres scripts. Il génère un Gold des synonymes en fusionant les données de BSORF et de la table EloAnn. Il génère aussi un fichier d''erreurs, un fichier de logs et un dictionnaire des couples de synonymes.', '7 (353, dépendances incluses)', 'bash, perl. Dépendances = bsorf_eloann_parser.pl et generateGold_Bacsu.pl (même répertoire)', 'Documentation incluse dans le code', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('51', '44', 'Version 1 - Ocotbre 2008', 'topaze:/home/mig/jjourde/Work/Gold_synonyms/', 'script shell', '4K (+12K de dépendance)', 'chemins relatifs. Le script doit être lancé dans le même répertoire que ses dépendances'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('56', 'code', 'makeUnitexV2Dictionaries.sh', 'transformation de listes de mots (.txt) en dictionnaires Unitex (unitex V 2.0): dic, bin, inf, anti', 'SA', 'Les dictionnaires produits sont utilisés par tagen ou unitex', 'faible', NULL, '123', 'bash', 'minimale, incluse dans le code', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('73', '56', 'novembre 2008', '/home/mig/saubin/recherche/outils/unitex/', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('14', 'code', 'Mask', 'API et CLI de search/replace.', 'RB', 'Corpus Ingenuity, potentiellement généralisé.', 'faible', NULL, '180', 'Perl 5.8.5', 'documentation utilisateur à évaluer', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('13', '14', 'version de travail', '/home/mig/rbossy/programmation/perl/mask', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('26', 'corpus', 'Microbio (v1)', 'Collection de tous les documents relatifs à la microbiologie (fin janvier 2007)', 'AK', 'multiple', 'Important', 'A priori non-reproductible : PubMed s''est enrichi depuis, le filtre Bayesien utilisé pour le filtrage est une boite noire.', '322 998', 'PubMed', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('27', '26', 'Brut', 'topaze:/projet/mig/textemig/Production/Quareo_deliverable/AllPubmedMicrobio_200701_Raw.xml.gz', 'xml PubMed', '272M', 'documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('33', '26', 'PreAnnote_aed', 'topaze:/projet/mig/textemig/Production/alvis/fpaTest/???.tar.gz', 'alvis-enriched-document ', '5.82G', 'documents préannotés par projection de dictionnaire gene+prot/taxons prokaryote/taxons eukaryote Utilisé pour préparer le corpus INIST (juin2008)'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('20', 'corpus', 'MicroMedLine', 'abstracts MedLine (concernant Bsub ?)', 'RB', 'néant', 'faible', '', '20692', 'Requête PubMed. Non reproductible.', '', ''); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('14', '20', 'juin 2006', 'mig121:/home/mig/rbossy/local/recherche/ALVIS/CORPUS/MicroMedLine', 'Alvis XML, sans et avec annotations, texte brut', '3.6Go', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('90', 'code', 'normalizeMedlineForLP.pl', 'normalisation des textes de résumés Medline pour leur traitement par Link Parser', 'SA', 'ExtraPloDocs, Challenge (?)', 'élevé', 'Il existe de nombreuses versions de ce script, parfois intégré à la segmentation en phrases', '432', 'Perl', 'dans le code', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('104', '90', '21 février 2005', '/home/mig/saubin/ancien/sauvegarde/Challenge/ExtractRel.V3.1_Challenge_bis/normalizeMedlineForLP.pl', 'Perl', '16K', 'les dates correspondent au Challenge LLL mais je ne peux pas certifier qu''il a été utilisé alors'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('64', 'document', 'Open Patent Services Description', 'Description des Services Web de OPS.', 'RB', 'getPatentFromEspacenet.pl', 'nul', 'Ressource non bibliome mais ce document est un peu "caché".', '23', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('78', '64', '17 juillet 2008', '/home/mig/rbossy/recherche/EPIPAGRI/OpenPatentServices_description.pdf', 'PDF', '228K', 'Ressource non bibliome mais ce document est un peu '); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('77', 'document', 'Précis de Terminologie', '(à conseiller au terminologue débutant) Source : Direction de la terminologie et de la normalisation - Canada', '(ressource externe)', NULL, NULL, NULL, '153', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('96', '77', 'v2001', 'topaze:/projet/mig/textemig/Recherche/Termino/InterfaceValidation/standards/precis-termino-fra.pdf', 'pdf', NULL, 'Document en ligne sur le site du bureau de la traduction - Canada'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('65', 'corpus', 'QPAT', 'Brevets des partenaires Epipagri fin mars 2007.', 'RB, CN', 'epipagri.org, termino brevets.', 'important', 'ressource non Bibliome mais investissement de mise en forme.', '814, non apllicable', 'Projet Epipagri', 'Voir rapports Epipagri', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('81', '65', 'avril 2007', '/home/mig/rbossy/recherche/EPIPAGRI/QPAT/QPAT.tar.bz2', 'XML Questel, qpat-clean (DTD incluse)', '4M', 'ressource non Bibliome mais investissement de mise en forme.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('67', 'code', 'Questel format', 'Scripts pour explorer des documents au format Questel.', 'RB', 'Mise en forme du corpus QPAT. Aucun usage anticipé.', 'moyen', NULL, '296', 'XSLT 1.0', 'non', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('82', '67', 'version de travail', '/home/mig/rbossy/recherche/EPIPAGRI/QPAT/scripts', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('42', 'document', 'Rapport Construction Gold des synonymes', 'Rapport de travail sur la construction du Gold des synonymes chez B. subtilis et le suivi des versions.', 'JJ', 'Limité, ciblé', 'Faible', NULL, '4', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('47', '42', 'Novembre 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/doc/rapport-travail-sur6775/', 'sxw (Open Office)', '16K', 'Dernière mise à jour le 19/11/2008'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('37', 'document', 'Rapport Renommage EN', 'Rapport de travail sur le renommage des gènes et des protéines chez B. subtilis.', 'JJ', 'Limité, ciblé', 'Important', 'Le rapport porte sur le travail mené par Julien Jourde de septembre 2008 à novembre 2008. Il présente les méthodes expérimentales et les résultats obtenus pour la partie évaluation et la partie recherche de renommages inconnus.', '31', NULL, NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('42', '37', 'Novembre 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/quaero/collaboration_inist/doc/rapport-travail-sur/', 'PDF', '1.5M', 'Dernière mise à jour le 24/11/2008.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('70', 'code', 'RENBio', 'Code source des programmes de "Reconnaissance d''Entités Nommées pour la Biologie".', 'RB, FPa', NULL, 'Important', NULL, NULL, 'C ansi, XSLT 1.0, libXML2, PCRE, Trish', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('88', '70', 'version Alvis+contributions FPa (mars-juillet2008)', ' svn co -r2321 svn+ssh://alvis/svn/text/trunk/REORGANISATION/projets/alvis/RenBio/trunk', NULL, NULL, 'revision 2321'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('27', 'corpus', 'RENBio_training', 'Corpus d''apprentissage de RENBio (projet Alvis, janvier 2007). Sélection manuelle de résumés relatif à B. subtilis, la transcription et la sporulation. ', 'CN, RB, FPa', 'Entrainement du classifieur de RENBio', 'Important', 'Annotation manuelle x2, réalisé collaborativement par divers memebres de MIG, re-validé par AK.', '423', 'Transcript', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('28', '27', 'Brut', 'topaze:/projet/mig/textemig/Production/Quareo_deliverable/CorpusRenBio_Raw.xml.gz', 'xml PubMed', '432K', 'documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('29', '27', 'Annote', 'topaze:/projet/mig/textemig/Production/Quareo_deliverable/CorpusRenBio_Annotated_aed.tar.gz', 'alvis-enriched-document', '6.7M', 'Golden standard, Annoté manuellement'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('28', 'corpus', 'Renommage', 'Abstracts MedLine (concernant les renommages chez B. subtilis)', 'JJ', 'Limité, ciblé', 'Moyen', 'Textes issus du corpus de 322 000 textes sur Bacillus subtilis. ', '192', 'Microbio (v1), PubMed', 'Construction détaillée dans le rapport synonymie_renommage', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('30', '28', 'Brut septembre 2008', 'topaze:/home/mig/jjourde/Corpus/corpus_renommage.v2.xml', 'xml PubMed', '1.6M', 'Documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('31', '28', 'PréAnnoté septembre 2008', 'topaze:/projet/mig/rbossy/alvis_test/jj_renommage/', 'alvis-enriched-document, text', '36M', 'Documents préannotés seulement jusqu''à l''outil TagEN de la chaine Alvis.'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('32', '28', 'PréAnnoté_cadixe septembre 2008', 'topaze:/home/mig/jjourde/Work/Renommage/Bacsu/', 'xml Cadixe (manual-ne-tag)', '788K', 'Documents préannotés convertis au format cadixe'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('1', 'code', 'ressources', 'Service de saisie pour l''inventaire des ressources de l''équipe bibliome.', 'RB', 'fin 2008, recensement des ressources pour le passage à la nouvelle architecture matérielle', 'moyen', NULL, '698', 'HTML, SQL (postgresql), perl, CGI, DBI, DBD::Pg, HTML::Templates', 'Aucune', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('23', '1', 'Version en production', 'http://genome.jouy.inra.fr/texte/ressources/ressources.pl', NULL, NULL, 'Sources: /htdocs/texte/ressources'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('89', 'code', 'segmentationMedline', 'script de segmentation en phrases des résumés Medline', 'SA', 'voir description', 'élevé', 'Il existe de nombreuses versions de ce script (parfois intégré avec la normalisation)', '1030', 'Perl', 'dans le code', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('103', '89', '21 février 2005', '/home/mig/saubin/ancien/sauvegarde/Challenge/ExtractRel.V3.1_Challenge_bis/segmentation.pl', 'perl', '40Ko', 'les dates concordent avec le Challenge LLL mais je ne peux aps certifier que c''est ce script qui a été utilisé'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('87', 'lexique', 'Terminologie A01H/C12R', 'Terminologie extraite des corpus A01H/C12R (brevets des classes ECLA)', 'SM, SA ', NULL, 'moyen', 'En cours de validation', '85466(A01H), 124885(C12R)', 'Yatea. (Validation manuelle)', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('99', '87', 'candidates_A01H_p1 (14 août 2008)', '/home/mig/smakuntima/termino/validation_aout/candidates_A01H_with_yet_validated-14-08-08_clean_merged_p1_ok.csv', 'CSV', '6.5 Mo', 'En cours de validation'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('100', '87', 'candidates_A01H_p2 (14 août 2008)', '/home/mig/smakuntima/termino/validation_aout/candidates_A01H_with_yet_validated-14-08-08_clean_merged_p2_ok.csv', 'CSV', '2 Mo', 'En cours de validation'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('101', '87', 'candidates_C12R_p1 (14 août 2008)', '/home/mig/smakuntima/termino/validation_aout/candidates_C12R_with_yet_validated-14-08-08_clean_merged_p1_ok.csv', 'CSV', '5.7 Mo', 'En cours de validation'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('102', '87', 'candidates_C12R_p2 (14 août 2008)', '/home/mig/smakuntima/termino/validation_aout/candidates_C12R_with_yet_validated-14-08-08_clean_merged_p2_ok.csv', 'CSV', '6 Mo', 'En cours de validation'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('53', 'lexique', 'Termino Transcript', 'Terminologie extraite de transcript et validée.', 'AK, CN', 'BioAlvis', 'important', '# d''items à revoir selon les versions.', '71952', 'Yatea sur transcript. Validation manuelle.', 'Non', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('62', '53', '26 juin 2006', '/home/mig/rbossy/recherche/ALVIS/TERMINO/yatea/termino_transcript.tar.bz2', 'Sortie Yatea XML et HTML. Validation par AK tabulé.', '5.5M', '# d''items à revoir selon les versions.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('88', 'lexique', 'termino_transcript_ASN', 'résultat du test comparatif des 3 extracteurs de termes Acabit, Syntex et Nomino. Extraction du corpus transcript, validation des termes d''occurrences >20', 'SA', 'Caderige: sélection d''un outil d''extraction de termes', 'moyen', NULL, '515 termes validés par Philippe', 'corpus transcript', 'incluse a l''archive: README + rapport', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('98', '88', 'juillet 2003', '/home/mig/saubin/ancien/sauvegarde/sauvegardeMIG/termino/termino_transcript_ASN.tar.gz', 'archive', '220Ko', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('61', 'code', 'term_list_filter.pl', 'supprime les candidats termes non valides a priori dans un fichier tabulé .csv', 'SA', 'nettoyage des listes de termes produits par YaTeA dans epipagri', 'moyen', NULL, '215', 'perl ', 'README', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('74', '61', '22 juillet 2008', '/home/mig/saubin/recherche/projets/epipagri/programmation', NULL, NULL, 'voir fichier config associé .rc'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('63', 'code', 'term_list_uniq.pl', 'fusionne les candidats termes ayant une forme de surface identique dans un fichier tabulé (.csv)', 'SA', 'nettoyage des listes de termes produits par YateA dans epipagri', 'moyen', NULL, '318', 'perl', 'README', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('77', '63', '22 juillet 2008', '/home/mig/saubin/recherche/projets/epipagri/programmation', NULL, NULL, 'voir fichier de config associé .rc'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('51', 'code', 'terms_txt2dict.pl', 'Lit un fichier de termino au format une forme canonique par ligne et le transforme au format une paire formes surface/canonique par ligne.', 'RB', 'Fréquent dans la mise en forme des ressources.', 'faible', NULL, '27', 'Perl 5.8.5, Getopt::Long', 'mini', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('59', '51', '19 février 2007', '/home/mig/rbossy/recherche/ALVIS/TERMINO/terms_dash/scripts/terms_txt2dict.pl', NULL, NULL, NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('21', 'corpus', 'Transcript', 'abstracts MedLine (concernant la transcription chez Bsub)', 'CN', 'généralisé', 'important', '', '2397', 'Requête PubMed. Non reproductible.', '', ''); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('15', '21', 'mai 2006', 'mig121:/home/mig/rbossy/local/recherche/ALVIS/CORPUS/transcript', 'Alvis XML, sans et avec annotations, texte brut', '860Mo', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('16', '21', 'décembre 2006', '/home/mig/rbossy/recherche/ALVIS/CORPUS/transcript_relp', 'relp et entrée Asium', '520Mo', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('22', 'corpus', 'Transcript Small', 'abstracts MedLine (concernant la transcription et la sporulation chez Bsub)', 'RB', 'faible (requêtes envoyées à IndexData)', 'moyen', '', '162', 'Requête PubMed. Reproductible.', '', ''); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('17', '22', 'février 2006', 'mig121:/home/mig/rbossy/local/recherche/ALVIS/CORPUS/transcript_small', 'Alvis XML, sans et avec annotations, texte brut, MedLine', '148Mo', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('29', 'corpus', 'Unknown_Renommage', 'Abstracts MedLine (concernant d''hypothétiques renommages inconnus chez B. subtilis)', 'JJ, PB', 'limité, ciblé', 'Faible', 'Textes contenant 870 gènes sans synonymes connus chez B. subtilis.', '875', 'PubMed', 'Construction détaillée dans le rapport synonymie_renommage', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('38', '29', 'Brut (1) Octobre 2008', 'topaze:/home/mig/jjourde/Corpus/single_unknown_syns_Bacsu.xml', 'xml PubMed', '7.4M', 'Documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('39', '29', 'Brut (2) Octobre 2008', 'topaze:/home/mig/jjourde/Corpus/single_unknown_syns_Bacsu.txt', 'text PubMed', '1.4M', 'Documents bruts de PubMed'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('40', '29', 'PréAnnoté octobre 2008', 'topaze:/projet/mig/rbossy/alvis_test/jj_unknown_Bacsu_syns/', 'alvis-enriched-document, text', '156M', 'Documents préannotés seulement jusqu''à l''outil TagEN de la chaine Alvis.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('66', 'corpus', 'update_07_07_2008', 'Corpus d''update de la base Epipagri du 7 juillet 2008', 'RB', 'maj de la base, extraction de nouveaux termes par YaTeA', 'important', NULL, '386', 'esp@cenet', ' Séquence de sélection et d''extraction terminologique ', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('83', '66', 'XML - 7 juillet 2008', '/home/mig/saubin/recherche/projets/epipagri/donnees/corpus', 'XML (qp-assembled)', '3.0M', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('85', '66', 'TTG - 3 septembre 2008', '/home/mig/saubin/recherche/projets/epipagri/donnees/corpus', 'TreeTagger', '742K', 'sans les 2 brevets hors domaine (inseres par erreur lors tests dev)'); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('84', '66', 'TTG - 22 juillet 2008', '/home/mig/saubin/recherche/projets/epipagri/donnees/corpus', 'TreeTagger', '797Ko', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('78', 'lexique', 'Update_Epipagri_07_07_2008', 'Terminologie extraite à partir des nouveaux brevets de la base Epipagri.Terminologie validée.', 'SM, SA ', 'Epipagri', 'moyen', NULL, '4796', 'Yatea. Validation manuelle', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('97', '78', 'juillet 2008', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/brevets/terminologie/extraction-incrementale/update_07_07_2008/termino/update_epipagri_08_07_20/', 'XLS', '1,03Mo', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('15', 'code', 'xsltrans', 'Moteur XSLT, CLI, plus pratique que xsltproc en ce qui concerne les params.', 'RB', 'faible, potentiellement généralisé', 'faible', NULL, '128', 'C, gcc 3.4.6, libxml2 2.6.16, libxslt 1.1.11', 'néant', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('18', '15', 'dernière version stable', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/sofware/xsltrans', '', '', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('19', '15', 'version de travail', '/home/mig/rbossy/programmation/c/xsltrans', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('49', 'lexique', 'XXX termes_valides_1.txt', 'Indiqué comme Termes extraits par syntex validés par Philippe B. (8 avril 2003) 2006-06-27: probablement termes générés par A Lelu à partir de SwissProt validés par JF Gibrat (2004?) ', 'RB, PB?', '?', '?', 'à renommer. Cette termino semble très ancienne.', '29708', '?', 'Non', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('57', '49', '?', '/home/mig/rbossy/recherche/ALVIS/TERMINO/termes_valides_1.txt', '1 terme / ligne', '1.2M', 'à renommer. Cette termino semble très ancienne.'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('16', 'code', 'yatea2tab.xslt', 'Transforme une sortie yatea XML en fichier tabulé.', 'RB', 'généralisé', 'moyen', NULL, '47', 'XSLT 1 .0', 'documentation utilisateur à évaluer', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('20', '16', 'dernière version stable', 'https://kosto.jouy.inra.fr/psi/workspaces/mia/mig/texte/sofware/yatea2tab', '', '', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('21', '16', 'version de travail', '/home/mig/rbossy/programmation/xslt/yatea2tab.xslt', '', '', NULL); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('54', 'code', 'yatea2tbx.xslt', 'Transforme une sortie yatea xml en fichier xml compatible TBX 2.0 (ATTENTION : ne respecte pas toutes les XCS par défaut de TBX)', 'FPa', NULL, NULL, 'Ne respecte pas toutes les XCS par défaut de TBX. (introduction de nouvelles valeurs dans les datacategory pour exprimer l''analyse syntaxique notamment).', '162', 'XSLT 1.0', NULL, NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('63', '54', 'version_test', 'topaze:/projet/mig/textemig/Recherche/Termino/InterfaceValidation/scripts/YaTeA2TBX.xslt', 'xml', NULL, '1er essai de représentation de la sortie Yatea sous le format TBX'); INSERT INTO ressources (id, type, nom, description, contact, usage, investissement, commentaire, champ1, champ2, champ3, champ4) VALUES ('55', 'code', 'yatea-sort.xslt', 'Trie les candidats termes yatea par nb d''occurrences.', 'RB', 'Préparation Termino Transcript.', 'faible', NULL, '39', 'XSLT 1.0', 'mini', NULL); INSERT INTO versions (verid, ressource, version, localisation, format, disque, commentaire) VALUES ('64', '55', 'version de travail', '/home/mig/rbossy/programmation/xslt/yatea-sort.xslt', NULL, NULL, NULL);