- Résumé
-
INTEX et NooJ sont des environnements de développement linguistique utilisés comme outils de formalisation des langues naturelles, comme outils d'analyse de corpus, et aussi comme outils de développement d'applications de Traitement Automatique des Langues Naturelles (TALN).
Depuis 1993, s'est développée une véritable communauté d'utilisateurs qui partagent les mêmes préoccupations scientifiques et techniques, suivent une même méthodologie, et mettent en commun leurs outils et ressources linguistiques. A ce jour, une quinzaine de langues disposent de modules INTEX et NooJ, et plusieurs sites Internet, ainsi qu'un forum électronique, fédèrent cette communauté. Les thématiques qui se dégagent de ce numéro portent sur (1) la constitution de ressources linguistiques, (2) l'utilisation de corpus techniques, scientifiques ou journalistiques pour analyser et caractériser leur vocabulaire ou en extraire des noms propres, et (3) l'analyse syntaxique, avec une étude sur la levée d'ambiguïtés, l'implémentation d'un analyseur syntaxique du hongrois et la classification syntaxique des phrases d'un texte littéraire. (4)
Le numéro conclut enfin avec une discussion sur trois applications de TALN « non NooJ » mais qui présentent un intérêt critique pour l'analyse automatique, et proposent de nouvelles voies d'exploration en Linguistique : un logiciel d'analyse de corpus, le WEB sémantique et la traduction automatique. - Sommaire
-
Introduction
1. INTEX et Nooj pour la Linguistique et le Traitement Automatique des Langues
Svetla Koeva, Denis Maurel, Max Silberztein
2. Nooj's Linguistic Annotation Engine
Max Silberztein
PREMIÈRE PARTIE : FORMALISATION DES RESSOURCES LINGUISTIQUES
3. Les adverbes dans les bulletins météorologiques allemands : description par automates
Manuel Fuchs, Dieter Seelbach
4. La lemmatisation de l'arménien occidental avec Nooj
Anaïd Donabedian, Nisan Boyacioglu
5. Le traitement des verbes à particules du chiac à partir d'un DELAS / DELAF
Michael Long, Gisèle Chevalier
6. Macro- ou micro-structure ? Elargir la couverture d'un dictionnaire électronique à partir de sa microstructure
Xavier Blanco, Angels Catena, Sandrine Fuentes
7. Un dictionnaire INTEX de noms de professions : quels féminins possibles ?
Marie-Aimée Gazeau, Denis Maurel
8. Hungarian Morphology in INTEX / Nooj
Tamis Varad1, Péter Vajda, Viktor Nagy
9. Morphological PROCESSING OF Nouns in Macedonian
Aleksandar Petrovski
10. Portuguese morphology with INTEX 4.33
Cristina Mota
11. Extending the Serbian E-dictionary by using lexical transducers
Cvetana Krstev, Dusko Vitas
DEUXIÈME PARTIE : ANALYSE DE CORPUS
12. Constructions de ressources terminologiques en santé
Aurélie Névéol, Magaly Douyère, Alexandrina Rogozan, Stéfan Darmoni
13. Modélisation linguistique et annotation des collocations : une application au lexique transdisciplinaire des écrits scientifiques
Agnès Tutin
14. Une leçon méthodologique en histoire de la médecine: l'application du système INTEX au texte « Recherches physiologiques sur la vie et la mort » de Xavier Bichat
Lucia Di Palo
15. Using INTEX to build and verify « taxonomie territories » historically determined : the language of neurology and J.-M. Charcot
Liborio Dibattista
16. Automatic Construction of a Thesaurus of Proper Names : A Local Grammar-based Approach
Hayssam Traboulsi, Khurshid Ahmad
17. Extraction of named entities in Serbian using INTEX
Dusko Vitas, Gordana Pavlovic-Lazetic
TROISIÈME PARTIE : ANALYSE SYNTAXIQUE
18. Mapping, filtering and measuring impact of ambiguous words in Portuguese
Jorge Baptista, Luis Faisca
19. Word Sense Disambiguation for Purposes of Machine Translation – the nature of Bulgarian clitics
Svetla Koeva, Svetlozara Lesseva
20. Syntaxic Parsing and Named Entity Recognition for Hungarian with INTEX
Kata Gabor
21. Les groupes nominaux du texte Du côté de chez Swann
Katia Zellagui
QUATRIÈME PARTIE : PERSPECTIVES
22. LIKES : un environnement d'ingénierie linguistique et d'ingénierie des connaissances
François Rousselot, Nicolas Montessuit
23. Semantic Web and linguistic methodologies
Lucilla Futano
24 L'importance des schémas de réalisation lexicale dans l'étiquetage sémantique en TAL : le cas de l'expression du mouvement
Xavier Lepetit
- Auteur(s)
-
Max SILBERZTEINSvetla KOEVADenis MAUREL
- Public
-
Interprètes, traducteurs, lexicographes, terminologues, enseignants en seconde langue, chercheurs en linguistique de corpus, en linguistique générale et en informatique linguistique, chercheurs et enseignants s'intéressant aux langues à faible diffusion (
- éléments téléchargeables
- En Ligne