Formaliser les langues avec l'ordinateur

Formaliser les langues avec l'ordinateur

De Intex à Nooj

Max SILBERZTEIN – Svetla KOEVA Denis MAUREL

2007 – ISBN : 978-2-84867-189-5 – 498 pages – format : 15x21 cm

Collection : Les cahiers de la MSHE Ledoux

Série : Archive, bases, corpus

Disponibilité : En stock

25.00 €
OU
Résumé

INTEX et NooJ sont des environnements de développement linguistique utilisés comme outils de formalisation des langues naturelles, comme outils d'analyse de corpus, et aussi comme outils de développement d'applications de Traitement Automatique des Langues Naturelles (TALN).

Depuis 1993, s'est développée une véritable communauté d'utilisateurs qui partagent les mêmes préoccupations scientifiques et techniques, suivent une même méthodologie, et mettent en commun leurs outils et ressources linguistiques. A ce jour, une quinzaine de langues disposent de modules INTEX et NooJ, et plusieurs sites Internet, ainsi qu'un forum électronique, fédèrent cette communauté. Les thématiques qui se dégagent de ce numéro portent sur (1) la constitution de ressources linguistiques, (2) l'utilisation de corpus techniques, scientifiques ou journalistiques pour analyser et caractériser leur vocabulaire ou en extraire des noms propres, et (3) l'analyse syntaxique, avec une étude sur la levée d'ambiguïtés, l'implémentation d'un analyseur syntaxique du hongrois et la classification syntaxique des phrases d'un texte littéraire. (4)

Le numéro conclut enfin avec une discussion sur trois applications de TALN « non NooJ » mais qui présentent un intérêt critique pour l'analyse automatique, et proposent de nouvelles voies d'exploration en Linguistique : un logiciel d'analyse de corpus, le WEB sémantique et la traduction automatique.

Sommaire

Introduction

 

1. INTEX et Nooj pour la Linguistique et le Traitement Automatique des Langues

Svetla Koeva, Denis Maurel, Max Silberztein

2. Nooj's Linguistic Annotation Engine

Max Silberztein

 

PREMIÈRE PARTIE : FORMALISATION DES RESSOURCES LINGUISTIQUES 

3. Les adverbes dans les bulletins météorologiques allemands : description par automates

Manuel Fuchs, Dieter Seelbach

4. La lemmatisation de l'arménien occidental avec Nooj

Anaïd Donabedian, Nisan Boyacioglu

5. Le traitement des verbes à particules du chiac à partir d'un DELAS / DELAF

Michael Long, Gisèle Chevalier

6. Macro- ou micro-structure ? Elargir la couverture d'un dictionnaire électronique à partir de sa microstructure

Xavier Blanco, Angels Catena, Sandrine Fuentes

7. Un dictionnaire INTEX de noms de professions : quels féminins possibles ?

Marie-Aimée Gazeau, Denis Maurel

8. Hungarian Morphology in INTEX / Nooj

Tamis Varad1, Péter Vajda, Viktor Nagy

9. Morphological PROCESSING OF Nouns in Macedonian

Aleksandar Petrovski

10. Portuguese morphology with INTEX 4.33 

Cristina Mota

11. Extending the Serbian E-dictionary by using lexical transducers

Cvetana Krstev, Dusko Vitas

 

DEUXIÈME PARTIE : ANALYSE DE CORPUS 

12. Constructions de ressources terminologiques en santé

Aurélie Névéol, Magaly Douyère, Alexandrina Rogozan, Stéfan Darmoni

13. Modélisation linguistique et annotation des collocations : une application au lexique transdisciplinaire des écrits scientifiques

Agnès Tutin

14. Une leçon méthodologique en histoire de la médecine: l'application du système INTEX au texte « Recherches physiologiques sur la vie et la mort » de Xavier Bichat

Lucia Di Palo

15. Using INTEX to build and verify « taxonomie territories » historically determined : the language of neurology and J.-M. Charcot

Liborio Dibattista

16. Automatic Construction of a Thesaurus of Proper Names : A Local Grammar-based Approach

Hayssam Traboulsi, Khurshid Ahmad

17. Extraction of named entities in Serbian using INTEX

Dusko Vitas, Gordana Pavlovic-Lazetic

 

TROISIÈME PARTIE : ANALYSE SYNTAXIQUE 

18. Mapping, filtering and measuring impact of ambiguous words in Portuguese

Jorge Baptista, Luis Faisca

19. Word Sense Disambiguation for Purposes of Machine Translation – the nature of Bulgarian clitics

Svetla Koeva, Svetlozara Lesseva

20. Syntaxic Parsing and Named Entity Recognition for Hungarian with INTEX

Kata Gabor

21. Les groupes nominaux du texte Du côté de chez Swann

Katia Zellagui

 

QUATRIÈME PARTIE : PERSPECTIVES

22. LIKES : un environnement d'ingénierie linguistique et d'ingénierie des connaissances

François Rousselot, Nicolas Montessuit

23. Semantic Web and linguistic methodologies

Lucilla Futano

24 L'importance des schémas de réalisation lexicale dans l'étiquetage sémantique en TAL : le cas de l'expression du mouvement

Xavier Lepetit

 

 

Auteur(s)
Max SILBERZTEIN
Svetla KOEVA
Denis MAUREL
Public
Interprètes, traducteurs, lexicographes, terminologues, enseignants en seconde langue, chercheurs en linguistique de corpus, en linguistique générale et en informatique linguistique, chercheurs et enseignants s'intéressant aux langues à faible diffusion (
éléments téléchargeables
En Ligne