Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 La Java d'Emilie 07
Archives
Derniers commentaires
12 novembre 2010

Projet

A) Pour un système d'analyse syntaxique automatique, nous avons besoin de mettre en place plusieurs ressources et outils. Parmi les modules nécessaires un module qui consulte un dictionnaire, afin de pouvoir associer à chaque mot son lemme et les propriétés morpho-syntaxiques. Le dictionnaire peut contenir des entrées lexicales simples, mais aussi des expressions idiomatiques. Le dictionnaire va être consulté afin de voir si la forme du mot n'est pas déjà dans ce dictionnaire. Le cas échéant, l'outil fera appel à un étiqueteur qui proposera une catégorie lexicale, à base de règles heuristiques (on regarde une collection de terminaisons typiques pour la classe).

 

Ecrivez des classes en Java qui décrivent les divers modules du système.

 

Maximum 3 étudiants

 

B) Un concordancier propose plusieurs fonctions: établir une liste des mots les plus fréquents, rechercher toutes les occurrences d'un mot ou d'une expression en contexte, trouver les collocatifs les plus fréquents, comparer le corpus avec un corpus de référence

 

Ecrivez des classes en Java qui décrivent les divers modules du système.

 

Maximum 3 étudiants

Publicité
Commentaires
mli07 La Java d'Emilie 07
  • Ce blog d'étudiant en Master 2 de Linguistique Informatique Traduction (Strasbourg) a vocation de faciliter le partage entre août 2010 et janvier 2011, des notes du cours Java, tutoriels, exercices et solutions, bout de codes, astuces...
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité