Projet
A) Pour un système d'analyse syntaxique automatique, nous avons besoin de mettre en place plusieurs ressources et outils. Parmi les modules nécessaires un module qui consulte un dictionnaire, afin de pouvoir associer à chaque mot son lemme et les propriétés morpho-syntaxiques. Le dictionnaire peut contenir des entrées lexicales simples, mais aussi des expressions idiomatiques. Le dictionnaire va être consulté afin de voir si la forme du mot n'est pas déjà dans ce dictionnaire. Le cas échéant, l'outil fera appel à un étiqueteur qui proposera une catégorie lexicale, à base de règles heuristiques (on regarde une collection de terminaisons typiques pour la classe).
Ecrivez des classes en Java qui décrivent les divers modules du système.
Maximum 3 étudiants
B) Un concordancier propose plusieurs fonctions: établir une liste des mots les plus fréquents, rechercher toutes les occurrences d'un mot ou d'une expression en contexte, trouver les collocatifs les plus fréquents, comparer le corpus avec un corpus de référence
Ecrivez des classes en Java qui décrivent les divers modules du système.
Maximum 3 étudiants