Simulation de l'apprentissage des contextes nominaux/ verbaux par n-grammes. Brusini, P., Amsili, P., Chemla, E., & Christophe, A. In Blache, P., Béchet, F., & Bigi, B., editors, Proceedings of TALN 2014 (Volume 2: Short Papers), pages 505–510, Marseille, France, July, 2014. Association pour le Traitement Automatique des Langues.
Simulation de l'apprentissage des contextes nominaux/ verbaux par n-grammes [pdf]Pdf  Simulation de l'apprentissage des contextes nominaux/ verbaux par n-grammes [pdf]Poster  Simulation de l'apprentissage des contextes nominaux/ verbaux par n-grammes [link]Acl  Simulation de l'apprentissage des contextes nominaux/ verbaux par n-grammes [link]Hal  abstract   bibtex   
On présente une étude d'apprentissage visant à montrer que les contextes locaux dans un corpus de parole adressée aux enfants peuvent être exploités, avec des méthodes statistiques simples, pour prédire la catégorie (nominale vs. verbale) d'un mot inconnu. Le modèle présenté, basé sur la mémorisation de n-grammes et sur une «graine sémantique» (un petit nombre de noms et verbes supposés connus et catégorisés) montre une excellente précision à toutes les tailles de graine sémantique, et un rappel plus faible, qui croît avec la taille de la graine sémantique. Les contextes les plus utilisés sont ceux qui contiennent des mots fonctionnels. Cette étude de faisabilité démontre que les très jeunes enfants pourraient exploiter les contextes de mots inconnus pour prédire leur catégorie syntaxique.

Downloads: 0