Catégorisation automatique de propositions textuelles en types de discours
Data(s) |
2012
|
---|---|
Resumo |
De nombreuses méthodes de classification automatique de textes (supervisée ou non) existent. Elles se sont particulièrement développées depuis la création du web en vue d'améliorer les moteurs de recherche. Au delà de ce champs d'application, elles peuvent aussi être utiles pour « découvrir » ou « redécouvrir » ce qui caractérise une classe de textes aussi simplement que possible. Dans l'approche statistique développée ici, il s'agira de partitionner des parties de textes en types de discours tels que narratif, explicatif, argumentatif etc. en utilisant un minimum d'information, à savoir les catégories morphosyntaxiques (CMS). Les premiers résultats obtenus mettent en évidence des liens significatifs entre les CMS, les types de discours et des textes annotés par un expert humain ; ces relations sont toutefois encore incomplètes et difficiles à interpréter d'un point de vue linguistique. |
Identificador |
http://serval.unil.ch/?id=serval:BIB_EAE5999425AF http://ppur.com/produit/549/9782889141494/Lire%20demain isbn:9782880749583 reroid:R007058142 http://my.unil.ch/serval/document/BIB_EAE5999425AF.pdf http://nbn-resolving.org/urn/resolver.pl?urn=urn:nbn:ch:serval-BIB_EAE5999425AF0 |
Idioma(s) |
fr |
Publicador |
Lausanne: Presses polytechniques et universitaires romandes |
Direitos |
info:eu-repo/semantics/openAccess |
Fonte |
Lire demain : des manuscrits antiques à l'ère digitale = Reading tomorrow : from ancient manuscripts to the digital era |
Tipo |
info:eu-repo/semantics/conferenceObject inproceedings |