Catégorisation automatique de propositions textuelles en types de discours


Autoria(s): Cocco C.; Clivaz C. (ed.); Meizoz J. (ed.); Vallotton F. (ed.); Verheyden J. (ed.)
Data(s)

2012

Resumo

De nombreuses méthodes de classification automatique de textes (supervisée ou non) existent. Elles se sont particulièrement développées depuis la création du web en vue d'améliorer les moteurs de recherche. Au delà de ce champs d'application, elles peuvent aussi être utiles pour « découvrir » ou « redécou­vrir » ce qui caractérise une classe de textes aussi simplement que possible. Dans l'approche statistique développée ici, il s'agira de partitionner des parties de textes en types de discours tels que narratif, explicatif, argumentatif etc. en utilisant un minimum d'information, à savoir les catégories morphosyn­taxiques (CMS). Les premiers résultats obtenus mettent en évidence des liens significatifs entre les CMS, les types de discours et des textes annotés par un expert humain ; ces relations sont toutefois encore incomplètes et difficiles à interpréter d'un point de vue linguistique.

Identificador

http://serval.unil.ch/?id=serval:BIB_EAE5999425AF

http://ppur.com/produit/549/9782889141494/Lire%20demain

isbn:9782880749583

reroid:R007058142

http://my.unil.ch/serval/document/BIB_EAE5999425AF.pdf

http://nbn-resolving.org/urn/resolver.pl?urn=urn:nbn:ch:serval-BIB_EAE5999425AF0

Idioma(s)

fr

Publicador

Lausanne: Presses polytechniques et universitaires romandes

Direitos

info:eu-repo/semantics/openAccess

Fonte

Lire demain : des manuscrits antiques à l'ère digitale = Reading tomorrow : from ancient manuscripts to the digital era

Tipo

info:eu-repo/semantics/conferenceObject

inproceedings