Text Summarization by Sentence Extraction and Syntactic Pruning


Autoria(s): Gagnon, Michel; Da Sylva, Lyne
Data(s)

29/05/2013

29/05/2013

01/08/2005

Resumo

Nous présentons une méthode hybride pour le résumé de texte, en combinant l'extraction de phrases et l'élagage syntaxique des phrases extraites. L'élagage syntaxique est effectué sur la base d’une analyse complète des phrases selon un parseur de dépendances, analyse réalisée par la grammaire développée au sein d'un logiciel commercial de correction grammaticale, le Correcteur 101. Des sous-arbres de l'analyse syntaxique sont supprimés quand ils sont identifiés par les relations ciblées. L'analyse est réalisée sur un corpus de divers textes. Le taux de réduction des phrases extraites est d’en moyenne environ 74%, tout en conservant la grammaticalité ou la lisibilité dans une proportion de plus de 64%. Étant donné ces premiers résultats sur un ensemble limité de relations syntaxiques, cela laisse entrevoir des possibilités pour une application de résumé automatique de texte.

CRSNG

Identificador

Gagnon, Michel et Lyne Da Sylva. 2005. Text Summarization by Sentence Extraction and Syntactic Pruning. In Proceedings of Computational Linguistics in the North East (CliNE’05), 26 août. Gatineau : Université du Québec en Outaouais.

http://hdl.handle.net/1866/9619

Idioma(s)

en

Palavras-Chave #compression de texte #analyse de dépendances #élagage syntaxique
Tipo

Actes de conférence / Conference Proceedings