Coreference resolution for portuguese using parallel corpora word alignment


Autoria(s): Souza, José Guilherme Camargo de
Contribuinte(s)

Orasan, Constantin

Baptista, Jorge

Data(s)

30/09/2014

30/09/2014

2011

2011

Resumo

A área de Extração da Informação tem como objetivo essencial investigar métodos e técnicas para transformar a informação não estruturada presente em textos de língua natural em dados estruturados. Um importante passo deste processo é a resolução de correferência, tarefa que identifica diferentes sintagmas nominais que se referem a mesma entidade no discurso. A área de estudos sobre resolução de correferência tem sido extensivamente pesquisada para a Língua Inglesa (Ng, 2010) lista uma série de estudos da área, entretanto tem recebido menos atenção em outras línguas. Isso se deve ao fato de que a grande maioria das abordagens utilizadas nessas pesquisas são baseadas em aprendizado de máquina e, portanto, requerem uma extensa quantidade de dados anotados.

Universidade do Algarve, Faculdade de Ciências Humanas e Sociais

Identificador

http://hdl.handle.net/10400.1/5148

Idioma(s)

por

Direitos

openAccess

Palavras-Chave #Linguística #Resolução de correferência #Alinhamento lexical #Processamento de linguagem
Tipo

masterThesis