A face quantitativa da linguagem: um dicionário de freqüências do português
Contribuinte(s) |
Universidade Estadual Paulista (UNESP) |
---|---|
Data(s) |
24/06/2014
24/06/2014
1998
|
Resumo |
O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem. |
Identificador |
http://seer.fclar.unesp.br/alfa/article/view/4049 ALFA: Revista de Linguística, v. 42 - Especial, 1998 - O estado da arte nas ciências do léxico: lexicologia, lexicografia e terminologia 1981-5794 0002-5216 http://hdl.handle.net/11449/107756 ISSN1981-5794-1998-42-161-181.pdf |
Idioma(s) |
por |
Publicador |
Universidade Estadual Paulista (UNESP) |
Relação |
Alfa: Revista de Linguística |
Direitos |
openAccess |
Palavras-Chave | #Lexicoestatística #dicionário de freqüências #hapax legomena #index verborum #vocabulário multiuso |
Tipo |
info:eu-repo/semantics/article |