Pozyskiwanie danych leksykalnych z tekstówelektronicznych (na materiale czasopisma naukowego)


Autoria(s): Paryzek, Piotr
Contribuinte(s)

Wierzchoń, Piotr

Data(s)

28/10/2011

28/10/2011

28/10/2011

Resumo

Praca dotyczy wybranych metod pozyskiwania, czyli ekscerpcji, informacji o charakterze leksykalnym z elektronicznych zbiorów tekstów.Jej celem jest, po pierwsze, sformułowanie nowych, oryginalnych metod, które mogą być użyteczne w pozyskiwaniu materiału do analiz leksykalnych, a następnie zbadanie ich na wybranym zbiorze tekstów.Planowano opracowanie metod niewymagających zaawansowanej znajomości programowania komputerowego, a jednocześnie umożliwiających uzyskanie wartościowych wyników, gdzie za wartościowość metody uznaje się daną wydajność ekscerpcyjną. Trzy sformułowane metody dopracowano i zoptymalizowano.Metoda ekscerpcji jednostek nowych dostarczyła ponad 1000 wyrazów nowych, niezarejestrowanych, metoda ekscerpcji kolokacji w oparciu o akronimy daje ponad 6000 jednostek, zaś metoda ekscerpcji kolokacji wykorzystująca końcówkę liczby mnogiej dała ponad 110 tysięcy wyodrębnionych jednostek.

The principal objective of the thesis is to exemplify, based on three specific and verified methods, that automation of successive steps of lexicographic data retrieval using customised procedures is possible. The common feature of all the three methods is the use of linguistic discriminants which instead of statistics or other mathematical means make it possible to discern the words or phrases of interest. The lexicographic methods developed and tested in the thesis include the retrieval of putative new words or collocations from English-language texts.

Identificador

http://hdl.handle.net/10593/1422

Idioma(s)

pl

Palavras-Chave #językoznawstwo korpusowe #corpus linguistics #język angielski #English language #metody automatyczne #automatic methods #leksykografia #lexicography
Tipo

Dysertacja