2 resultados para Narrative text classification
em AMS Tesi di Dottorato - Alm@DL - Università di Bologna
Resumo:
Information is nowadays a key resource: machine learning and data mining techniques have been developed to extract high-level information from great amounts of data. As most data comes in form of unstructured text in natural languages, research on text mining is currently very active and dealing with practical problems. Among these, text categorization deals with the automatic organization of large quantities of documents in priorly defined taxonomies of topic categories, possibly arranged in large hierarchies. In commonly proposed machine learning approaches, classifiers are automatically trained from pre-labeled documents: they can perform very accurate classification, but often require a consistent training set and notable computational effort. Methods for cross-domain text categorization have been proposed, allowing to leverage a set of labeled documents of one domain to classify those of another one. Most methods use advanced statistical techniques, usually involving tuning of parameters. A first contribution presented here is a method based on nearest centroid classification, where profiles of categories are generated from the known domain and then iteratively adapted to the unknown one. Despite being conceptually simple and having easily tuned parameters, this method achieves state-of-the-art accuracy in most benchmark datasets with fast running times. A second, deeper contribution involves the design of a domain-independent model to distinguish the degree and type of relatedness between arbitrary documents and topics, inferred from the different types of semantic relationships between respective representative words, identified by specific search algorithms. The application of this model is tested on both flat and hierarchical text categorization, where it potentially allows the efficient addition of new categories during classification. Results show that classification accuracy still requires improvements, but models generated from one domain are shown to be effectively able to be reused in a different one.
Resumo:
La mia tesi si riallaccia al dibattito teorico-letterario contemporaneo sulla possibilità di un approccio cognitivo alla narrativa e alla letteratura in particolare. Essa si propone di esplorare il rapporto tra narrazione ed esperienza, ridefinendo il concetto di “esperienzialità” della narrativa introdotto da Monika Fludernik nel suo Towards a “Natural” Narratology (1996). A differenza di Fludernik, che ha identificato l’esperienzialità con la rappresentazione dell’esperienza dei personaggi, la mia trattazione assegna un ruolo di primo piano al lettore, cercando di rispondere alla domanda: perché leggere una storia è – o si costituisce come – un’esperienza? L’intuizione dietro tutto ciò è che le teorizzazioni dell’esperienza e della coscienza nella filosofia della mente degli ultimi venti anni possano gettare luce sull’interazione tra lettori e testi narrativi. Il mio punto di riferimento principale è la scienza cognitiva “di seconda generazione”, secondo cui l’esperienza è un relazionarsi attivo e corporeo al mondo. La prima parte del mio studio è dedicata all’intreccio tra la narrativa e quello che chiamo lo “sfondo esperienziale” di ogni lettore, un repertorio di esperienze già note ai lettori attraverso ripetute interazioni con il mondo fisico e socio-culturale. Mi soffermo inoltre sul modo in cui relazionarsi a un testo narrativo può causare cambiamenti e slittamenti in questo sfondo esperienziale, incidendo sulla visione del mondo del lettore. Mi rivolgo poi al coinvolgimento corporeo del lettore, mostrando che la narrativa può attingere allo sfondo esperienziale dei suoi fruitori anche sul piano dell’esperienza di base: le simulazioni corporee della percezione contribuiscono alla nostra comprensione delle storie, incidendo sia sulla ricostruzione dello spazio dell’ambientazione sia sulla relazione intersoggettiva tra lettori e personaggi. Infine, mi occupo del rapporto tra l’esperienza della lettura e la pratica critico-letteraria dell’interpretazione, sostenendo che – lungi dal costituire due modalità opposte di fruizione dei testi – esse sono intimamente connesse.