981 resultados para Semantic Text Analysis
Resumo:
Personal memories composed of digital pictures are very popular at the moment. To retrieve these media items annotation is required. During the last years, several approaches have been proposed in order to overcome the image annotation problem. This paper presents our proposals to address this problem. Automatic and semi-automatic learning methods for semantic concepts are presented. The automatic method is based on semantic concepts estimated using visual content, context metadata and audio information. The semi-automatic method is based on results provided by a computer game. The paper describes our proposals and presents their evaluations.
Resumo:
Submitted in part fulfillment of the requirements for the degree of Master in Computer Science
Resumo:
Tese de Doutoramento em Ciências da Comunicação
Resumo:
A character network represents relations between characters from a text; the relations are based on text proximity, shared scenes/events, quoted speech, etc. Our project sketches a theoretical framework for character network analysis, bringing together narratology, both close and distant reading approaches, and social network analysis. It is in line with recent attempts to automatise the extraction of literary social networks (Elson, 2012; Sack, 2013) and other studies stressing the importance of character- systems (Woloch, 2003; Moretti, 2011). The method we use to build the network is direct and simple. First, we extract co-occurrences from a book index, without the need for text analysis. We then describe the narrative roles of the characters, which we deduce from their respective positions in the network, i.e. the discourse. As a case study, we use the autobiographical novel Les Confessions by Jean-Jacques Rousseau. We start by identifying co-occurrences of characters in the book index of our edition (Slatkine, 2012). Subsequently, we compute four types of centrality: degree, closeness, betweenness, eigenvector. We then use these measures to propose a typology of narrative roles for the characters. We show that the two parts of Les Confessions, written years apart, are structured around mirroring central figures that bear similar centrality scores. The first part revolves around the mentor of Rousseau; a figure of openness. The second part centres on a group of schemers, depicting a period of deep paranoia. We also highlight characters with intermediary roles: they provide narrative links between the societies in the life of the author. The method we detail in this complete case study of character network analysis can be applied to any work documented by an index. Un réseau de personnages modélise les relations entre les personnages d'un récit : les relations sont basées sur une forme de proximité dans le texte, l'apparition commune dans des événements, des citations dans des dialogues, etc. Notre travail propose un cadre théorique pour l'analyse des réseaux de personnages, rassemblant narratologie, close et distant reading, et analyse des réseaux sociaux. Ce travail prolonge les tentatives récentes d'automatisation de l'extraction de réseaux sociaux tirés de la littérature (Elson, 2012; Sack, 2013), ainsi que les études portant sur l'importance des systèmes de personnages (Woloch, 2003; Moretti, 2011). La méthode que nous utilisons pour construire le réseau est directe et simple. Nous extrayons les co-occurrences d'un index sans avoir recours à l'analyse textuelle. Nous décrivons les rôles narratifs des personnages en les déduisant de leurs positions relatives dans le réseau, donc du discours. Comme étude de cas, nous avons choisi le roman autobiographique Les Confessions, de Jean- Jacques Rousseau. Nous déduisons les co-occurrences entre personnages de l'index présent dans l'édition Slatkine (Rousseau et al., 2012). Sur le réseau obtenu, nous calculons quatre types de centralité : le degré, la proximité, l'intermédiarité et la centralité par vecteur propre. Nous utilisons ces mesures pour proposer une typologie des rôles narratifs des personnages. Nous montrons que les deux parties des Confessions, écrites à deux époques différentes, sont structurées autour de deux figures centrales, qui obtiennent des mesures de centralité similaires. La première partie est construite autour du mentor de Rousseau, qui a symbolisé une grande ouverture. La seconde partie se focalise sur un groupe de comploteurs, et retrace une période marquée par la paranoïa chez l'auteur. Nous mettons également en évidence des personnages jouant des rôles intermédiaires, et de fait procurant un lien narratif entre les différentes sociétés couvrant la vie de l'auteur. La méthode d'analyse des réseaux de personnages que nous décrivons peut être appliquée à tout texte de fiction comportant un index.
Resumo:
The present paper advocates for the creation of a federated, hybrid database in the cloud, integrating law data from all available public sources in one single open access system - adding, in the process, relevant meta-data to the indexed documents, including the identification of social and semantic entities and the relationships between them, using linked open data techniques and standards such as RDF. Examples of potential benefits and applications of this approach are also provided, including, among others, experiences from of our previous research, in which data integration, graph databases and social and semantic networks analysis were used to identify power relations, litigation dynamics and cross-references patterns both intra and inter-institutionally, covering most of the World international economic courts.
Resumo:
Purpose: To assess the diagnostic accuracy of the Heidelberg Retinal Tomograph 3 (HRT3) as a screening device in comparison with the reference standard of Octopus standard automated perimetry results (SAP) combined with clinical findings. Methods: All patients underwent screening examinations and investigations within a single day. Abnormal screening results were classified as follows: The HRT3: Either "borderline" or "outside normal limits" using the global Moorfields classification (MFC); SAP and clinical exam: A mean defect > 2.4 dB or "outside normal limits" clear text analysis of SAP; and one of the following i) IOP > 21 mmHg, ii) Van Herrick < ¼, iii) cup disc ratio > 0.55, iv) optic nerve head abnormality, v) narrow iridocorneal angle or vi) evidence of peripheral anterior synechiae on gonioscopy. Results: The mean age of the participants was 59.9 years (± 14.8 [21, 91]). Twenty-three subjects (16 %) were classified as abnormal on SAP and clinical exam. The HRT3 classification had a sensitivity of 30 % (95 % CI [16 %, 51 %]) with associated specificity of 58 % (95 % CI [49 %, 66 %]). Of the sixty subjects classified as borderline or outside normal limits with the HRT MFC global result, seven subjects were also abnormal according to SAP and clinical exam. Conclusion: The results suggest that the HRT3 may not be suitable as a sole screening device; however, further investigation is necessary.
Resumo:
Sanomalehdissä käyty keskustelu “innovaatioyliopistosta” eli Helsinkiin sijoittuvasta Teknillisen korkeakoulun, Helsingin kauppakorkeakoulun ja Taideteollisen korkeakoulun fuusiohankkeesta on ollut vilkasta. Työnimestä huolimatta sisällöllinen keskustelu innovatiivisuudesta on ollut vähäistä. Tämän työn tutkimusmetodi on diskurssianalyysi. Sen keinoin pureudutaan innovatiivisuuden merkityksentymiseen yliopistofuusion kontekstissa. Laajasta kuuden sanomalehden artikkeliaineistosta vuosina 2005-2008 on valittu innovaatiodiskurssia edustava pääaineisto, jota on tulkittu sosiaalisesta ja kielellisestä näkökulmasta käsin. Innovatiivisuus yliopistokontekstissa merkityksentyi pääasiassa innovaatiojärjestelmien kautta. Perustutkimuksen tärkeä rooli innovaatioketjussa esittäytyi näkyvästi.
Resumo:
Chemical knowledge plays a central role in the economical and social development of a nation. Chemistry is considered a key science, which provides the means and meanings that fuel the advancement of other fields of knowledge. However, the public image of chemistry is often associated with negative facts and misconceptions. This paper addresses and discusses the public image of chemistry with two case studies: the public image of chemistry depicted in two major Brazilian newspapers and the Brazilian project for the International Year of Chemistry (IYC). Analysis of the newspaper data strongly suggests that the public image of chemistry is related to both the way news is written and the ability of the reader to identify the chemical knowledge actually present in the text. Analysis of IYC related data in the second case study depicted an optimistic panorama for the divulgation of chemistry at both national and local levels. A model for broad and effective initiatives for dissemination of chemistry is discussed. The need to keep science divulgation as the top agenda of the scientific community is also highlighted.
Resumo:
Euroopan sähkömarkkinat ovat viime vuosikymmeninä olleet suurien muutoksien kohteena näiden yhtenäistämisprojektin seurauksena. Fortum, yksi Euroopan johtavista energia-alan yrityksistä valmistautuu tähän muutokseen toteuttamalla omia yrityksen sisäisiä muutoksia, tavoitteenaan yksinkertaistaa organisaatiorakennettaan ja parantaa tehokkuuttaan. Yksi suuri muutos tähän liittyen on vesivoimavalvomojen lokalisaatioprojekti. Vesivoimavalvomojen uudelleenlokalisaation ja vesivoiman käytönvalvojien ikääntymisen myötä nähtiin tarpeelliseksi tehdä tutkimus käytönvalvojien hiljaisesta tiedosta. Näin ollen, tässä diplomityössä perehdyttiin Fortumin vesivoiman käytönvalvojien kompetensseihin ja näiden hiljaiseen tietoon. Tutkimusaiheena oli selvittää minkälaista hiljaista tietoa käytönvalvojat omaavat, ja mikä osa tästä tiedosta muodostaa sen kriittisen osaamisen, jota halutaan säilyttää ja kehittää. Tutkimustyypiksi muodostui kvalitatiivinen, jonka päämetodi oli puoli-avoin haastattelu. Tutkimus koostui seuraavista vaiheista: tarkkailu, tekstianalyysi, haastattelu, transkriptio ja data analyysi. Haastatteluja tehtiin kahdeksan, joista kerääntyi yli 24 tuntia haastattelumateriaalia. Tästä materiaalista muodostettiin analyysien avulla taulukko, jonka avulla tunnistettiin ne osa-alueet, joihin käytönvalvojan tärkeimmät kompetenssit liittyvät. Tuloksilla saatiin myös kerättyä lista korjaus- ja kehityskohteista, sekä tarkemmat määritykset jatkotutkimukselle.
Resumo:
The subject of the thesis is automatic sentence compression with machine learning, so that the compressed sentences remain both grammatical and retain their essential meaning. There are multiple possible uses for the compression of natural language sentences. In this thesis the focus is generation of television program subtitles, which often are compressed version of the original script of the program. The main part of the thesis consists of machine learning experiments for automatic sentence compression using different approaches to the problem. The machine learning methods used for this work are linear-chain conditional random fields and support vector machines. Also we take a look which automatic text analysis methods provide useful features for the task. The data used for machine learning is supplied by Lingsoft Inc. and consists of subtitles in both compressed an uncompressed form. The models are compared to a baseline system and comparisons are made both automatically and also using human evaluation, because of the potentially subjective nature of the output. The best result is achieved using a CRF - sequence classification using a rich feature set. All text analysis methods help classification and most useful method is morphological analysis. Tutkielman aihe on suomenkielisten lauseiden automaattinen tiivistäminen koneellisesti, niin että lyhennetyt lauseet säilyttävät olennaisen informaationsa ja pysyvät kieliopillisina. Luonnollisen kielen lauseiden tiivistämiselle on monta käyttötarkoitusta, mutta tässä tutkielmassa aihetta lähestytään television ohjelmien tekstittämisen kautta, johon käytännössä kuuluu alkuperäisen tekstin lyhentäminen televisioruudulle paremmin sopivaksi. Tutkielmassa kokeillaan erilaisia koneoppimismenetelmiä tekstin automaatiseen lyhentämiseen ja tarkastellaan miten hyvin erilaiset luonnollisen kielen analyysimenetelmät tuottavat informaatiota, joka auttaa näitä menetelmiä lyhentämään lauseita. Lisäksi tarkastellaan minkälainen lähestymistapa tuottaa parhaan lopputuloksen. Käytetyt koneoppimismenetelmät ovat tukivektorikone ja lineaarisen sekvenssin mallinen CRF. Koneoppimisen tukena käytetään tekstityksiä niiden eri käsittelyvaiheissa, jotka on saatu Lingsoft OY:ltä. Luotuja malleja vertaillaan Lopulta mallien lopputuloksia evaluoidaan automaattisesti ja koska teksti lopputuksena on jossain määrin subjektiivinen myös ihmisarviointiin perustuen. Vertailukohtana toimii kirjallisuudesta poimittu menetelmä. Tutkielman tuloksena paras lopputulos saadaan aikaan käyttäen CRF sekvenssi-luokittelijaa laajalla piirrejoukolla. Kaikki kokeillut teksin analyysimenetelmät auttavat luokittelussa, joista tärkeimmän panoksen antaa morfologinen analyysi.
Resumo:
The study focuses on five lower secondary school pupils’ daily use of their one-toone computers, the overall aim being to investigate literacy in this form of computing. Theoretically, the study is rooted in the New Literacy tradition with an ecological perspective, in combination with socio-semiotic theory in a multimodal perspective. New Literacy in the ecological perspective focuses on literacy practices and place/space and on the links between them. Literacy is viewed as socially based, in specific situations and in recurring social practices. Socio-semiotic theory embodying the multimodal perspective is used for the text analysis. The methodology is known as socio-semiotic ethnography. The ethnographic methods encompass just over two years of fieldwork with participating observations of the five participants’ computing activities at home, at school and elsewhere. The participants, one boy and two girls from the Blue (Anemone) School and two girls from the White (Anemone) School, were chosen to reflect a broad spectrum in terms of sociocultural and socioeconomic background. The study shows the existence of a both broad and deep variation in the way digital literacy features in the participants’ one-to-one computing. These variations are associated with experience in relation to the home, the living environment, place, personal qualities and school. The more varied computer usage of the Blue School participants is connected with the interests they developed in their homes and living environments and in the computing practices undertaken in school. Their more varied usage of the computer is reflected in their broader digital literacy repertoires and their greater number and variety of digital literacy abilities. The Blue School participants’ text production is more multifaceted, covers a wider range of subjects and displays a broader palette of semiotic resources. It also combines more text types and the texts are generally longer than those of the White School participants. The Blue School girls have developed a text culture that is close to that of the school. In their case, there is clear linkage between school-initiated and self-initiated computing activities, while other participants do not have the same opportunities to link and integrate self-initiated computing activities into the school context. It also becomes clear that the Blue School girls can relate and adapt their texts to different communicative practices and recipients. In addition, the study shows that the Blue School girls have some degree of scope in their school practice as a result of incorporating into it certain communicative practices that they have developed in nonschool contexts. Quite contrary to the hopes expressed that one-to-one computing would reduce digital inequality, it has increased between these participants. Whether the same or similar results apply in a larger perspective, on a more structural level, is a question that this study cannot answer. It can only draw attention to the need to investigate the matter. The study shows in a variety of ways that the White School participants do not have the same opportunity to develop their digital literacy as the Blue School participants. In an equivalence perspective, schools have a compensational task to perform. It is abundantly clear from the study that investing in one-to-one projects is not enough to combat digital inequality and achieve the digitisation goals established for school education. Alongside their investments in technology, schools need to develop a didactic that legitimises and compensates for the different circumstances of different pupils. The compensational role of schools in this connection is important not only for the present participants but also for the community at large, in that it can help to secure a cohesive, open and democratic society.
La melancolía en Atlántida de Oscar Villegas : representación teatral del carácter nacional mexicano
Resumo:
Les images qui représentent le Mexicain le montrent habituellement sous les traits d’un être extrêmement mélancolique qui fait face à un destin tragique. Les nombreux mythes entourant le Mexicain, issus de la culture même, sont effectivement reliés de près ou de loin à la peur et la tristesse, soit deux composantes essentielles de la mélancolie. L’anthropologue Roger Bartra dans La jaula de la melancolía: identidad y metamorfosis del mexicano analyse ces éléments clés qui constitueraient la personnalité du Mexicain. L’objectif de cette recherche est de démontrer que Atlántida d’Oscar Villegas est l’œuvre par excellence qui représente cette mélancolie toute mexicaine. Dans sa pièce de théâtre, Villegas raconte l’histoire d’une jeune artiste de cabaret qui vit de nombreuses désillusions dans un monde vulgaire et pervers où les valeurs humaines font défaut. Le dramaturge met en scène le Mexico urbain des années quarante et montre le désespoir et l’impossibilité pour les habitants de ses quartiers pauvres de changer le cours de leur vie. En plus d’être une pièce de théâtre qui, tant au niveau de son contenu que de sa forme, porte en elle les marques de la mélancolie, Atlántida met en relief ces caractéristiques devenues au fil du temps représentatives de l’image nationale du Mexicain. L’étude de cette œuvre s’appuie sur les théories d’analyse du texte théâtral d’Anne Ubersfeld qui propose une approche centrée sur l’action et les conditions de communication contenues dans les dialogues. Faire le pont entre la pièce de théâtre de Villegas et l’essai de Bartra permet d’explorer le lien intrinsèque qui semble s’établir entre Mexicain et mélancolie.
Resumo:
En Argentine, la biotechnologie agricole, spécialement le soya transgénique, a été adoptée de façon fulgurante et elle a provoqué un fort choc dans l’économie nationale et dans la société. Actuellement, dû à la gravité des conséquences de ce phénomène, les médias, et la presse en particulier, ont fait écho du débat. Le but général de cette étude est d’analyser le débat de société sur ce phénomène dans la presse écrite argentine. Pour ce faire, trois objectifs spécifiques ont été retenus : dresser un portrait général du discours; comprendre le contexte politique et économique qui a permis l’insertion de la biotechnologie agricole en Argentine; et analyser les enjeux socioéthiques subjacents au problème des biotechnologies. Pour répondre à ces objectifs, on a effectué une analyse de contenu du discours social circonscrit à la presse écrite argentine entre les années 1999- 2006. La démarche privilégiée inclut la classification des articles de journaux par l’utilisation de mots-clés et l’assignation à des catégories thématiques avec l’assistance des techniques d’analyse de texte par ordinateur. Les résultats de cette étude signalent pour la période étudiée une importante couverture journalistique des biotechnologies agricoles, couverture qui, en général, a été favorable. La quantité d’articles augmente avec les années et montre un virage important des sujets commerciaux à des questions politiques. Le débat autour des conséquences environnementales et sociales de l’application du nouveau modèle agricole sont pauvrement représentées et montrent une apparition plus tardive dans les journaux argentins. Cependant, cela pourrait s’expliquer par un déplacement dans l’axe de la discussion des biotechnologies vers la sojisation qui devient l’enjeu central du débat autour du phénomène agricole.
Resumo:
Dans cette thèse, nous construisons un modèle épidémiologique de la dissémina- tion de normes juridiques. L’objectif est d’expliquer la transmission de normes juridiques américaines régissant les tests de dépistages pour drogues au travail vers le Canada ainsi que la propagation subséquente de ces normes à travers la jurisprudence canadienne. La propagation des normes régissant les tests de dépistages pour drogues au travail sert donc à la fois de point de départ pour une réflexion théorique sur la transmission de normes juridiques et pour une étude de cas empirique. Nous partons de la prémisse que les explications du changement juridique, telles celle de la transplantation et celle de l’harmonisation, sont essentiellement métaphoriques. Ces métaphores explicatives fonctionnent en invitant des comparaisons entre les domaines connus et inconnus. Quand ce processus de comparaison est systématisé, la métaphore devient un modèle. Dans la thèse, nous appliquons cette procédure de systématisation afin de transformer la métaphore de la propagation virale en modèle épidémiologique. Après une revue de la littérature sur les épidémies sociales, nous décrivons les éléments pertinents de la théorie épidémiologique pour, ensuite, les transposer au domaine juridique. Le modèle est alors opérationnalisé en l’appliquant à une base de données composée de la jurisprudence pertinente (n=187). Les résultats soutiennent les hypothèses du modèle. 90 % des décisions qui citent les sources américaines sont infectées selon les critères du modèle, alors que seulement 64 % des décisions qui ne citent pas de sources américaines sont infectées. Cela soutient l’hypothèse d’une épidémie dite de « réservoir commun ». Nous avons également démontré une corrélation positive entre la référence à ces décisions et l’état d’infection! : 87 % des décisions qui citent des décisions qui réfèrent aux sources américaines sont infectées, alors que le taux d’infection parmi la population restante est de seulement 53 %. Les résultats semblables ont été obtenus pour les décisions de troisième génération. Cela soutient l’hypothèse selon laquelle il y a eu propagation à travers la jurisprudence suite aux contacts initiaux avec le réservoir commun. Des corrélations positives ont aussi été démontrées entre l’état d’infection et l’appartenance à l’une ou l’autre de sous-populations particulières qui seraient, par hypothèse, des points d’infection. En conclusion de la thèse, nous avançons que c’est seulement après avoir construit un modèle et d’avoir constaté ses limites que nous pouvons vraiment comprendre le rôle des métaphores et des modèles dans l’explication de phénomènes juridiques.
Resumo:
La version intégrale de ce mémoire est disponible uniquement pour consultation individuelle à la Bibliothèque de musique de l’Université de Montréal (www.bib.umontreal.ca/MU).