940 resultados para semantic analysis
Resumo:
Title of the Master's thesis: Análisis de la preposición hacia y establecimiento de sus equivalentes en finés (trans. Analysis of the Spanish preposition hacia and the finding of its equivalents in Finnish) Abstracts: The aim of this Master thesis is to provide a detailed analysis of the Spanish preposition hacia from a cognitive perspective and to establish its equivalents in Finnish language. In this sense, my purpose is to demonstrate the suitability of both cognitive perspectives and Contrastive Linguistics for semantic analysis. This thesis is divided into five chapters. The first chapter includes a presentation and a critical review of the monolingual lexical processing and semantic analysis of the Spanish preposition hacia in major reference works. Through this chapter it is possible to see both the inadequacies and omissions that are present in all the given definitions. In this sense, this chapter shows that these problems are not but the upper stage of an ontological (and therefore methodological) problem in the treatment of prepositions. The second chapter covers the presentation of the methodological and theoretical perspective adopted for this thesis for the monolingual analysis and definition of the Spanish preposition hacia, following mainly the guidelines established by G. Lakoff (1987) and R. Langacker (2008) in his Cognitive grammar. Taken together, and within the same paradigm, recent analytical and methodological contributions are discussed critically for the treatment of polysemy in language (cf. Tyler ja Evans 2003). In the third chapter, and in accordance with the requirements regarding the use of empirical data from corpora, is my aim to set out a monolingual original analysis of the Spanish preposition hacia in observance of the principles and the methodology spelled out in the second chapter. The main objective of this chapter is to build a full fledged semantic representation of the polysemy of this preposition in order to understand and articulate its meanings with Finnish language (and other possible languages). The fourth chapter, in accordance with the results of chapter 3, examines and describes and establishes the corresponding equivalents in Finnish for this preposition. The results obtained in this chapter are also contrasted with the current bilingual lexicographical definitions found in the most important dictionaries and grammars. Finally, in the fifth chapter of this thesis, the results of this work are discussed critically. In this way, some observations are given regarding both the ontological and theoretical assumptions as well regarding the methodological perspective adopted. I also present some notes for the construction of a general methodology for the semantic analysis of Spanish prepositions to be carried out in further investigations. El objetivo de este trabajo, que caracterizamos como una tarea de carácter comparativo-analítico, es brindar un análisis detallado de la preposición castellana hacia desde una perspectiva cognitiva en tanto y a través del establecimiento de sus equivalentes en finés. Se procura, de esta forma, demostrar la adecuación de una perspectiva cognitiva tanto para el examen como para el establecimiento y articulación de la serie de equivalentes que una partícula, en nuestro caso una preposición, encuentra en otra lengua. De esta forma, y frente a definiciones canónicas que advierten sobre la imposibilidad de una caracterización acabada del conjunto de usos de una preposición, se observa como posible, a través de la aplicación de una metodología teórica-analítica adecuada, la construcción de una definición viable tanto en un nivel jerárquico como descriptivo. La presente tesis se encuentra dividida en cinco capítulos. El primer capítulo comprende una exposición y revisión critica del tratamiento monolingüe lexicográfico y analítico que la preposición hacia ha recibido en las principales obras de referencia, donde se observa que las inadecuaciones y omisiones presentes en la totalidad de las definiciones analizadas representan tan sólo el estadio superior de una problemática de carácter ontológico y, por tanto, metodológico, en el tratamiento de las preposiciones. El capítulo segundo comprende la presentación de la perspectiva teórica metodológica adoptada en esta tesis para el análisis y definición monolingüe de la preposición hacia, teniendo por líneas directrices las propuestas realizadas por G. Lakoff , así como a los fundamentos establecidos por R. Langacker en su propuesta cognitiva para una nueva gramática. En forma conjunta y complementaria, y dentro del mismo paradigma, empleamos, discutimos críticamente y desarrollamos diferentes aportes analítico-metodológicos para el tratamiento de la polisemia en unidades lingüísticas locativas. En el capítulo tercero, y en acuerdo con las exigencias respecto a la utilización de datos empíricos obtenidos a partir de corpus textuales, se expone un análisis original monolingüe de la preposición hacia en observancia de los principios y la metodología explicitada en el capítulo segundo, teniendo por principal objetivo la construcción de una representación semántica de la polisemia de la preposición que comprenda y articule los sentidos prototípicos para ésta especificados. El capítulo cuarto, y en acuerdo con los resultados de nuestro análisis monolingual de la preposición, se examinan, describen y establecen los equivalentes correspondientes en finés para hacia; asimismo, se contrastan en este capítulo los resultados obtenidos con las definiciones lexicográficas bilingües vigentes. Se recogen en el último y quinto capítulo de esta tesis algunas observaciones tanto respecto a los postulados ontológicos y teórico-metodológicos de la perspectiva adoptada, así como algunas notas para la construcción de una metodología general para el análisis semántico preposicional.
Resumo:
Automatic identification of software faults has enormous practical significance. This requires characterizing program execution behavior and the use of appropriate data mining techniques on the chosen representation. In this paper, we use the sequence of system calls to characterize program execution. The data mining tasks addressed are learning to map system call streams to fault labels and automatic identification of fault causes. Spectrum kernels and SVM are used for the former while latent semantic analysis is used for the latter The techniques are demonstrated for the intrusion dataset containing system call traces. The results show that kernel techniques are as accurate as the best available results but are faster by orders of magnitude. We also show that latent semantic indexing is capable of revealing fault-specific features.
Resumo:
Incremental semantic analysis in a programming environment based on Attribute Grammars is performed by an Incremental Attribute Evaluator (IAE). Current IAEs are either table-driven or make extensive use of graph structures to schedule reevaluation of attributes. A method of compiling an Ordered Attribute Grammar into mutually recursive procedures is proposed. These procedures form an optimal time Incremental Attribute Evaluator for the attribute grammar, which does not require any graphs or tables.
Resumo:
This dissertation is an onomastic study of variation in women s name phrases in official documents in Finland during the period 1780−1930. The aim is to discuss from a socio-onomastic perspective both the changeover from patronymics to inherited family names and the use of surnames after marriage (i.e. whether women adopted their husbands family names or retained their maiden names), before new laws in this area entered into force in Finland in the early 20th century. In 1920, a law on family names that required fixed names put an end to the use of the patronymic as a person s only surname. After 1929, it was no longer possible for a married woman to retain her maiden name. Methodologically, to explain this development from a socio-onomastic perspective, I have based my study on a syntactic-semantic analysis of the actual name phrases. To be able to demonstrate the extensive material, I have elaborated a scheme to divide the 115 different types of name phrases into 13 main categories. The analysis of the material for Helsinki is based on frequency calculations of the different types of name phrases every thirtieth year, as well as on describing variation in the structure and semantic content of the name phrases, e.g. social variation in the use of titles and epithets. In addition to this, by applying a biographic-genealogical method, I have conducted two case studies of the usage of women s name phrases in the two chosen families. The study is based on parish registers from the period 1780−1929, estate inventory documents from the period 1780−1928, registration forms for liberty of trade from the period 1880−1908, family announcements on newspapers from the period 1829−1888, gravestones from the period 1796−1929 and diaries from the periods 1799−1801 and 1818−1820 providing a corpus of 5 950 name phrases. The syntactic-semantic analysis has revealed the overall picture of various ways of denoting women in official documents. In Helsinki, towards the end of the 19th century, the use of inherited family names seems to be almost fully developed in official contexts. At the late 19th century, a patronymic still appears as the only surname of some working-class women whereas in the early 20th century patronymics were only entered in the parish register as a kind of middle name. In the beginning of the 19th century, most married women were still registered under their maiden names, with a few exceptions among the bourgeoisie and upper class. The comparative analysis of name phrases in diaries, however, indicates that the use of the husband s family name by married women was a much earlier phenomenon in private contexts than in official documents. Keywords: socio-onomastics, syntactic-semantic analysis, name phrase, patronymic, maiden name, husband s family name
Resumo:
Non-negative matrix factorization [5](NMF) is a well known tool for unsupervised machine learning. It can be viewed as a generalization of the K-means clustering, Expectation Maximization based clustering and aspect modeling by Probabilistic Latent Semantic Analysis (PLSA). Specifically PLSA is related to NMF with KL-divergence objective function. Further it is shown that K-means clustering is a special case of NMF with matrix L2 norm based error function. In this paper our objective is to analyze the relation between K-means clustering and PLSA by examining the KL-divergence function and matrix L2 norm based error function.
Resumo:
Este estudo visa compreender a relação que a psicologia social estabelece com a noção de verdade e de que modo este conceito foi fundamental na aquisição de seu estatuto científico. Tomando como ponto de partida a análise semântica do termo, principalmente a partir do seu paradigma grego (alétheia), a análise teórica se subdivide em três eixos principais. O primeiro deles irá abordar a tensão que se estabelece acerca das exigências do conhecimento entre o movimento sofístico e o modelo platônico. Num segundo momento, serão analisadas as torções promovidas pelas ciências modernas, transformando o método científico e racional num instrumento de classificação de todos os erros. Na parte final, o foco se desloca para as especificidades da psicologia social, buscando apontar um contraste entre as pesquisas de W. Wundt (1832-1920) e sua influência nas experiências clássicas da psicologia experimental e no empirismo radical de W. James (1842-1910). O pensamento de James será analisado dando ênfase à influência indeterminista presente nas suas propostas filosóficas e psicológicas e à análise de uma de suas principais contribuições: a teoria da verdade.
Resumo:
Celem artykułu jest przedstawienie aplikacji zastosowania na krajowym poziomie stosowania przepisów unijnych koncepcji wykładni derywacyjnej Macieja Zielińskiego. Podjęto w nim próbę udzielenia odpowiedzi na pytanie o wzajemne relacje przepisów prawnych ustanowionych przez socjologicznie różnych prawodawców do norm postępowania odtwarzanych w procesie wykładni w oparciu o analizę syntaktyczną oraz treściową krajowych i unijnych przepisów prawnych z różnych gałęzi prawa. Zastosowanie założeń koncepcji derywacyjnej do rozstrzygania spraw z elementem unijnym prowadzi do konkluzji, że zarówno zjawisko rozczłonkowania (na poziomie syntaktycznym oraz treściowym), jak również kondensacja norm postępowania w przepisach prawnych przebiegać może w sposób krzyżowy pomiędzy aktami prawnymi ustanowionymi przez różnych prawodawców socjologicznych (faktycznych). Ponadto, analiza szczególnego typu unijnych przepisów bezpośrednio skutecznych, prima facie stanowiących źródło obowiązku normatywnego wyłącznie dla państw członkowskich, w świetle założeń koncepcji wykładni derywacyjnej uświadamia, że przepisy te stanowią w gruncie rzeczy modelową egzemplifikację zjawiska kondensacji elementów norm prawnych. Przeprowadzona analiza relacji zakresowych przepisów prawnych do norm postępowania wykazuje stosowalność koncepcji derywacyjnej w procesie rozstrzygania spraw z elementem unijnym. Koncepcja ta wyjaśnia szczególnie złożone problemy wykładni prawa w sprawach z elementem unijnym oraz dostarcza teorii i praktyce instrumentarium do ich rozwiązywania. Jej zastosowanie unaocznia jednocześnie złożoną strukturę systemu prawa, którą charakteryzuje zjawisko hybrydyzacji.
Resumo:
In this paper, a hierarchical video structure summarization approach using Laplacian Eigenmap is proposed, where a small set of reference frames is selected from the video sequence to form a reference subspace to measure the dissimilarity between two arbitrary frames. In the proposed summarization scheme, the shot-level key frames are first detected from the continuity of inter-frame dissimilarity, and the sub-shot level and scene level representative frames are then summarized by using K-mean clustering. The experiment is carried on both test videos and movies, and the results show that in comparison with a similar approach using latent semantic analysis, the proposed approach using Laplacian Eigenmap can achieve a better recall rate in keyframe detection, and gives an efficient hierarchical summarization at sub shot, shot and scene levels subsequently.
Resumo:
In this paper, a novel video-based multimodal biometric verification scheme using the subspace-based low-level feature fusion of face and speech is developed for specific speaker recognition for perceptual human--computer interaction (HCI). In the proposed scheme, human face is tracked and face pose is estimated to weight the detected facelike regions in successive frames, where ill-posed faces and false-positive detections are assigned with lower credit to enhance the accuracy. In the audio modality, mel-frequency cepstral coefficients are extracted for voice-based biometric verification. In the fusion step, features from both modalities are projected into nonlinear Laplacian Eigenmap subspace for multimodal speaker recognition and combined at low level. The proposed approach is tested on the video database of ten human subjects, and the results show that the proposed scheme can attain better accuracy in comparison with the conventional multimodal fusion using latent semantic analysis as well as the single-modality verifications. The experiment on MATLAB shows the potential of the proposed scheme to attain the real-time performance for perceptual HCI applications.
Resumo:
This paper demonstrates a potential application for latent semantic analysis and similar techniques in visualising the differences between two levels of knowledge about a risk issue. The HIV/AIDS risk issue will be examined and the semantic clusters of key words in a technical corpora derived from specific literature about HIV/AIDS will be compared with the semantic clusters of those in more general corpora. It is hoped that these comparisons will create a fast and efficient complementary approach to the articulation of mental models of risk issues that could be used to target possible inconsistencies between expert and lay mental models.
Resumo:
Dans ce mémoire, nous proposons l’étude des représentations sociales du politique dans la presse quotidienne. Notre objet d’étude est le sens de la nation au Québec dans une période historique où la notion idéologique de nation s’avère un cadre de référence en profonde mutation dans de nombreuses sociétés. Plus particulièrement, nous voulons nous situer au centre des tensions à propos de la représentation sociale nationale en prenant comme observatoire un travail idéologique fédéraliste par des Québécois, qui à la fois se posent comme promoteurs de la nation, et visent une intégration dans un autre espace national et juridique : le Canada. Les résultats de cette étude qualitative sont issus d’une analyse sémantique du discours éditorial du journal La Presse. Nous avons ainsi examiné les différentes catégories de connaissance mobilisées lors de l’évocation de l’espace national, ainsi que la façon dont elles sont organisées au sein du discours lors des deux périodes référendaires, soit en 1980 et 1995. C’est donc dans le cadre d’une sociologie de la connaissance journalistique que nous menons cette étude. Le discours social, à partir de l’étude des théories des représentations sociales et de la sociologie des contenus médiatiques, ne peut se considérer qu’à travers l’ensemble des relations sociales dont il est le produit. Nous nous attachons ici à définir d’une part les spécificités du discours éditorial, et d’autre part les différentes catégories de connaissances utilisées dans notre corpus qui font sens. On perçoit alors, grâce à une description diachronique, l’évolution des représentations sociales ayant a trait à l’espace national québécois entre les deux périodes étudiées. Après avoir défini ce dont on parle lorsqu’il est question de l’espace national, nous nous emploierons à analyser la façon dont ce discours est organisé. Ainsi, nous mettons en avant d’une part, les différentes formes discursives, rhétoriques et argumentatives, mises en place dans le but de persuader et de justifier l’action (le rejet des deux référendums, et l’adhésion aux promesses de renouvellement du fédéralisme), et d’autre part la logique discursive mobilisée consistant à placer la nation comme un objet politique rationnel ou non. En effet, le discours éditorial nous permet de mettre au jour une organisation cognitive de la connaissance, qui à quelques nuances près, est structurée de façon manichéenne entre le rationnel (l’éditorialiste, le fédéralisme, l’économique, l’universalisme, la raison de sens commun) et l’irrationnel (le souverainisme, ses dirigeants n’étant que des rêveurs et des passionnés), se plaçant dès lors dans un rapport de communication politique, plus proche de la propagande que de l’exemplarité réflexive que pose le discours éditorial.
Resumo:
Réalisé en association avec le Centre interuniversitaire de recherche sur la science et la technologie (CIRST).
L’identité en projets : ville, architecture et patrimoine. Analyse de concours à Québec et à Toronto
Resumo:
Dans un contexte de globalisation et de profusion des discours identitaires, la thèse examine le concept d’identité, ses définitions et ses usages dans les débats et les pratiques de la ville, de l’architecture et du patrimoine. Les interventions sur un bâtiment historique révèlent autant le rapport identitaire de la société avec son histoire que celui avec le monde contemporain. La recherche traite de concours d’architecture dans deux villes canadiennes qui aspirent à se positionner à l’échelle internationale, l’une focalisant sur l’aspect contemporain global et l’autre sur l’aspect historique et local. L’objectif de la recherche est d’une part de contribuer au dévoilement du processus de construction identitaire des villes contemporaines à travers les projets d’architecture. D’autre part, il s’agit d’analyser le processus d’identification et l’identité architecturale dans son rapport à l’histoire et à la contemporanéité dans la pratique au sein de bâtiments historiques. La ville devient un objet de communication, qui use de marketing urbain, pour augmenter sa visibilité. L’architecture devient un moyen de communication utilisé pour transmettre une identité visuelle. La méthodologie combine l’analyse des discours, ainsi que l’analyse de l’architecture et de sa représentation. Le choix du concours du Centre d'accueil et d'interprétation de la Place-Royale à Québec (1996) et de l’agrandissement du Musée royal d’Ontario (2001) à Toronto permet d’appréhender les différentes facettes du concept d’identité et de révéler les enjeux locaux et internationaux. Le fait qu’il s’agisse de concours donne accès à un corpus de discours qui comprend les programmes, les politiques de la ville, les présentations des architectes et la réception. L’histoire de chaque concours ainsi que l’analyse sémantique des discours de la commande éclairent le rapport entre les processus et les intentions et permettent de mettre en lumière les enjeux locaux. L’analyse des discours textuels et visuels des architectes dévoile le processus d’identification des projets, les différents types de référents impliqués ainsi que les stratégies de communication employées. L’analyse des projets rend compte des caractéristiques de l’identité de l’architecture contemporaine et son rapport avec le patrimoine. La recherche dévoile l’importance des discours et de la communication dans la construction identitaire des villes en amont des concours ainsi que le débat sociétal que la question pose. Durant le processus d’identification architecturale, le biais induit par la commande amène une emphase et une surenchère des discours historiques par les architectes dans le cas de Québec. Les projets proposés misent sur une mise en scène de la ville historique et du patrimoine et focalisent sur l’expérience visuelle des visiteurs. Dans le cas de Toronto, l’intérêt pour l’aspect global et spectaculaire dans la construction identitaire de la ville en amont du concours, génère un engouement pour une représentation attractive des projets et pour une architecture iconique.
Resumo:
We present a new approach to model and classify breast parenchymal tissue. Given a mammogram, first, we will discover the distribution of the different tissue densities in an unsupervised manner, and second, we will use this tissue distribution to perform the classification. We achieve this using a classifier based on local descriptors and probabilistic Latent Semantic Analysis (pLSA), a generative model from the statistical text literature. We studied the influence of different descriptors like texture and SIFT features at the classification stage showing that textons outperform SIFT in all cases. Moreover we demonstrate that pLSA automatically extracts meaningful latent aspects generating a compact tissue representation based on their densities, useful for discriminating on mammogram classification. We show the results of tissue classification over the MIAS and DDSM datasets. We compare our method with approaches that classified these same datasets showing a better performance of our proposal
Resumo:
We investigate whether dimensionality reduction using a latent generative model is beneficial for the task of weakly supervised scene classification. In detail, we are given a set of labeled images of scenes (for example, coast, forest, city, river, etc.), and our objective is to classify a new image into one of these categories. Our approach consists of first discovering latent ";topics"; using probabilistic Latent Semantic Analysis (pLSA), a generative model from the statistical text literature here applied to a bag of visual words representation for each image, and subsequently, training a multiway classifier on the topic distribution vector for each image. We compare this approach to that of representing each image by a bag of visual words vector directly and training a multiway classifier on these vectors. To this end, we introduce a novel vocabulary using dense color SIFT descriptors and then investigate the classification performance under changes in the size of the visual vocabulary, the number of latent topics learned, and the type of discriminative classifier used (k-nearest neighbor or SVM). We achieve superior classification performance to recent publications that have used a bag of visual word representation, in all cases, using the authors' own data sets and testing protocols. We also investigate the gain in adding spatial information. We show applications to image retrieval with relevance feedback and to scene classification in videos