872 resultados para Thematic Text Analysis
Resumo:
There are numerous text documents available in electronic form. More and more are becoming available every day. Such documents represent a massive amount of information that is easily accessible. Seeking value in this huge collection requires organization; much of the work of organizing documents can be automated through text classification. The accuracy and our understanding of such systems greatly influences their usefulness. In this paper, we seek 1) to advance the understanding of commonly used text classification techniques, and 2) through that understanding, improve the tools that are available for text classification. We begin by clarifying the assumptions made in the derivation of Naive Bayes, noting basic properties and proposing ways for its extension and improvement. Next, we investigate the quality of Naive Bayes parameter estimates and their impact on classification. Our analysis leads to a theorem which gives an explanation for the improvements that can be found in multiclass classification with Naive Bayes using Error-Correcting Output Codes. We use experimental evidence on two commonly-used data sets to exhibit an application of the theorem. Finally, we show fundamental flaws in a commonly-used feature selection algorithm and develop a statistics-based framework for text feature selection. Greater understanding of Naive Bayes and the properties of text allows us to make better use of it in text classification.
Resumo:
Behaviour Analysis is a distinct philospophy of science. Individuals new to the approach often find difficulty in understanding the basic principles involved. This presentation, aimed at Final Year undergraduates, is designed to provide an introduction to the principles of operant conditioning (e.g., reinforcement, punishment, and extinction), making clear that these words describe functional, rather than structural, relations.
Resumo:
What are fundamental entities in social networks and what information is contained in social graphs? We will discuss some selected concepts in social network analysis, such as one- and two mode networks, prestige and centrality, and cliques, clans and clubs. Readings: Web tool predicts election results and stock prices, J. Palmer, New Scientist, 07 February (2008) [Protected Access] Optional: Social Network Analysis, Methods and Applications, S. Wasserman and K. Faust (1994)
Resumo:
What are ways of searching in graphs? In this class, we will discuss basics of link analysis, including Google's PageRank algorithm as an example. Readings: The PageRank Citation Ranking: Bringing Order to the Web, L. Page and S. Brin and R. Motwani and T. Winograd (1998) Stanford Tecnical Report
Resumo:
Exercises and solutions in LaTex
Resumo:
Linux commands that are generally useful for analyzing data; it is very easy to reduce phenomena such as links, nodes, URLs or downloads, to multiply repeating identifiers and then sorting and counting appearances.
Resumo:
L’objectiu d’aquest estudi és presentar una proposta de lectura i producció textual, el Text de Divulgació Científica, tot fent servir una seqüència didàctica, per tal de preparar l’alumne per a la lectura i anàlisi de l’estructura textual que presenta aquest gènere discursiu, així com despertar-li l’interès per la recerca. D’aquesta manera, l’alumne comptarà amb instruments per a la producció escrita del gènere discursiu del text de divulgació científica. La proposta es basa en els treballs d’autors de lingüística textual i anàlisi del discurs.
Resumo:
S'han estudiat els efectes dels factors ambientals sobre el perífiton dels sistemes lenític fluctuants del aiguamolls de l'Empordà. L'estudi s'ha realitzat als tres nivells d'integració: nivell d'ecosistema considerant el rol del perífiton envers els altres productors primaris; a nivell de comunitat, estudiant la composició específica de les diatomees i a nivell de població estudiant la plasticitat fenotípica d'una espècie de diatomea (Nitzschia frustulum). A nivell d'ecosistema s'observa que els factors que afavoreixen el predomini dels diferents tipus de productors primaris (perífiton, fitoplàncton i macròfits) són la renovació i el grau d'eutròfia de l'aigua. A nivell de comunitat els factors determinants en la composició i distribució de les espècies de diatomees són els gradients confinament-inundació així com la productivitat del sistema. En funció d'aquest factors s'han establert 5 associacions de diatomees. A nivell de població es demostra que tant la salinitat, com la relació N : P a l'aigua com el moviment de l'aigua afecten la morfologia i ultraestructura de la valva de N. frustulum. De forma interessant s'observa que la salinitat, considerada com a factor individual, afecta N. frustulum a nivell poblacional provocant-li modificacions en la morfologia de la valva, per en canvi, no afecta a nivell de comunitat, ja que totes les espècies de diatomees presents en ambients de salinitat fluctuant són eurihalines.
Resumo:
La present tesi doctoral estudiarà la temàtica de la credibilitat del relat que els menors presumptament abusats expressen dels fets, en base a l'anàlisi del contingut del seu relat. Fins al moment, la prova que s'utilitza, anomenada CBCA és fonamentalment d'orientació cognitiva, desconsiderant del seu anàlisi, els possibles criteris psicosocials que els menors expressen. Així, la present tesi, a més d'estudiar la prova CBCA, proposa l'utilització d'indicadors psicosocials que, efectivament, són expressats en el relat dels presumptes fets i que, en base a l'anàlisi mètric pertinent, ens permeten presentar-los com a vàlids per a diferenciar relats creíbles, d'aquells relats inventats o falsejats. La part teòrica de la tesi, presenta un exhaustiu recull de les recerques més significatives sobre les següents temàtiques: la credibilitat, l'instrument CBCA, els factors que influeixen en el testimoni infantil i els indicadors psicosocials de credibilitat. La part empírica, en base a un disseny observacional-correlacional i amb una mostra de casos reals treballats a la seu de l'Equip d'Assesorament del Jutjats de Girona, durant els anys 2000-2001, presenta l'estudi i anàlisi del CBCA, criticant les limitacions importants que presenta aquest instrument i, naturalment, proposant l'incorporació dels indicadors psicosocials com a criteris per la diferenciació dels relats. Es realitza un complert anàlisi mètric i es comprova l'increment de la qualitat psicomètrica (fiabilitat, validesa, discriminació de ítems) del nou instrument proposat amb els indicadors psicosocials presentats: el secret, relació dependent-envolvent, progressió en l'abús, normes de conducta, símptomes psicològics, favors i regals.
Resumo:
Interactions between electrons determine the structure and properties of matter from molecules to solids. Therefore, the understanding of the electronic structure of molecules will enable us to extract relevant chemical information. In the first part of this thesis, we focus our attention on the analysis of chemical bonding by means of the Electron Localization Function (ELF) and the Domain-Averaged Fermi Hole analysis (DAFH). In the second part, we assess the performance of some indicators of aromaticity by analyzing their advantages and drawbacks. We propose a series of tests based on well-known aromaticity trends that can be applied to evaluate the aromaticity of current and future indicators of aromaticity in both organic and inorganic species. Moreover, we investigate the nature of electron delocalization in both aromatic and antiaromatic systems in the light of Hückel’s (4n + 2) rule. Finally, we analyze the phenomenon of multiple aromaticity in all-metal clusters.
Resumo:
La present tesi proposa una metodología per a la simulació probabilística de la fallada de la matriu en materials compòsits reforçats amb fibres de carboni, basant-se en l'anàlisi de la distribució aleatòria de les fibres. En els primers capítols es revisa l'estat de l'art sobre modelització matemàtica de materials aleatoris, càlcul de propietats efectives i criteris de fallada transversal en materials compòsits. El primer pas en la metodologia proposada és la definició de la determinació del tamany mínim d'un Element de Volum Representatiu Estadístic (SRVE) . Aquesta determinació es du a terme analitzant el volum de fibra, les propietats elàstiques efectives, la condició de Hill, els estadístics de les components de tensió i defromació, la funció de densitat de probabilitat i les funcions estadístiques de distància entre fibres de models d'elements de la microestructura, de diferent tamany. Un cop s'ha determinat aquest tamany mínim, es comparen un model periòdic i un model aleatori, per constatar la magnitud de les diferències que s'hi observen. Es defineix, també, una metodologia per a l'anàlisi estadístic de la distribució de la fibra en el compòsit, a partir d'imatges digitals de la secció transversal. Aquest anàlisi s'aplica a quatre materials diferents. Finalment, es proposa un mètode computacional de dues escales per a simular la fallada transversal de làmines unidireccionals, que permet obtenir funcions de densitat de probabilitat per a les variables mecàniques. Es descriuen algunes aplicacions i possibilitats d'aquest mètode i es comparen els resultats obtinguts de la simulació amb valors experimentals.
Variable mixed-mode delamination in composite laminates under fatigue conditions: testing & analysis
Resumo:
La majoria de les fallades en elements estructurals són degudes a càrrega per fatiga. En conseqüència, la fatiga mecànica és un factor clau per al disseny d'elements mecànics. En el cas de materials compòsits laminats, el procés de fallada per fatiga inclou diferents mecanismes de dany que resulten en la degradació del material. Un dels mecanismes de dany més importants és la delaminació entre capes del laminat. En el cas de components aeronàutics, les plaques de composit estan exposades a impactes i les delaminacions apareixen facilment en un laminat després d'un impacte. Molts components fets de compòsit tenen formes corbes, superposició de capes i capes amb diferents orientacions que fan que la delaminació es propagui en un mode mixt que depen de la grandària de la delaminació. És a dir, les delaminacions generalment es propaguen en mode mixt variable. És per això que és important desenvolupar nous mètodes per caracteritzar el creixement subcrític en mode mixt per fatiga de les delaminacions. El principal objectiu d'aquest treball és la caracterització del creixement en mode mixt variable de les delaminacions en compòsits laminats per efecte de càrregues a fatiga. Amb aquest fi, es proposa un nou model per al creixement per fatiga de la delaminació en mode mixt. Contràriament als models ja existents, el model que es proposa es formula d'acord a la variació no-monotònica dels paràmetres de propagació amb el mode mixt observada en diferents resultats experimentals. A més, es du a terme un anàlisi de l'assaig mixed-mode end load split (MMELS), la característica més important del qual és la variació del mode mixt a mesura que la delaminació creix. Per a aquest anàlisi, es tenen em compte dos mètodes teòrics presents en la literatura. No obstant, les expressions resultants per l'assaig MMELS no són equivalents i les diferències entre els dos mètodes poden ser importants, fins a 50 vegades. Per aquest motiu, en aquest treball es porta a terme un anàlisi alternatiu més acurat del MMELS per tal d'establir una comparació. Aquest anàlisi alternatiu es basa en el mètode dels elements finits i virtual crack closure technique (VCCT). D'aquest anàlisi en resulten importants aspectes a considerar per a la bona caracterització de materials utilitzant l'assaig MMELS. Durant l'estudi s'ha dissenyat i construït un utillatge per l'assaig MMELS. Per a la caracterització experimental de la propagació per fatiga de delaminacions en mode mixt variable s'utilitzen diferents provetes de laminats carboni/epoxy essencialment unidireccionals. També es du a terme un anàlisi fractogràfic d'algunes de les superfícies de fractura per delaminació. Els resultats experimentals són comparats amb les prediccions del model proposat per la propagació per fatiga d'esquerdes interlaminars.
Resumo:
En la literatura sobre mecànica quàntica és freqüent trobar descriptors basats en la densitat de parells o la densitat electrònica, amb un èxit divers segons les aplicacions que atenyin. Per tal de que tingui sentit químic un descriptor ha de donar la definició d'un àtom en una molècula, o ésser capaç d'identificar regions de l'espai molecular associades amb algun concepte químic (com pot ser un parell solitari o zona d'enllaç, entre d'altres). En aquesta línia, s'han proposat diversos esquemes de partició: la teoria d'àtoms en molècules (AIM), la funció de localització electrònica (ELF), les cel·les de Voroni, els àtoms de Hirshfeld, els àtoms difusos, etc. L'objectiu d'aquesta tesi és explorar descriptors de la densitat basats en particions de l'espai molecular del tipus AIM, ELF o àtoms difusos, analitzar els descriptors existents amb diferents nivells de teoria, proposar nous descriptors d'aromaticitat, així com estudiar l'habilitat de totes aquestes eines per discernir entre diferents mecanismes de reacció.