757 resultados para sentence-tokened
Resumo:
FinnWordNet is a wordnet for Finnish that complies with the format of the Princeton WordNet (PWN) (Fellbaum, 1998). It was built by translating the PrincetonWordNet 3.0 synsets into Finnish by human translators. It is open source and contains 117000 synsets. The Finnish translations were inserted into the PWN structure resulting in a bilingual lexical database. In natural language processing (NLP), wordnets have been used for infusing computers with semantic knowledge assuming that humans already have a sufficient amount of this knowledge. In this paper we present a case study of using wordnets as an electronic dictionary. We tested whether native Finnish speakers benefit from using a wordnet while completing English sentence completion tasks. We found that using either an English wordnet or a bilingual English Finnish wordnet significantly improves performance in the task. This should be taken into account when setting standards and comparing human and computer performance on these tasks.
Resumo:
Query focused summarization is the task of producing a compressed text of original set of documents based on a query. Documents can be viewed as graph with sentences as nodes and edges can be added based on sentence similarity. Graph based ranking algorithms which use 'Biased random surfer model' like topic-sensitive LexRank have been successfully applied to query focused summarization. In these algorithms, random walk will be biased towards the sentences which contain query relevant words. Specifically, it is assumed that random surfer knows the query relevance score of the sentence to where he jumps. However, neighbourhood information of the sentence to where he jumps is completely ignored. In this paper, we propose look-ahead version of topic-sensitive LexRank. We assume that random surfer not only knows the query relevance of the sentence to where he jumps but he can also look N-step ahead from that sentence to find query relevance scores of future set of sentences. Using this look ahead information, we figure out the sentences which are indirectly related to the query by looking at number of hops to reach a sentence which has query relevant words. Then we make the random walk biased towards even to the indirect query relevant sentences along with the sentences which have query relevant words. Experimental results show 20.2% increase in ROUGE-2 score compared to topic-sensitive LexRank on DUC 2007 data set. Further, our system outperforms best systems in DUC 2006 and results are comparable to state of the art systems.
Resumo:
USC-TIMIT is an extensive database of multimodal speech production data, developed to complement existing resources available to the speech research community and with the intention of being continuously refined and augmented. The database currently includes real-time magnetic resonance imaging data from five male and five female speakers of American English. Electromagnetic articulography data have also been presently collected from four of these speakers. The two modalities were recorded in two independent sessions while the subjects produced the same 460 sentence corpus used previously in the MOCHA-TIMIT database. In both cases the audio signal was recorded and synchronized with the articulatory data. The database and companion software are freely available to the research community. (C) 2014 Acoustical Society of America.
Resumo:
This paper describes the development of the CU-HTK Mandarin Speech-To-Text (STT) system and assesses its performance as part of a transcription-translation pipeline which converts broadcast Mandarin audio into English text. Recent improvements to the STT system are described and these give Character Error Rate (CER) gains of 14.3% absolute for a Broadcast Conversation (BC) task and 5.1% absolute for a Broadcast News (BN) task. The output of these STT systems is then post-processed, so that it consists of sentence-like segments, and translated into English text using a Statistical Machine Translation (SMT) system. The performance of the transcription-translation pipeline is evaluated using the Translation Edit Rate (TER) and BLEU metrics. It is shown that improving both the STT system and the post-STT segmentations can lower the TER scores by up to 5.3% absolute and increase the BLEU scores by up to 2.7% absolute. © 2007 IEEE.
Resumo:
Resumen: La prisión preventiva es la medida cautelar más grave e intensa del proceso penal, en tanto importa la coactiva privación de la libertad personal del imputado. Se trata de un instituto problemático, que plantea un contrapunto particularmente dilemático con la presunción de inocencia. Posee un fundamento constitucional, directamente vinculado con la necesidad de asegurar, en la medida de lo posible, la realización del derecho penal material. Aunque la regla general es que durante el desarrollo del proceso penal el imputado debe permanecer en libertad, no puede negarse la existencia de ciertos supuestos legitimadores de la prisión preventiva. La realidad social y la necesidad de respuestas racionales a los fenómenos de la inseguridad y de la delincuencia violenta han revelado serias fisuras en el paradigma según el cual los únicos supuestos legitimadores son los llamados peligros procesales de fuga o entorpecimiento de la investigación. Surgen así como datos que deben ser también necesariamente tenidos en cuenta para la detención cautelar tanto la especial gravedad del delito cometido y su relación con la preservación del orden público, como la existencia de un peligro de reiteración delictiva constatable. Estos dos últimos presupuestos legitimadores de la prisión preventiva cobran independencia conceptual de los primeramente mencionados. Además, cuando la prisión preventiva se funda en la especial gravedad del delito o en el peligro de reiteración delictiva, se transforma, aunque sin mutar su esencia, en un instrumento más en las políticas de seguridad dirigidas a combatir el fenómeno de la delincuencia.
Resumo:
Resumen: Del mismo modo como hace no muchos años la ciudadanía europea se conmovió frente al planteo sobre las raíces cristianas en el momento de redactar la Constitución de la Unión Europea, dando lugar a numerosos discursos sobre la necesidad de no olvidar la verdadera cultura y enseñanza que había ennoblecido al Viejo Mundo, hace casi un año una sentencia proveniente de la Corte de Estrasburgo aplicable al Estado italiano, el caso “Lautsi c. Italy”, ha generado numerosas reacciones en diferentes sectores intelectuales permitiendo el desarrollo de notables argumentos que han intentado desenmascarar los verdaderos rostros que se encontraban velados detrás de los lugares comunes de la argumentación jurídico-política de los últimos dos siglos, especialmente los de laicidad, neutralidad, igualdad y libertad. De este modo la radicalización y desarrollo llevado al extremo de las premisas de la Ilustración ha mostrado su real fisonomía y consecuencia. Para tal propósito el análisis se concentra en la apelación a la Grande Chambre presentada por el Estado italiano y los sucesivos aportes provenientes de la doctrina europea, especialmente a través de valiosos Congresos y Jornadas dedicados a la problemática.
Resumo:
[EU]Ahots teknologiaren garapenaren gorakadak, hizketan minusbaliotasunen bat duten pertsonen eguneroko bizitza ahalik eta erosoena egitearen saiakerarekin batera, Aholab ikerkuntza taldea ZURE TTS proiektua garatzera eraman du, proiektuaren helburua ahots minusbaliotasun batez jota dauden edo ahotsa guztiz galdu duten pertsonentzat hizketa sintetizadore bat garatzea delarik. Ahots sintetizatua lortzeko, ahots emaileek grabatutako esaldiez osatutako ahots naturaleko corpus bat hartzen da oinarritzat. Sintesi prozesua ahalik eta kalitate altuenekoa izateko, nahitaezkoa da datu basean gordeta dagoen ahotsa egokia izatea, eta horregatik, burutuko den proiektuak grabazioen edukiaren egiaztatzaile bat garatzea du helburu, erabiltzaileak irakurritako esaldiak zuzenak diren edo ez egiaztatzen dituena, horrela ahots sintetizatuaren kalitatea bermatuz.
Resumo:
[EU] Artikulu honetan, gaur-gaurkoa dugun gai bat aztertzen da : Udalerri Euskaldunen Mankomunitatea legezkontrakotzat. jotzen duen Epaia. UEMAren oinarri juridikoak aztertu ondoren, Mankomunitate horren ibilbideak izan dituen eragozpenez arduratzen da lan hau. Egilearen ustez, Udalerri Euskaldunen Mankomunitateak bere ibilbidean aurkitu duen handicap-ik nabarmenena, legearen babes falta izan da, eta Auzitegi Goreneko Epaia, bai formaz, bai edukiaren aldetik, oinarri gabekotzat jo behar dela dio.
Resumo:
O termo Teoria da Mente diz respeito à habilidade que os seres humanos adquirem de compreender seus próprios estados mentais e os dos outros e predizer ações e comportamentos dentro de uma interação social. As principais questões da pesquisa em Teoria da Mente são: determinar qual o tipo de conhecimento que sustenta essa habilidade, qual sua origem e desenvolvimento e em que momento se manifesta. (Astington e Gopnik, 1991). Ao levar em consideração que a língua pode ser vista como instrumento da cognição (Spelke, 2003), através da qual o falante adquire suporte para o planejamento de ações, contribuindo para o desempenho de tarefas cognitivas complexas (Corrêa, 2006), de Villiers (2004, 2005, 2007 e subsequentes), no que diz respeito à Teoria da Mente, argumenta que o seu desenvolvimento depende do desenvolvimento linguístico, estando diretamente ligado à aquisição de verbos de estado mental, como pensar, por exemplo, pelo fato de que esses verbos subcategorizam uma sentença encaixada. Para ela, o domínio dessa estrutura possibilita que o raciocínio de crenças falsas da Teoria da Mente seja efetivamente realizado. A presente dissertação tem como objetivo verificar em que medida há uma influência direta e necessária da linguagem para a condução de tarefas de Teoria da Mente. Para tanto, focamos nossa atenção em pessoas que estão, por algum motivo, destituídas parcialmente da capacidade linguística, mas que mantêm intacta a capacidade cognitiva, os afásicos. Por meio de uma pesquisa realizada com dois pacientes afásicos de Broca, selecionados pelos critérios clássicos, procuramos entender se a habilidade de predizer ações está intacta nestes pacientes ou se tal habilidade foi perdida, assim como a linguagem. Para tanto, aplicamos dois testes de crença falsa em Teoria da Mente. O primeiro utilizou-se de suporte verbal, uma narração de eventos e expectativas dos personagens envolvidos. A pergunta-teste foi manipulada em função do grau de complexidade por meio do cruzamento de dois fatores: sentenças simples ou complexas e QU-in situ ou movido. O segundo teste seguiu o padrão não-verbal, sendo constituído de uma sequência de imagens, sendo que o sujeito deveria decidir entre duas últimas imagens apresentadas, aquela que coerentemente finalizava a história. Uma vez que houvesse influência direta da linguagem na condução de tarefas de Teoria da Mente, esperar-se-ia que a dificuldade no teste verbal refletisse o grau de complexidade das questões apresentadas. Adicionalmente, o desempenho no teste não-verbal também deveria ser insatisfatório, dado o comprometimento linguístico apresentado pelos sujeitos testados. Para o primeiro teste, o desempenho dos pacientes foi aleatório e inferior ao do grupo controle, já para o segundo teste, o aproveitamento foi de 100%. Em geral, os resultados sugerem que o raciocínio de crenças falsas em Teoria da Mente é alcançado por esses sujeitos, haja vista o desempenho plenamente satisfatório no teste não-verbal. Os resultados do teste verbal, por outro lado, atestam tão somente a dificuldade linguística característica dessa população. Desse modo, conclui-se que uma vez desenvolvida a habilidade em Teoria da Mente, esta permanece intacta na mente destes pacientes, mesmo que destituídos parcialmente da capacidade linguística
Resumo:
Oração sem sujeito é toda e qualquer oração destituída de SN sujeito, exceto nos casos em que tal SN encontra-se em elipse. Sua manifestação na língua pode se dar tanto em termos pessoais quanto impessoais. Estas incluem ocorrências essenciais, aqui chamadas de fenomenológicas e acidentais, denominadas impessoalizadas. Já aquelas se apresentam nos casos de indeterminação de agente por omissão do SN sujeito, tradicionalmente alcunhados casos de sujeito indeterminado e por meio do processo de ergativização em sua versão secundária, aquele que atua sobre verbos não causativos e tem sido porta de entrada à concretização de orações destituídas de SN sujeito no português brasileiro. Objetivamos neste trabalho a descrição de todas as estruturas apontadas, em termos de seus comportamentos morfossintáticos na língua, pois compreendemos que descrever a oração sem sujeito portuguesa é identificar contextos morfossintáticos de dispensa, em distintos graus, do SN sujeito. Para tanto, valemo-nos de um enfoque prototípico da língua, através do qual dialogamos com a natureza escalar de nosso objeto de estudo
Resumo:
Muitos trabalhos têm buscado compreender como se dá o processamento da concordância entre sujeito e verbo e investigar fatores que possam influenciar a produção correta da concordância, gerando os chamados erros de concordância verbal. Franck et al (2010) realizaram pesquisa na língua francesa e encontraram interferência devido a elemento movido sintaticamente na produção da concordância verbal. Se faz necessário investigar se o fenômeno envolvendo movimento é o mesmo em sentenças do português brasileiro. Sendo assim, nosso objetivo foi investigar uma possível interferência de cópia de número plural entre sujeito e verbo (em relação de concordância) de elemento movido sintaticamente em construção de árvore sintática do PB, observando a origem do erro e tentando mostrar se há autonomia do formulador sintático. Ao propormos o diálogo entre Teoria Linguística e Psicolinguística utilizando o Programa Minimalista, versão mais atual do Gerativismo de Chomsky, a fim de observar a derivação sintática e o processamento das sentenças, acreditamos que o estudo de formulação sintática e um olhar por meio de um modelo de processamento, que abarquem tanto a formulação como a produção, esclareceriam a nós pontos importantes sobre o funcionamento da concordância verbal. A nossa hipótese é a de que um erro de concordância verbal não ocorra devido ao formulador sintático em estruturas de PB, buscaremos respostas para isso no modelo MIMC (Modelo Integrado Misto da Computação On-Line) (Corrêa & Augusto, 2007). No entanto, por outro lado, se um erro de concordância ocorre, tentaremos encontrar uma outra explicação que não proveniente da sintaxe, tal como, por exemplo, devido a aspecto de ordem morfofonológica e devido a tamanho da sentença, como colocado pelo modelo PMP (Modelo de Processamento Monitorado por parser (Rodrigues, 2006). À medida que realizamos dois experimentos com sentenças declarativa e interrogativa com o movimento do elemento DP e QU, os resultados mostram que o tamanho da sentença e fatores morfofonológicos podem produzir interferência devido ao tipo de elemento movido. Os resultados cedem terreno para assumir um formulador sintático autônomo e abre caminho para próximas investigações sobre o processamento da concordância verbal e possíveis interferências durante a sua produção
Resumo:
Alguns estudos na área da Psicolinguística tratam sobre a interrupção da forma natural da fluência da fala. Essas suspensões são denominadas disfluências e podem ser de variados tipos como, por exemplo, repetições, substituições ou pausas. Entre alguns trabalhos sobre disfluências, destaca-se o realizado por Jaeger (2005), que tratou da omissão do relativizador that na língua inglesa e a possibilidade desse fator ser responsável pela criação de disfluências. Nessa mesma linha, objetivamos analisar as disfluências na camada dos relativizadores camada CP em língua portuguesa brasileira. Para isso, tomaram-se dados obtidos por Corrêa et al (2008) sobre produção de orações relativas. Nesse estudo, os autores, buscando verificar a complexidade da formulação de orações relativas, manipularam duas condições: plenamente planejada que reduziria a carga de processamento e, consequentemente, levaria à maior produção de orações relativas padrões e parcialmente planejada a qual aumentaria a carga de processamento e, consequentemente, maior produção de orações relativas cortadoras e resumptivas. Diante disso, sabendo que o planejamento de estruturas mais complexas pode ser um fator que gere mais sentenças disfluentes, resta saber em qual das condições, estipuladas por Corrêa et al (2008), haveria maior caso de disfluências. Acreditamos que a condição parcialmente planejada resultaria mais casos de disfluências em comparação à condição inteiramente planejada. Para verificação de tal hipótese, a presente pesquisa focou suas atenções no banco de dados de Corrêa et al (2008). Após determinados critérios, privilegiamos sentenças de orações relativas genitivas, orações relativas de objeto indireto funcional e orações relativas de objeto indireto lexical, pois tais seriam construções sintáticas mais complexas e passíveis de terem mais casos de disfluências. Identificadas e quantificadas todas as falas de interesse, criamos tabelas para melhor visualização das disfluências em localizações específicas na sentença como, por exemplo, antes da oração relativa (AOR), na oração relativa (NAOR) e depois da oração relativa (DPOR). Com tais dados analisados, verificamos que eles corroboravam a hipótese levantada: na condição parcialmente planejada há mais casos de disfluências do que na condição inteiramente planejada, principalmente quando se é focalizada a localização NAOR. Entre os principais resultados, percebemos que as disfluências do tipo pausas preenchidas aparecem em grande quantidade na localização NAOR, fator que revela uma característica especial da oração relativa. Essa disfluência, nesse trecho da sentença, revela que os falantes não somente fazem uma procura lexical, como também, um planejamento discursivo. Tais resultados nos motivaram a pensar em outras determinadas situações de pesquisa como, por exemplo, a análise das disfluências em sentenças de voz passiva
Resumo:
[ES]El presente Trabajo de Fin de Grado analiza el tratamiento penal de los sujetos imputables peligrosos que mantienen la peligrosidad criminal tras el cumplimiento de la pena de prisión. De esta manera, se investiga la regulación jurídica española dirigida a este colectivo, poniendo de manifiesto que hasta la entrada en vigor de la Ley Orgánica 5/2010 de reforma del Código Penal no había prevista ninguna medida de seguridad enfocada a este grupo específico y concluyendo que la medida de “libertad vigilada” introducida en dicha reforma no es del todo efectiva para alcanzar la reinserción del reo. Por todo ello, se argumenta que la política criminal llevada a cabo en los últimos años ha llevado la seguridad a un extremo tal que no se han podido garantizar del todo los derechos individuales del colectivo anteriormente mencionado. Asimismo, se investiga la “custodia de seguridad” vigente en la regulación alemana, haciendo notoria la importancia de la seguridad e inocuización. En síntesis, se estudia si el delincuente ha quedado subordinado al orden jurídico y a la seguridad, esclareciendo si han sido respetados los principios y garantías inherentes a un Estado Social y Democrático de Derecho.
Resumo:
Este trabalho aproxima as contribuições da teoria das representações sociais e dos estudos em memória social para a compreensão do campo religioso, especificamente o Espiritismo, reconhecendo a importância da recordação de personalidades para a dinâmica religiosa. Esta pesquisa objetiva analisar o conteúdo da representação social de perfeição, o conteúdo e estrutura da memória de personalidades do Espiritismo e a relação entre ambos. Trata-se de estudo descritivo, desenvolvido em duas etapas. Participaram 75 participantes auto-declarados espíritas - 38 na primeira etapa e 37 na segunda, sendo entrevistados 24 desses. Os participantes, em média, possuíam 37,3 anos de idade e 16,7 anos como espíritas. Na primeira fase aplicou-se, através da Internet, a técnica de evocações livres com o termo indutor espíritos superiores, na qual os participantes respondiam que pessoas se associavam ao termo. Na segunda, prosseguiu-se com as evocações livres e questionário, para caracterização dos participantes. A partir das doze personalidades mais lembradas, realizou-se entrevista semi-estruturada, com questões sobre características, virtudes, lembranças, hierarquia das personalidades, e questões sobre o significado da perfeição e como alcançá-la. Os dados das evocações foram analisados através das técnicas do quadro de quatro casas e construção de árvore máxima de similitude. As entrevistas foram analisadas mediante análise categorial temática. Assim, verificou-se que as personalidades mais recordadas foram: Chico Xavier, Jesus, Allan Kardec, Emmanuel, Bezerra de Menezes, Madre Teresa de Calcutá, Joanna de Ângelis, Gandhi, André Luiz, Francisco de Assis, Maria de Nazaré e Divaldo P. Franco. A representação social de perfeição foi expressa, de modo simplificado, na sentença: um caminho, difícil e longo, em que o ser humano sai da sua condição de inferioridade para a perfeição, através do conhecimento (proveniente do trabalho, do estudo e do auto-conhecimento), livrando-se do seu egoísmo e expressando o amor, tal como demonstrado e vivido por Jesus. Verificou-se, ainda, que essas memórias se organizam, principalmente, em dois modelos de valores complementares no Espiritismo: 1) conhecimento, inteligência, razão, estudo, livro e 2) amor, vivência, fé, trabalho, exemplo. Eles se constituem nas duas condições essenciais para se alcançar essa perfeição. O primeiro modelo está principalmente personificado na figura de Allan Kardec e o segundo, em Jesus. Nesse sentido, o Espiritismo opera na mente dos fiéis, uma síntese entre ambos os modelos, tendo em Chico Xavier a personificação dessa síntese, constituindo-se como tipo ideal de espírita.
Resumo:
We consider the quanti fied constraint satisfaction problem (QCSP) which is to decide, given a structure and a first-order sentence (not assumed here to be in prenex form) built from conjunction and quanti fication, whether or not the sentence is true on the structure. We present a proof system for certifying the falsity of QCSP instances and develop its basic theory; for instance, we provide an algorithmic interpretation of its behavior. Our proof system places the established Q-resolution proof system in a broader context, and also allows us to derive QCSP tractability results.