357 resultados para Indexació automàtica
Resumo:
The most adequate approach for benchmarking web accessibility is manual expert evaluation supplemented by automatic analysis tools. But manual evaluation has a high cost and is impractical to be applied on large websites. In reality, there is no choice but to rely on automated tools when reviewing large web sites for accessibility. The question is: to what extent the results from automatic evaluation of a web site and individual web pages can be used as an approximation for manual results? This paper presents the initial results of an investigation aimed at answering this question. He have performed both manual and automatic evaluations of the accessibility of web pages of two sites and we have compared the results. In our data set automatically retrieved results could most definitely be used as an approximation manual evaluation results.
Resumo:
This documents sums up a projectaimed at building a new web interfaceto the Apertium machine translationplatform, including pre-editing andpost-editing environments. It containsa description of the accomplished workon this project, as well as an overviewof possible evolutions.
Resumo:
This article describes the developmentof an Open Source shallow-transfer machine translation system from Czech to Polish in theApertium platform. It gives details ofthe methods and resources used in contructingthe system. Although the resulting system has quite a high error rate, it is still competitive with other systems.
Resumo:
Extensible Dependency Grammar (XDG; Debusmann, 2007) is a flexible, modular dependency grammarframework in which sentence analyses consist of multigraphs and processing takes the form of constraint satisfaction. This paper shows how XDGlends itself to grammar-driven machine translation and introduces the machinery necessary for synchronous XDG. Since the approach relies on a shared semantics, it resembles interlingua MT.It differs in that there are no separateanalysis and generation phases. Rather, translation consists of the simultaneousanalysis and generation of a single source-target sentence.
Resumo:
This paper proposes to enrich RBMTdictionaries with Named Entities(NEs) automatically acquired fromWikipedia. The method is appliedto the Apertium English-Spanishsystem and its performance comparedto that of Apertium with and withouthandtagged NEs. The system withautomatic NEs outperforms the onewithout NEs, while results vary whencompared to a system with handtaggedNEs (results are comparable forSpanish to English but slightly worstfor English to Spanish). Apart fromthat, adding automatic NEs contributesto decreasing the amount of unknownterms by more than 10%.
Resumo:
There are a number of morphological analysers for Polish. Most of these, however, are non-free resources. What is more, different analysers employ different tagsets and tokenisation strategies. This situation calls for a simpleand universal framework to join different sources of morphological information, including the existing resources as well as user-provided dictionaries. We present such a configurable framework that allows to write simple configuration files that define tokenisation strategies and the behaviour of morphologicalanalysers, including simple tagset conversion.
Resumo:
This paper discusses the qualitativecomparative evaluation performed on theresults of two machine translation systemswith different approaches to the processing ofmulti-word units. It proposes a solution forovercoming the difficulties multi-word unitspresent to machine translation by adopting amethodology that combines the lexicongrammar approach with OpenLogos ontologyand semantico-syntactic rules. The paper alsodiscusses the importance of a qualitativeevaluation metrics to correctly evaluate theperformance of machine translation engineswith regards to multi-word units.
Resumo:
We describe a series of experiments in which we start with English to French and English to Japanese versions of an Open Source rule-based speech translation system for a medical domain, and bootstrap correspondign statistical systems. Comparative evaluation reveals that the rule-based systems are still significantly better than the statistical ones, despite the fact that considerable effort has been invested in tuning both the recognition and translation components; also, a hybrid system only marginally improved recall at the cost of a los in precision. The result suggests that rule-based architectures may still be preferable to statistical ones for safety-critical speech translation tasks.
Resumo:
Softcatalà is a non-profit associationcreated more than 10 years ago to fightthe marginalisation of the Catalan languagein information and communicationtechnologies. It has led the localisationof many applications and thecreation of a website which allows itsusers to translate texts between Spanishand Catalan using an external closed-sourcetranslation engine. Recently,the closed-source translation back-endhas been replaced by a free/open-sourcesolution completely managed by Softcatalà: the Apertium machine translationplatform and the ScaleMT web serviceframework. Thanks to the opennessof the new solution, it is possibleto take advantage of the huge amount ofusers of the Softcatalà translation serviceto improve it, using a series ofmethods presented in this paper. In addition,a study of the translations requestedby the users has been carriedout, and it shows that the translationback-end change has not affected theusage patterns.
Resumo:
This paper presents an Italian to CatalanRBMT system automatically built bycombining the linguistic data of theexisting pairs Spanish-Catalan andSpanish-Italian. A lightweight manualpostprocessing is carried out in order tofix inconsistencies in the automaticallyderived dictionaries and to add very frequentwords that are missing accordingto a corpus analysis. The system isevaluated on the KDE4 corpus and outperformsGoogle Translate by approximatelyten absolute points in terms ofboth TER and GTM.
Resumo:
El principal objectiu d’aquest projecte és aconseguir classificar diferents vídeos d’esports segons la seva categoria. Els cercadors de text creen un vocabulari segons el significat de les diferents paraules per tal de poder identificar un document. En aquest projecte es va fer el mateix però mitjançant paraules visuals. Per exemple, es van intentar englobar com a una única paraula les diferents rodes que apareixien en els cotxes de rally. A partir de la freqüència amb què apareixien les paraules dels diferents grups dins d’una imatge vàrem crear histogrames de vocabulari que ens permetien tenir una descripció de la imatge. Per classificar un vídeo es van utilitzar els histogrames que descrivien els seus fotogrames. Com que cada histograma es podia considerar un vector de valors enters vàrem optar per utilitzar una màquina classificadora de vectors: una Support vector machine o SVM
Resumo:
La Biblioteca de la Universitat de Girona és l'encarregada de coordinar els repositoris digitals de la Universitat. A l'inici el repositori neix de la necessitat de difondre i preservar tota la recerca de la Universitat, però mica en mica el projecte va creixent i es creen diferents repositoris per a diferents tipus de continguts. Així es creen els repositoris DUGiDocs, DUGiMedia i DUGiFonsEspecials.L'objectiu d'aquest PFC és desenvolupar un portal web amb un sistema d'indexació que permeti la cerca per diferents criteris com, per exemple, autor, matèria i títol. L'entorn ha de tenir un disseny agradable per a l'usuari final i ha de permetre obtenir les dades del repositori que se li indiquin. També ha de ser capaç de detectar els possibles duplicats en els criteris de cerca i notificar-ho a l'administrador
Resumo:
La Biblioteca de la Universitat de Girona és l'encarregada de coordinar els repositoris digitals de la Universitat. A l'inici el repositori neix de la necessitat de difondre i preservar tota la recerca de la Universitat, però mica en mica el projecte va creixent i es creen diferents repositoris per a diferents tipus de continguts. Així es creen els repositoris DUGiDocs, DUGiMedia i DUGiFonsEspecials.L'objectiu d'aquest PFC és desenvolupar un portal web amb un sistema d'indexació que permeti la cerca per diferents criteris com, per exemple, autor, matèria i títol. L'entorn ha de tenir un disseny agradable per a l'usuari final i ha de permetre obtenir les dades del repositori que se li indiquin. També ha de ser capaç de detectar els possibles duplicats en els criteris de cerca i notificar-ho a l'administrador
Resumo:
ITENE és un institut tecnològic de recerca situat a Paterna (València). Té una plantapilot especialitzada en logística on les empreses que ho vulguin (mitjançant convenis,en règim de lloguer, etc.), poden utilitzar les instal•lacions (magatzem intel•ligent,aplicacions RFID, etc.), per provar els seus productes i simular processos de logística itraçabilitat.En aquesta planta s'ha detectat la necessitat de poder provar nous productes cometiquetes, detectors i processadors equipats amb tecnologia RFID (Identificació perRadiofreqüència). Aquesta tecnologia consisteix en passar informació que conté unaetiqueta “intel•ligent” cap a un terminal (PC) mitjançant uns detectors que, perproximitat, poden llegir la informació. Per exemple, quan un camió ple de mercaderiesprèviament etiquetades, passa per un pòrtic amb detectors RFID, es genera unainformació que passa directament a un terminal. Al moment es pot saber què porta elcamió, quantitat, color, mides, etc. Si això es combina amb un ERP, es pot descomptarde l'estoc en temps real. De fet s'utilitza per moltes aplicacions logística, control deprocessos de fabricació, traçabilitat de productes, etc.Per aquest motiu, ITENE, mitjançant el contacte de AIFOS SOLUTIONS S.L (empresaespecialitzada en RFID) ha encarregat un sistema de transportadors de banda per provarnoves solucions.L'objecte del present projecte consisteix en el disseny i automatització d'un sistema de 4cintes transportadores 2 elevadors per tal de fer un circuit tancat per moure caixes en un“bucle” de forma automàtica. L'objectiu és “llençar” caixes plenes de productes (etiquetats amb RFID) mitjançant untransportador equipat amb un pòrtic que té instal•lats diversos detectors de radiofreqüència,i poder-ne provar la correcta detecció a diferents velocitats. Un “buffer” s'encarrega desubministrar les caixes d'una en una que, un cop acabat el circuit, tornen al lloc d'on hansortit. Per donar un producte per bo, es realitzen tests de diverses hores i se n'obté unaestadística de lectures bones/dolentes. Si la ràtio és la desitjada es dóna per bo elproducte.Per aconseguir un disseny correcte s'ha utilitzat diferents eines CAD per dimensionar elsistema de transportadors i els seus elements. Tota l'aplicació està realitzada en 3Dmitjançant el software AutoCAD 3D. L'abast d'aquest projecte inclourà la solució mecànica i pneumàtica del sistema, aixícom el seu muntatge i tot el referent a les normes de seguretat per tal que el sistemacompleixi la normativa referida a la seguretat de màquines
Resumo:
El estudio analiza el nivel de cumplimiento que el año 2006 hacían las sedes web de las universidades españolas de las Pautas de accesibilidad al contenido de la web (WCAG), versión 1.0, en su nivel A. Los resultados del análisis se comparan con los obtenidos el año 2001. Por el lado positivo se observa una mayor implantación de las alternativas a gráfi cos, hojas de estilo CSS y de las alternativas a Flash y PDF; y que un número mayor de universidades (10 en total) logra en 2006 un cumplimiento al 100 % del nivel A de las WCAG. Por el lado negativo se observa una peor calidad de los textos y un menor cumplimiento de las normas de accesibilidad, respecto a los resultados del año 2001, en las páginas de los planes de estudio, usualmente generadas de forma automática. El estudio, de forma complementaria, también analiza el nivel de seguimiento de los indicadores de la norma 508 de Estados Unidos y de otros 5 indicadores adicionales de usabilidad. En cuanto al cumplimiento de la norma 508, no obligatoria en España, ninguna universidad logra el 100 % de cumplimiento. Respecto a los otros indicadores el cumplimiento es de un 65 %. Como resultado global se constata que el nivel de accesibilidad sigue en niveles bajos, similar al del año 2001, y con grandes diferencias entre centros; estos resultados indican un nivel de cumplimiento menor del que cabría esperar por los cambios aplicados en la legislación española a favor de la accesibilidad de los sitios web.