974 resultados para Open source software -- TFG
Resumo:
Extensible Dependency Grammar (XDG; Debusmann, 2007) is a flexible, modular dependency grammarframework in which sentence analyses consist of multigraphs and processing takes the form of constraint satisfaction. This paper shows how XDGlends itself to grammar-driven machine translation and introduces the machinery necessary for synchronous XDG. Since the approach relies on a shared semantics, it resembles interlingua MT.It differs in that there are no separateanalysis and generation phases. Rather, translation consists of the simultaneousanalysis and generation of a single source-target sentence.
Resumo:
This paper proposes to enrich RBMTdictionaries with Named Entities(NEs) automatically acquired fromWikipedia. The method is appliedto the Apertium English-Spanishsystem and its performance comparedto that of Apertium with and withouthandtagged NEs. The system withautomatic NEs outperforms the onewithout NEs, while results vary whencompared to a system with handtaggedNEs (results are comparable forSpanish to English but slightly worstfor English to Spanish). Apart fromthat, adding automatic NEs contributesto decreasing the amount of unknownterms by more than 10%.
Resumo:
There are a number of morphological analysers for Polish. Most of these, however, are non-free resources. What is more, different analysers employ different tagsets and tokenisation strategies. This situation calls for a simpleand universal framework to join different sources of morphological information, including the existing resources as well as user-provided dictionaries. We present such a configurable framework that allows to write simple configuration files that define tokenisation strategies and the behaviour of morphologicalanalysers, including simple tagset conversion.
Resumo:
This paper discusses the qualitativecomparative evaluation performed on theresults of two machine translation systemswith different approaches to the processing ofmulti-word units. It proposes a solution forovercoming the difficulties multi-word unitspresent to machine translation by adopting amethodology that combines the lexicongrammar approach with OpenLogos ontologyand semantico-syntactic rules. The paper alsodiscusses the importance of a qualitativeevaluation metrics to correctly evaluate theperformance of machine translation engineswith regards to multi-word units.
Resumo:
We describe a series of experiments in which we start with English to French and English to Japanese versions of an Open Source rule-based speech translation system for a medical domain, and bootstrap correspondign statistical systems. Comparative evaluation reveals that the rule-based systems are still significantly better than the statistical ones, despite the fact that considerable effort has been invested in tuning both the recognition and translation components; also, a hybrid system only marginally improved recall at the cost of a los in precision. The result suggests that rule-based architectures may still be preferable to statistical ones for safety-critical speech translation tasks.
Resumo:
This paper presents an Italian to CatalanRBMT system automatically built bycombining the linguistic data of theexisting pairs Spanish-Catalan andSpanish-Italian. A lightweight manualpostprocessing is carried out in order tofix inconsistencies in the automaticallyderived dictionaries and to add very frequentwords that are missing accordingto a corpus analysis. The system isevaluated on the KDE4 corpus and outperformsGoogle Translate by approximatelyten absolute points in terms ofboth TER and GTM.
Resumo:
World Wide Webin suosiolla on ollut merkittävä vaikutus yhteiskuntaan. WWW-sivut ovat helposti saatavilla ja sisällön tekeminen WWW:hen on helppoa. WWW-ympäristölle myös kehitetään paljon sovelluksia. WWW-sovellusten kehittämiselle ominaista on valinnanvapaus ja nopeuden tavoittelu. WWW-sovellusten ohjelmoinnin mahdollistavat useat toisilleen vaihtoehtoiset tekniikat. Ne eroavat toisistaan suoritusnopeudessa, ominaisuuksien määrässä ja joustavuudessa. Ohjelmoinnissa käytetään apuna useita erilaisia menetelmiä. Apumenetelmiä ovat muun muassa työkalut ja valmiiden komponenttien hyödyntäminen. Valmiit komponentit voivat olla joko ilmaisia, avointa lähdekoodia tai maksullisia. Tämän kandidaatintyön aikana valmistui sovellus, joka piirtää tilastotiedoista kaaviokuvia ja näyttää niitä dynaamisella WWW-sivulla. Sovellus pyrittiin toteuttamaan älykkäästi apumenetelmiä sopivasti hyödyntäen. Sovelluksen kehittämisessä käytettiin apuna sekä ohjelmointityökaluja että valmiita komponentteja. Kaaviokuvien tyypin ja ulkoasun haluttiin olevan käyttäjien muokattavissa. Toisaalta sovelluksen haluttiin olevan helposti laajennettavissa. Vaatimuksiin vastattiin tekemällä kaaviokuvien piirrosta osittain tietokannalla ohjelmoitava.
Resumo:
Con este proyecto se quiere dotar al Instituto de Censores Jurados de Cuentas de España (ICJCE) de las actuales mejoras existentes en el entorno del software libre.
Resumo:
Exposició dels passos que cal seguir per construir un sistema GNU/Linux adreçat a les aules dels instituts de secundària prenent com a base Linux From Scratch versió 7.5.
Resumo:
Aquest projecte s'emmarca dins el màster en Programari lliure de la UOC, en l'especialitat de xarxes i sistemes operatius. En ell he col·laborat amb CETRAMSA, empresa dedicada a la informació i difusió al ciutadà de l'oferta de transport públic en l'àmbit metropolità de Barcelona, per dur a terme la migració de la seva infraestructura de servidors a programari lliure.
Resumo:
L'objectiu d'aquest projecte és desenvolupar live CDs per tal de facilitar als alumnes de les assignatures obligatòries del Departament de Química Física que inclouen pràctiques amb ordinadors el treball fora de les aules, com a complement del realitzar durant les sessions de pràctiques.
Resumo:
Tässä diplomityössä tarkastellaan avoimen lähdekoodin hyödyntämistä ohjelmistotalojen kolmen asiantuntijaryhmän näkökulmasta: teknologian edustajien, liiketoiminnan johdon ja lakimiesten. Työssä käydään läpi avoimen lähdekoodin historiaa ja OSI:n avoimen lähdekoodin määritelmä. Työssä esitellään myös neljä yleistä avoimen lähdekoodin lisenssiä: GPL, LGPL, BSD ja MPL. Tekninen näkökulma näkyy, kun työssä käydään läpi avoimen lähdekoodin vahvuudet ja heikkoudet. Suurin osa avoimen lähdekoodin tuotteista ei ole vielä tarpeeksi kehittyneitä kaupalliseen käyttöön, mutta joukosta löytyy myös muutama todellinen vaihtoehto. Työssä esitellään viisi tunnettua lähdekoodin tuotetta: Linux, Apache, MySQL, Perl ja PHP. Avoimen lähdekoodin mahdollistamat ansaintamallit tuovat esiin liiketoiminnan johdon kiinnostuksen kohteen. Työssä esitellään viisi yritystä, jotka ovat onnistuneet hyödyntämään näitä liiketoiminnan malleja: Red Hat, VA Software, JBoss, IBM ja Sun Microsystems. Juridisesta näkökulmasta suurin riski avoimen lähdekoodin tuotteiden käytössä on kolmansien osapuolien immateriaalioikeuksien loukkaaminen. Lähes kaikki avoimen lähdekoodin ohjelmistot on lisensoitu siten, etteivät ne anna minkäänlaista takuuta tai ota vastuuta. Työssä käsitellään myös sitä, kuinka avoimen lähdekoodin aiheuttamia riskejä vastaan voidaan suojautua. Työn tuloksena syntyy päätösprosessi, jota voidaan käyttää apuna tehdessä lopullista päätöstä avoimen lähdekoodin ohjelmiston käytöstä.
Resumo:
Advances in flow cytometry and other single-cell technologies have enabled high-dimensional, high-throughput measurements of individual cells as well as the interrogation of cell population heterogeneity. However, in many instances, computational tools to analyze the wealth of data generated by these technologies are lacking. Here, we present a computational framework for unbiased combinatorial polyfunctionality analysis of antigen-specific T-cell subsets (COMPASS). COMPASS uses a Bayesian hierarchical framework to model all observed cell subsets and select those most likely to have antigen-specific responses. Cell-subset responses are quantified by posterior probabilities, and human subject-level responses are quantified by two summary statistics that describe the quality of an individual's polyfunctional response and can be correlated directly with clinical outcome. Using three clinical data sets of cytokine production, we demonstrate how COMPASS improves characterization of antigen-specific T cells and reveals cellular 'correlates of protection/immunity' in the RV144 HIV vaccine efficacy trial that are missed by other methods. COMPASS is available as open-source software.
Resumo:
Asiakaspalvelun tarjoamisesta Internet-verkon kautta tulee jatkuvasti tärkeämpää. Aitoa asiakashyötyä tuottavien palvelujen pystyttäminen ja tuottaminen on pienyritysten resursseilla vähintäänkin vaikeaa ja riskialtista. Mahdollisuus käyttää vapaaseen käyttöön lisensoituja avoimen lähdekoodin ohjelmistoja asiakkaille tarjottavien palvelujen perustana madaltaa näinollen pienyritysten kynnystä tarjota palvelua Internet-verkossa. Yrityksen tarjoamien palvelujen perustaksi on nykyään saatavilla jo kokonaisia valmiita avoimeen lähdekoodiin perustuvia ohjelmistosovelluksia. Suurin osa niistä on kuitenkin tehty jotakin rajattua tarkoitusta varten. Pyrittäessä laajentamaan asiakkaille tarjottua palvelua huomataankin tällöin, että ohjelmistosovelluksen laajentaminen muodostaa alkuperäistäkin korkeamman kynnyksen. Toisen ohjelmiston integrointi alkuperäisen kanssa ei sekään ole mahdollinen vaihtoehto – vaikka sellainen uuden palvelun perustaksi löytyisikin. WWW-sisällönhallintajärjestelmät sopivat yleiskäyttöisyytensä ansiosta hyvinkin vaihtelevien palveluiden perustaksi. Yrityksen verkkopalvelu voidaan toteuttaa esimerkiksi vapaasti saatavaan Plone-sisällönhallintajärjestelmään perustuen. Tällöin palvelujen laajentamisen ja uusien tarjoamisen kynnys oletettavasti madaltuu ratkaisevasti, järjestelmän valmiiksi sisältämien monipuolisten toimintojen ansiosta. Paikallisen pienyrityksen verkkopalvelua toteuttaessa todettiin Plonen olevan hyvin tarkoitukseen sopiva. Vähänkin merkittävämmät järjestelmään tehtävät muutokset edellyttävät kuitenkin varsin syvällistä perehtymistä sen osiin ja toimintaan. Koska tarjottavan palvelun tuli olla mahdollisimman helppo lähestyä ja käyttää, järjestelmää oli muun tarvittavan räätälöinnin lisäksi vielä muutettava yksinkertaisemmaksi: Esimerkiksi järjestelmän tarjoamasta valmiista käyttöliittymästä oli räätälöitävä yksinkertaistettu palvelunkäyttöliittymä. Myös palvelun ylläpitäjien koulutukseen oli panostettava. Järjestelmän ylläpidosta tehtiin palvelusopimus, koska asiakkaalla ei ole tarvittavaa teknistä osaamista.
Resumo:
PURPOSE: Statistical shape and appearance models play an important role in reducing the segmentation processing time of a vertebra and in improving results for 3D model development. Here, we describe the different steps in generating a statistical shape model (SSM) of the second cervical vertebra (C2) and provide the shape model for general use by the scientific community. The main difficulties in its construction are the morphological complexity of the C2 and its variability in the population. METHODS: The input dataset is composed of manually segmented anonymized patient computerized tomography (CT) scans. The alignment of the different datasets is done with the procrustes alignment on surface models, and then, the registration is cast as a model-fitting problem using a Gaussian process. A principal component analysis (PCA)-based model is generated which includes the variability of the C2. RESULTS: The SSM was generated using 92 CT scans. The resulting SSM was evaluated for specificity, compactness and generalization ability. The SSM of the C2 is freely available to the scientific community in Slicer (an open source software for image analysis and scientific visualization) with a module created to visualize the SSM using Statismo, a framework for statistical shape modeling. CONCLUSION: The SSM of the vertebra allows the shape variability of the C2 to be represented. Moreover, the SSM will enable semi-automatic segmentation and 3D model generation of the vertebra, which would greatly benefit surgery planning.