994 resultados para Web document
Resumo:
Web document cluster analysis plays an important role in information retrieval by organizing large amounts of documents into a small number of meaningful clusters. Traditional web document clustering is based on the Vector Space Model (VSM), which takes into account only two-level (document and term) knowledge granularity but ignores the bridging paragraph granularity. However, this two-level granularity may lead to unsatisfactory clustering results with “false correlation”. In order to deal with the problem, a Hierarchical Representation Model with Multi-granularity (HRMM), which consists of five-layer representation of data and a twophase clustering process is proposed based on granular computing and article structure theory. To deal with the zero-valued similarity problemresulted from the sparse term-paragraphmatrix, an ontology based strategy and a tolerance-rough-set based strategy are introduced into HRMM. By using granular computing, structural knowledge hidden in documents can be more efficiently and effectively captured in HRMM and thus web document clusters with higher quality can be generated. Extensive experiments show that HRMM, HRMM with tolerancerough-set strategy, and HRMM with ontology all outperform VSM and a representative non VSM-based algorithm, WFP, significantly in terms of the F-Score.
Resumo:
This paper reports some experiments in using SVG (Scalable Vector Graphics), rather than the browser default of (X)HTML/CSS, as a potential Web-based rendering technology, in an attempt to create an approach that integrates the structural and display aspects of a Web document in a single XML-compliant envelope. Although the syntax of SVG is XML based, the semantics of the primitive graphic operations more closely resemble those of page description languages such as PostScript or PDF. The principal usage of SVG, so far, is for inserting complex graphic material into Web pages that are predominantly controlled via (X)HTML and CSS. The conversion of structured and unstructured PDF into SVG is discussed. It is found that unstructured PDF converts into pages of SVG with few problems, but difficulties arise when one attempts to map the structural components of a Tagged PDF into an XML skeleton underlying the corresponding SVG. These difficulties are not fundamentally syntactic; they arise largely because browsers are innately bound to (X)HTML/CSS as their default rendering model. Some suggestions are made for ways in which SVG could be more totally integrated into browser functionality, with the possibility that future browsers might be able to use SVG as their default rendering paradigm.
Resumo:
Pla de negoci del programari lliure Metaeditor que permet la generació automàtica de paraules clau (metakeywords) de pàgines web i documents PDF. El pla està basat en l'oferiment de serveis de formació i d'assessorament. Conté el pla de màrqueting, el pla de producció, el pla d'organització i el pla econòmic-financer. Es presenten les oportunitats a explotar i les dificultats a superar per que la proposta sigui una realitat. També es presenta la planificació de l'evolució econòmica dels primers 5 anys de vida del negoci.
Resumo:
Cet article illustre la pertinence d’une théorie du document le représentant en trois dimensions complémentaires : forme, texte, médium. Deux exemples sont proposés : l’évolution de la conception du web par son inventeur Tim Berners-Lee qui passe progressivement d’une dimension à l’autre ; le classement des stratégies des principales firmes investissant le web du document, Amazon, Apple, Google et Facebook et privilégiant chaque fois une des dimensions.
Resumo:
This talk will present an overview of the ongoing ERCIM project SMARTDOCS (SeMAntically-cReaTed DOCuments) which aims at automatically generating webpages from RDF data. It will particularly focus on the current issues and the investigated solutions in the different modules of the project, which are related to document planning, natural language generation and multimedia perspectives. The second part of the talk will be dedicated to the KODA annotation system, which is a knowledge-base-agnostic annotator designed to provide the RDF annotations required in the document generation process.
Resumo:
Document engineering is the computer science discipline that investigates systems for documents in any form and in all media. As with the relationship between software engineering and software, document engineering is concerned with principles, tools and processes that improve our ability to create, manage, and maintain documents (http://www.documentengineering.org). The ACM Symposium on Document Engineering is an annual meeting of researchers active in document engineering: it is sponsored by ACM by means of the ACM SIGWEB Special Interest Group. In this editorial, we first point to work carried out in the context of document engineering, which are directly related to multimedia tools and applications. We conclude with a summary of the papers presented in this special issue.
Resumo:
Introdução: A produção e o uso da literatura científica são analisados, quantificados e interpretados pela bibliometria, ciência utilizada para estudos métricos da informação publicada e que estuda as questões relacionadas com a comunicação científica e a atividade científica. Objetivo: O estudo apresentado é uma análise bibliométrica da produção científica portuguesa da área da saúde indexada na Web of Science. Métodos: Analisa-se a produção referente ao período entre 1992 e final de 2011. A análise da produção científica centrou-se nas seguintes variáveis: categorias de classificação da Web of Science, tipologia de documentos indexados, títulos de revistas, distribuição por anos de publicação, afiliação institucional, idiomas, países de origem dos autores com quem foram estabelecidas relações de parceria científica e quem facultou os financiamentos à investigação científica. Resultados: Foram contabilizados 34.208 trabalhos. Destes, o artigo é a forma mais utilizada pelos autores portugueses para a divulgação dos resultados de investigação (58,5%). A década mais recente é contemplada com 75,4% dos registos. A maioria da produção com visibilidade internacional é oriunda de universidades e de centros de investigação hospitalar; institutos, laboratórios da indústria farmacêutica e universidades estrangeiras têm valores residuais. A colaboração com outros investigadores internacionais destaca-se no caso da Europa (73,2%). O financiamento da investigação científica é suportado basicamente pela Fundação para a Ciência e Tecnologia (59,5%), seguida da Comissão Europeia (17,8%). O inglês é o idioma mais usado para a divulgação dos resultados de investigação nacional na área da saúde (97,8%). Conclusões: O uso de bases de dados ou de plataformas científicas para estudos bibliométricos é um processo moroso e difícil. O total de trabalhos em análise foi sempre o mesmo mas, em algumas variáveis, os valores não coincidem, quer porque alguns dos registos foram classificados em mais do que uma categoria temática, quer pelos trabalhos multidisciplinares oriundos das mesmas instituições, quer pelos trabalhos de colaboração internacional. Também no presente estudo os artigos são o veículo privilegiado para a divulgação dos resultados científicos. Apontamento final: deve encorajar-se a utilização de outras plataformas científicas e de outras bases de dados para uma mais completa recuperação da produção científica nacional na área da saúde. Introduction: The production and the use of the scientific literature are analyzed, quantified and interpreted by bibliometry. Bibliometry is the science used in published information metric studies and studies the questions of scientific communication and the scientific production. Aim of the study: This study presents a bibliometric analysis of the indexed Web of Science Portuguese scientific production in the health field. Methods: We analyzed the production from 1992 to the end of 2011. This analysis focused in several variables: general categories areas of Web of Science, indexed document types, source titles, publication years, group/corporate authors, languages, identification of the countries with scientific partnerships and identification of the funding agencies for scientific research. Results: We found 34.208 works. From this, the article is the most common channel for disseminating the research results (58.5%). The most recent decade has 75.4% of the total of records. Most of the production with international visibility becomes from universities and hospital research centers; institutes, pharmaceutical labs or foreign universities have residual values. Collaborating with other international researchers is very common, particularly with Europe (73.2%). In general, the Fundação para a Ciência e Tecnologia supports the scientific research (59.5%), followed by the European Commission (17.8%). The language commonly used for disseminating the research results in health is the English (97.8%). Conclusions: Using databases or scientific platforms for bibliometric studies is a hard and difficult process. The total of works analyzed was always the same but, with some variables, the numbers does not coincide: a) some of the registries were classified in several categories; b) some of the multidisciplinary works were from the same institution; c) the large number of international partnership. In this study, articles are the privileged way for disseminating the scientific results. A last thought: the use of other scientific platforms and databases should be encouraged for a more complete retrieval of the national research production in health.
Resumo:
Introdução: A produção e o uso da literatura científica são analisados, quantificados e interpretados pela bibliometria, ciência utilizada para estudos métricos da informação publicada e que estuda as questões relacionadas com a comunicação científica e a atividade científica. Objetivo: O estudo apresentado é uma análise bibliométrica da produção científica portuguesa da área da saúde indexada na Web of Science. Métodos: Analisa-se a produção referente ao período entre 1992 e final de 2011. A análise da produção científica centrou-se nas seguintes variáveis: categorias de classificação da Web of Science, tipologia de documentos indexados, títulos de revistas, distribuição por anos de publicação, afiliação institucional, idiomas, países de origem dos autores com quem foram estabelecidas relações de parceria científica e quem facultou os financiamentos à investigação científica. Resultados: Foram contabilizados 34.208 trabalhos. Destes, o artigo é a forma mais utilizada pelos autores portugueses para a divulgação dos resultados de investigação (58,5%). A década mais recente é contemplada com 75,4% dos registos. A maioria da produção com visibilidade internacional é oriunda de universidades e de centros de investigação hospitalar; institutos, laboratórios da indústria farmacêutica e universidades estrangeiras têm valores residuais. A colaboração com outros investigadores internacionais destaca-se no caso da Europa (73,2%). O financiamento da investigação científica é suportado basicamente pela Fundação para a Ciência e Tecnologia (59,5%), seguida da Comissão Europeia (17,8%). O inglês é o idioma mais usado para a divulgação dos resultados de investigação nacional na área da saúde (97,8%). Conclusões: O uso de bases de dados ou de plataformas científicas para estudos bibliométricos é um processo moroso e difícil. O total de trabalhos em análise foi sempre o mesmo mas, em algumas variáveis, os valores não coincidem, quer porque alguns dos registos foram classificados em mais do que uma categoria temática, quer pelos trabalhos multidisciplinares oriundos das mesmas instituições, quer pelos trabalhos de colaboração internacional. Também no presente estudo os artigos são o veículo privilegiado para a divulgação dos resultados científicos. Apontamento final: deve encorajar-se a utilização de outras plataformas científicas e de outras bases de dados para uma mais completa recuperação da produção científica nacional na área da saúde. Introduction: The production and the use of the scientific literature are analyzed, quantified and interpreted by bibliometry. Bibliometry is the science used in published information metric studies and studies the questions of scientific communication and the scientific production. Aim of the study: This study presents a bibliometric analysis of the indexed Web of Science Portuguese scientific production in the health field. Methods: We analyzed the production from 1992 to the end of 2011. This analysis focused in several variables: general categories areas of Web of Science, indexed document types, source titles, publication years, group/corporate authors, languages, identification of the countries with scientific partnerships and identification of the funding agencies for scientific research. Results: We found 34.208 works. From this, the article is the most common channel for disseminating the research results (58.5%). The most recent decade has 75.4% of the total of records. Most of the production with international visibility becomes from universities and hospital research centers; institutes, pharmaceutical labs or foreign universities have residual values. Collaborating with other international researchers is very common, particularly with Europe (73.2%). In general, the Fundação para a Ciência e Tecnologia supports the scientific research (59.5%), followed by the European Commission (17.8%). The language commonly used for disseminating the research results in health is the English (97.8%). Conclusions: Using databases or scientific platforms for bibliometric studies is a hard and difficult process. The total of works analyzed was always the same but, with some variables, the numbers does not coincide: a) some of the registries were classified in several categories; b) some of the multidisciplinary works were from the same institution; c) the large number of international partnership. In this study, articles are the privileged way for disseminating the scientific results. A last thought: the use of other scientific platforms and databases should be encouraged for a more complete retrieval of the national research production in health.
Resumo:
Mestrado em Engenharia Informática. Sistemas Gráficos e Multimédia.
Resumo:
Mestrado em Engenharia Informática, Área de Especialização em Arquiteturas, Sistemas e Redes
Resumo:
XML Schema is one of the most used specifications for defining types of XML documents. It provides an extensive set of primitive data types, ways to extend and reuse definitions and an XML syntax that simplifies automatic manipulation. However, many features that make XML Schema Definitions (XSD) so interesting also make them rather cumbersome to read. Several tools to visualize and browse schema definitions have been proposed to cope with this issue. The novel approach proposed in this paper is to base XSD visualization and navigation on the XML document itself, using solely the web browser, without requiring a pre-processing step or an intermediate representation. We present the design and implementation of a web-based XML Schema browser called schem@Doc that operates over the XSD file itself. With this approach, XSD visualization is synchronized with the source file and always reflects its current state. This tool fits well in the schema development process and is easy to integrate in web repositories containing large numbers of XSD files.
Resumo:
Dissertation submitted in partial fulfillment of the requirements for the Degree of Master of Science in Geospatial Technologies.
Resumo:
L’objecte central del present informe és descriure l’estat de la qüestió –tant a Catalunya com a altres països– de l’accés als recursos web des de les biblioteques. De fet, l’objectiu últim és presentar i analitzar la situació a l’estranger per tal d’adaptar les estratègies i els models de tractament i organització de recursos web a la realitat i les necessitats de les biblioteques catalanes.
Resumo:
Aquesta memòria tracta sobre el procediment de creació software que s’ha dut a terme per a implementar el portal web de l’IES Pla d’En Boet de Mataró, un institut públic subvencionat per la Generalitat de Catalunya. Aquest portal s’ha desenvolupat des de zero i s’ha hagut d’enllaçar amb altres aplicacions que han sigut requerides. El document conté l’anàlisi, disseny i l’implementació del portal web, i de tota la funcionalitat que l’envolta, que s’ha realitzat per satisfer els requeriments inicials. Conté, a més, les diferents anàlisis que s’han necessitat per tal d’integrar-lo amb una aplicació pròpia del centre i amb un sistema d’intercanvi de missatges, i com s’ha decidit fer-ho. S’intenta explicar alguna de les problemàtiques més importants que han aparegut al llarg del procés i que han afectat al seu desenvolupament. Les decisions preses per a resoldre-les també apareixen per avalar l’estudi realitzat. Finalment hi ha una valoració personal i una altra dels objectius aconseguits per veure que s’ha arribat a la solució final amb èxit.