10 resultados para SGML
Resumo:
L'edició de textos fent ús de mitjans informàtics ha comportat avantatges i inconvenients. Mentre que ha fet molt accessible l'edició acurada de textos també ha provocat tot un seguit de problemes, un del quals és la dificultat de compartir recursos.Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra.
Resumo:
Dissertação de Mestrado em Lexicologia e Lexicografia
Resumo:
Este proyecto trata de añadir nuevas funcionalidades a la herramienta OpenJade, la cual es el único procesador de hojas de estilo DSSSL para documentos SGML, en la comunidad de OpenSource. En concreto se intenta insertar los modelos de páginas para una secuencia de páginas complejas, y a partir de aquí crear un backend en Latex/TeX. Esto supondría un gran salto en la creación de documentos SGML ya que permitiría crear diferentes regiones en una misma página. Se explica todo el procedimiento de implementación, conceptos básicos a tener en cuenta y se muestra cómo se consigue formar el árbol de objetos para poder crear el backend TeX. Finalmente, aunque se consigue construir el backend, donde se muestra que la construcción de la nueva funcionalidad es correcta, no es posible formar una backend en LaTeX sin limitaciones importantes, debido a que LaTeX no está preparado para este tipo de procesamiento automático. Sin embargo se crean diferentes salidas que se fueron formando hasta llegar a la conclusión que se debía implementar una nueva macros en TeX para LaTeX que soportara el modelo de página.
Resumo:
Bibliografia internacional seletiva e anotada sobre bibliotecas digitais. Aborda os seguintes aspectos: a) visionários, principais autores que escreveram sobre a biblioteca do futuro, no período de 1945-1985; b) conceituação de biblioteca digital; c) projetos em andamento na Alemanha, Austrália, Brasil, Canadá, Dinamarca, Espanha, Estados Unidos, França, Holanda, Japão, Nova Zelândia, Reino Unido, Suécia e Vaticano; d) aspectos técnicos relativos à construção de uma biblioteca digital: arquitetura do sistema, conversão de dados e escaneamento, marcação de textos, desenvolvimento de coleções, catalogação, classificação/indexação, metadados, referência, recuperação da informação, direitos autorais e preservação da informação digital; e) principais fontes de informação: monografia, periódicos, reuniões técnicas específicas, lista de discussão, grupos e centros de estudos, cursos e treinamento.
Resumo:
Apresenta-se o paradigma de gerenciamento da informação que surgiu com o padrão das linguagens ditas "de marcação" (ou markup languages). Faz-se uma rápida introdução à linguagem SGML, e analisam-se as características e os diferenciais que estão por trás do sucesso da linguagem XML, que promete uma revolução na Web. Mostram-se quais são as bases conceituais de uma nova geração de aplicações das áreas da Informação e da tecnologia da informação que democratizarão ainda mais o acesso à informação organizada na Internet. Aborda-se a evolução das pesquisas em direção à chamada Web Semântica, com o desenvolvimento de ontologias.
Resumo:
Päättötyössäni tutkin, kuinka yritys voi yhdistää monimuotoista tietoa tietojärjestelmässään sekä millainen vaikutus yhdistämisellä on yrityksen tietojohtamiseen. Työni perustuu ongelman ratkaisuun. Selvitän alussa eri muotoisen tiedon yhdistämisen teoriaa ja käsitteitä sekä yritysten verkostoitumisen periaatetta, tietovirtoja, tietojohtamista, tietopääomaa. Keskeisin seikka yhdistämisessä on konvertointi. Käsittelen laajasti SGML :n suomia mahdollisuuksia, koska tavoitteena on laite- ja ohjelmistoympäristöistä riippumaton dokumentin esitysmuoto sekä rakenteen ja tulostusasun erottaminen toisistaan. Rakenteisella lähestymistavalla on useita etuja, kuten tiedon organisointi dokumentissa, tiedon uudelleenkäytön mahdollistaminen sekä dokumenttien pitkäikäisyys. Rakenteen merkkaus mahdollistaa dokumentin muuntamisen useisiin eri esitysmuotoihin. Empiirisessä osassa tutkin ja ratkaisen Televirmi Oy:lle tekemäni sovelluksen avulla, kuinka eri muodossa olevat tiedostot yhdistetään relaatiotietokantaan ja otetaan käyttöön tietojärjestelmässä. Yhdistämisen jälkeen analysoin yhdistämisen vaikutuksia yrityksen tietojohtamiseen yleisellä tasolla sekä tiedon hyödyntämisen mahdollisuuksia.
Resumo:
Dados são disponibilizados através dos mais distintos meios e com os mais variados níveis de estruturação. Em um nível baixo de estruturação tem-se arquivos binários e no outro extremo tem-se bancos de dados com uma estrutura extremamente rígida. Entre estes dois extremos estão os dados semi-estruturados que possuem variados graus de estruturação com os quais não estão rigidamente comprometidos. Na categoria dos dados semiestruturados tem-se exemplos como o HTML, o XML e o SGML. O uso de informações contidas nas mais diversas fontes de dados que por sua vez possuem os mais diversos níveis de estruturação só será efetivo se esta informação puder ser manejada de uma forma integrada e através de algum tipo de esquema. O objetivo desta dissertação é fornecer um processo para construção de uma ontologia de domínio que haja como esquema representativo de diferentes conjuntos de informação. Estes conjuntos de informações podem variar de dados semi-estruturados a dados estruturados e devem referir-se a um mesmo domínio do conhecimento. Esta proposta permite que qualquer modelo que possa ser transformado no modelo comum de integração possa ser utilizado com entrada para o processo de integração. A ontologia de domínio resultante do processo de integração é um modelo semântico que representa o consenso obtido através da integração de diversas fontes de forma ascendente (bottom-up), binária, incremental, semi-automática e auto-documentável. Diz-se que o processo é ascendente porque integra o modelo que representa a fonte de interesse sobre a ontologia, é binário porque trabalha com dois esquemas a cada integração o que facilita o processo de documentação das integrações realizadas, é incremental porque cada novo esquema de interesse é integrado sobre a ontologia vigente naquele momento, é semiautomático porque considera a intervenção do usuário durante o processo e finalmente é autodocumentável porque durante o processo, toda integração de pares de conceitos semanticamente equivalentes é registrada. O fato de auto-documentar-se é a principal característica do processo proposto e seu principal diferencial com relação a outras propostas de integração. O processo de mapeamento utiliza, dos esquemas de entrada, toda a informação presente ou que possa ser inferida. Informações como se o conceito é léxico ou não, se é raiz e os símbolos que permitem deduzir cardinalidades são consideradas. No processo de integração são consideradas práticas consagradas de integração de esquemas de BDs, na identificação de relacionamentos entre objetos dos esquemas, para geração do esquema integrado e para resolução de conflitos. As principais contribuições desta dissertação são (i) a proposta de um metamodelo capaz de manter o resultado dos mapeamentos e das integrações realizadas e (ii) a especificação de um processo auto-documentável que de sustentação a auditoria do processo de integração.
Resumo:
The available technologies for publishing journals electronically are surveyed. They range from abstract representations, such as SGML, concerned largely with the structure of the document, to formats such as PostScript which faithfully model the layout and the appearance. The issues are discussed in the context of choosing a format for electronically publishing the journal: Electronic Publishing -- Origination, Dissemination and Design. PostScript is neither widely enough available nor standardised enough to be suitable; a bitmapped pages approach suffers from being resolution-dependent in terms of the visual quality achievable. Reasons are put forward for the final choice of Adobe s new PDF document standard for creating electronic versions of the journal.