4 resultados para Annotation informatisée
em Universitätsbibliothek Kassel, Universität Kassel, Germany
Resumo:
The ongoing growth of the World Wide Web, catalyzed by the increasing possibility of ubiquitous access via a variety of devices, continues to strengthen its role as our prevalent information and commmunication medium. However, although tools like search engines facilitate retrieval, the task of finally making sense of Web content is still often left to human interpretation. The vision of supporting both humans and machines in such knowledge-based activities led to the development of different systems which allow to structure Web resources by metadata annotations. Interestingly, two major approaches which gained a considerable amount of attention are addressing the problem from nearly opposite directions: On the one hand, the idea of the Semantic Web suggests to formalize the knowledge within a particular domain by means of the "top-down" approach of defining ontologies. On the other hand, Social Annotation Systems as part of the so-called Web 2.0 movement implement a "bottom-up" style of categorization using arbitrary keywords. Experience as well as research in the characteristics of both systems has shown that their strengths and weaknesses seem to be inverse: While Social Annotation suffers from problems like, e. g., ambiguity or lack or precision, ontologies were especially designed to eliminate those. On the contrary, the latter suffer from a knowledge acquisition bottleneck, which is successfully overcome by the large user populations of Social Annotation Systems. Instead of being regarded as competing paradigms, the obvious potential synergies from a combination of both motivated approaches to "bridge the gap" between them. These were fostered by the evidence of emergent semantics, i. e., the self-organized evolution of implicit conceptual structures, within Social Annotation data. While several techniques to exploit the emergent patterns were proposed, a systematic analysis - especially regarding paradigms from the field of ontology learning - is still largely missing. This also includes a deeper understanding of the circumstances which affect the evolution processes. This work aims to address this gap by providing an in-depth study of methods and influencing factors to capture emergent semantics from Social Annotation Systems. We focus hereby on the acquisition of lexical semantics from the underlying networks of keywords, users and resources. Structured along different ontology learning tasks, we use a methodology of semantic grounding to characterize and evaluate the semantic relations captured by different methods. In all cases, our studies are based on datasets from several Social Annotation Systems. Specifically, we first analyze semantic relatedness among keywords, and identify measures which detect different notions of relatedness. These constitute the input of concept learning algorithms, which focus then on the discovery of synonymous and ambiguous keywords. Hereby, we assess the usefulness of various clustering techniques. As a prerequisite to induce hierarchical relationships, our next step is to study measures which quantify the level of generality of a particular keyword. We find that comparatively simple measures can approximate the generality information encoded in reference taxonomies. These insights are used to inform the final task, namely the creation of concept hierarchies. For this purpose, generality-based algorithms exhibit advantages compared to clustering approaches. In order to complement the identification of suitable methods to capture semantic structures, we analyze as a next step several factors which influence their emergence. Empirical evidence is provided that the amount of available data plays a crucial role for determining keyword meanings. From a different perspective, we examine pragmatic aspects by considering different annotation patterns among users. Based on a broad distinction between "categorizers" and "describers", we find that the latter produce more accurate results. This suggests a causal link between pragmatic and semantic aspects of keyword annotation. As a special kind of usage pattern, we then have a look at system abuse and spam. While observing a mixed picture, we suggest that an individual decision should be taken instead of disregarding spammers as a matter of principle. Finally, we discuss a set of applications which operationalize the results of our studies for enhancing both Social Annotation and semantic systems. These comprise on the one hand tools which foster the emergence of semantics, and on the one hand applications which exploit the socially induced relations to improve, e. g., searching, browsing, or user profiling facilities. In summary, the contributions of this work highlight viable methods and crucial aspects for designing enhanced knowledge-based services of a Social Semantic Web.
Resumo:
Die Dissertation geht von der Überlegung aus, dass ein Wandel im deutschen Bildungssystem aufgrund kinderrechtlicher und demokratischer Überlegungen eine essenzielle Zukunftsaufgabe ist. Dies geschieht im Besonderen vor dem Hintergrund kinderrechtlicher Forderungen, wie sie beispielsweise aus dem Status Deutschlands als Mitgliedsland der UN-Kinderrechtskonvention und des UN-Übereinkommens über die Rechte von Menschen mit Behinderung entstehen: Die Korrelation zwischen Herkunft und Bildungserfolg sowie die noch konzeptionell ungenügend entwickelten Ansätze zur Inklusion werden als bestimmend für die Diskussion erkannt. Die Arbeit vertritt die These, dass Lehrende eine zentrale Rolle in einem notwendigen Prozess der Umwandlung des deutschen Bildungssystems spielen können und nimmt in emanzipatorischer Absicht die Lehrenden als Zielgruppe in den Blick. Aufgrund der Struktur der Lehrendenausbildung wird zudem dafür argumentiert, entsprechende Veränderungen im Sinne ihrer Nachhaltigkeit und flächendeckenden Relevanz in der Lehrendenausbildung des ersten universitären Ausbildungsabschnittes zu verankern. Als Instrument, welches die Kriterien von Nachhaltigkeit und umfassender Relevanz erfüllt, werden die Standards für die Lehrerbildung im Bereich Bildungswissenschaften benannt und theoretisch unterfüttert. Grundsätzlich spannt sich der Blickwinkel der Arbeit zwischen der Betrachtung der Struktur des Bildungssystems, des Wissens und Könnens von Lehrenden und Lernenden im Sinne der Kompetenzorientierung sowie der Haltung auf, welche Lehrende einnehmen. Dabei wird aufgezeigt, dass sich diese Faktoren wechselseitig auf vielfache Art und Weise beeinflussen. Auf der Basis dieser Überlegungen wird zunächst das deutsche Bildungssystem in seinen Strukturen beschrieben und die Lehrenden und Lernenden als Teilnehmende am Bildungsgeschehen skizziert. Ein exkursiver Vergleich dreier aufgrund kinderrechtlicher Parameter ausgewählter europäischer Bildungssysteme eruiert zudem, inwiefern die aufgezeigten Bestimmungsgrößen Struktur, Wissen/Können und Haltung Einfluss auf kinderrechtliche Verfasstheit des Bildungssystems nehmen, wobei die Grundprinzipien der UN-Kinderrechtskonvention hier als Messinstrument dienen. Davon ausgehend, erscheint pädagogische Haltung als eine wesentliche Einflussgröße, die im weiteren Verlauf der Arbeit im Sinne der kritischen Pädagogik zu einer Konzeption Pädagogischer Verantwortung verdichtet wird. Vor diesem Hintergrund erfolgt eine Betrachtung aktueller Problematiken im deutschen Bildungssystem, die sich an den in den Standards für die Lehrerbildung identifizierten Ausbildungsschwerpunkten orientiert und erneut die Prinzipien und rechtlichen Vorgaben der UN-Kinderrechtskonvention als Maßstab wählt. Auf der Grundlage dieser umfassenden Diskussion werden in einem sich anschließenden Analyseschritt Annotationen vorgenommen, die die Formulierungen der 11 Standards für die Lehrerbildung inhaltlich erweitern und ergänzen. In Verbindung mit einer Pädagogischen Verantwortung, die sich der Ausbildung kritischer Mündigkeit verpflichtet, werden die annotierten Standards als eine Möglichkeit der kinderrechtlichen (Selbst-)Evaluation von Lehrenden sowie als Instrument einer kinderrechtliche Gesichtspunkte fokussierenden Lehrendenbildung verstanden und dargestellt.
Resumo:
In this paper, we describe an interdisciplinary project in which visualization techniques were developed for and applied to scholarly work from literary studies. The aim was to bring Christof Schöch's electronic edition of Bérardier de Bataut's Essai sur le récit (1776) to the web. This edition is based on the Text Encoding Initiative's XML-based encoding scheme (TEI P5, subset TEI-Lite). This now de facto standard applies to machine-readable texts used chiefly in the humanities and social sciences. The intention of this edition is to make the edited text freely available on the web, to allow for alternative text views (here original and modern/corrected text), to ensure reader-friendly annotation and navigation, to permit on-line collaboration in encoding and annotation as well as user comments, all in an open source, generically usable, lightweight package. These aims were attained by relying on a GPL-based, public domain CMS (Drupal) and combining it with XSL-Stylesheets and Java Script.
Resumo:
Die Auszeichnungssprache XML dient zur Annotation von Dokumenten und hat sich als Standard-Datenaustauschformat durchgesetzt. Dabei entsteht der Bedarf, XML-Dokumente nicht nur als reine Textdateien zu speichern und zu transferieren, sondern sie auch persistent in besser strukturierter Form abzulegen. Dies kann unter anderem in speziellen XML- oder relationalen Datenbanken geschehen. Relationale Datenbanken setzen dazu bisher auf zwei grundsätzlich verschiedene Verfahren: Die XML-Dokumente werden entweder unverändert als binäre oder Zeichenkettenobjekte gespeichert oder aber aufgespalten, sodass sie in herkömmlichen relationalen Tabellen normalisiert abgelegt werden können (so genanntes „Flachklopfen“ oder „Schreddern“ der hierarchischen Struktur). Diese Dissertation verfolgt einen neuen Ansatz, der einen Mittelweg zwischen den bisherigen Lösungen darstellt und die Möglichkeiten des weiterentwickelten SQL-Standards aufgreift. SQL:2003 definiert komplexe Struktur- und Kollektionstypen (Tupel, Felder, Listen, Mengen, Multimengen), die es erlauben, XML-Dokumente derart auf relationale Strukturen abzubilden, dass der hierarchische Aufbau erhalten bleibt. Dies bietet zwei Vorteile: Einerseits stehen bewährte Technologien, die aus dem Bereich der relationalen Datenbanken stammen, uneingeschränkt zur Verfügung. Andererseits lässt sich mit Hilfe der SQL:2003-Typen die inhärente Baumstruktur der XML-Dokumente bewahren, sodass es nicht erforderlich ist, diese im Bedarfsfall durch aufwendige Joins aus den meist normalisierten und auf mehrere Tabellen verteilten Tupeln zusammenzusetzen. In dieser Arbeit werden zunächst grundsätzliche Fragen zu passenden, effizienten Abbildungsformen von XML-Dokumenten auf SQL:2003-konforme Datentypen geklärt. Darauf aufbauend wird ein geeignetes, umkehrbares Umsetzungsverfahren entwickelt, das im Rahmen einer prototypischen Applikation implementiert und analysiert wird. Beim Entwurf des Abbildungsverfahrens wird besonderer Wert auf die Einsatzmöglichkeit in Verbindung mit einem existierenden, ausgereiften relationalen Datenbankmanagementsystem (DBMS) gelegt. Da die Unterstützung von SQL:2003 in den kommerziellen DBMS bisher nur unvollständig ist, muss untersucht werden, inwieweit sich die einzelnen Systeme für das zu implementierende Abbildungsverfahren eignen. Dabei stellt sich heraus, dass unter den betrachteten Produkten das DBMS IBM Informix die beste Unterstützung für komplexe Struktur- und Kollektionstypen bietet. Um die Leistungsfähigkeit des Verfahrens besser beurteilen zu können, nimmt die Arbeit Untersuchungen des nötigen Zeitbedarfs und des erforderlichen Arbeits- und Datenbankspeichers der Implementierung vor und bewertet die Ergebnisse.