Clustering von deutschen Ortsnamen


Autoria(s): Wartena, Christian; Ederberg, Hans-Peter
Data(s)

2017

Resumo

Diese Studie untersucht Gruppen von Ortsnamen in Deutschland (in den Postleitregionen) nach vorhandenen Ähnlichkeiten. Als Messgröße wird ein Häufigkeitsvektor von Trigrammen in jeder Gruppe herangezogen. Mit der Anwendung des Average Linkage-Algorithmus auf die Messgröße werden Cluster aus räumlich zusammenhängenden Gebieten gebildet, obwohl das Verfahren keine Kenntnis über die Lage der Cluster zueinander besitzt. In den Clustern werden die zehn häufigsten n-Gramme ermittelt, um charakteristische Wortpartikel darzustellen. Die von den Clustern umschriebenen Gebiete lassen sich zwanglos durch historische oder linguistische Entwicklungen erklären. Das hier verwendete Verfahren setzt jedoch kein linguistisches, geographisches oder historisches Wissen voraus, ermöglicht aber die Gruppierung von Namen in eindeutiger Weise unter Berücksichtigung einer Vielzahl von Wortpartikeln in einem Schritt. Die Vorgehensweise ohne Vorwissen unterscheidet diese Studie von den meisten bisher angewendeten Untersuchungen.

Formato

application/pdf

application/zip

Identificador

http://serwiss.bib.hs-hannover.de/frontdoor/index/index/docId/1028

urn:nbn:de:bsz:960-opus4-10286

http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus4-10286

http://serwiss.bib.hs-hannover.de/files/1028/WartenaEderberg.pdf

http://serwiss.bib.hs-hannover.de/files/1028/Ortsnamen.zip

Idioma(s)

deu

Direitos

http://creativecommons.org/licenses/by-sa/4.0/

info:eu-repo/semantics/openAccess

Palavras-Chave #ddc:400
Tipo

workingpaper

doc-type:workingpaper