Der Text verrät den Standort: Eine Studie zur toponymischen Analyse von Bloginhalten

A correct result was defined as being when the extracted geographic focus subsumed the blog’s true location, or was within 100 miles of it. We had 295 matches out of 481 usable results for 61% accuracy. For the 295 matches, the average distance from the extracted location to the known location was 50.8 miles.

Das ResourceShelf verweist auf eine ziemlich interessante Untersuchung, in der das Web2.0 mit Web3.0-Technologie angegangen wird (Es funktioniert sicher auch Web1.0-Inhalten). Als Ausgangspunkt steht der etwas eigenwillige Wunsch, zu erfahren, wo sich ein Blog geografisch verorten lässt. Nicht jeder Blogger nutzt Geotagging und insofern liegt als Lösung nah, eine toponymische Analyse der Blogtexte und deren Abgleich mit einer Datenbank in Rückgriff auf eine OWL-Ontologie auszuprobieren. Die extrahierten Daten wurden entsprechend gefiltert und mit algorithmisch verarbeitet, mit der Realität verglichen und am Ende stand das zitierte Ergebnis. Den “Standort” eines Weblogs zu ermitteln gelingt allerdings nur, wenn der Blogger auch über seinen Standort schreibt. Sinnvoller scheint solch ein Ansatz, wenn man ermitteln möchte, welche Regionen besonders intensiv in Bloginhalten vorkommen, um daraus ein Trendbarometer zu entwickeln. Das wäre doch mal eine Idee für ein Start-Up-Unternehmen. Die reine Standortfrage unterläuft nämlich den Zeitgeist der kaum gebremsten Mobilität, die dazu führt, dass wir von allen möglichen Orten immer in denselben Blog schreiben können, der womöglich auf den Niederländischen Antillen gehostet wird. Und für die explizit ortsbezogenen Placeblogs ist in der Regel eine toponymische Auswertung des Blogtitels zureichend. Für Blogger, die nicht entsprechend analysierbar sein wollen heißt es ab jetzt, besser nur unscharfe Ortsbezeichnungen zu verwenden oder solche einzubauen, die mit dem Inhalt das Postings nichts zu tun haben. Marfa, Texas

Den Aufsatz zur Studie gibt es hier als PDF: Fink, Clay; Piatko, Christine, et al. (2008) Geolocating Blogs From Their Textual Content.

0 Responses to “Der Text verrät den Standort: Eine Studie zur toponymischen Analyse von Bloginhalten”


  1. No Comments

Leave a Reply

You must login to post a comment.