Archive for the 'Folksonomies' Category

Tagging bei Connotea, untersucht

One important outcome of the study is the observation that almost half of the tags (46%) are not found in the document text. This shows that users’ tags considerably add to the lexical space of the tagged resource.

Alle, die sich gern differenziert mit Folksonomies und Tagging beschäftigen, werden den Aufsatz von Markus Heckner, Susanne Mühlbacher und Christian Wolff von der Universität Regensburg zu ihrer Untersuchung des Tag-Verhaltens bei Connotea sicher bereits zur Kenntnis genommen haben. Falls nicht, hiermit also der Hinweis und der Link: Tagging tagging. Analysing user keywords in scientific bibliography management systems

So ‘taggen’, dass es Sinn ergibt: Ein Literaturhinweis.

Unser Blogkollege Patrick Danowski hat in seiner Auswertung des Vortrags zu den Grenzen der Anwendung Sozialer Software in Bibliotheken, den Boris (2.0) und ich auf dem Bibliothekartag präsentieren durften, zu Recht darauf hingewiesen, dass wir die Forschung zu den Phänomenen Folksonomies und Tagging im Vortrag nicht berücksichtigten. Dies ließ sich im vorgegebenen Rahmen leider nicht umfänglich berücksichtigen. Da es uns vor allem um das allgemeine Aufzeigen von Argumenten und Fragestellungen, die dringlich einer vertiefenden Diskussion bedürfen, ging, musste dieser Aspekt leider in die zweite Reihe und aus dem Vortrag hinaus rücken.

Wer sich für die Tagging-Forschung interessiert, findet einen interessanten Ansatz in einer Arbeit von Bertrand Sereno, Simon Buckingham Shum und Enrico Motta, die auf das Problem einer fehlenden diskursiven Ebene beim Einsatz von Tags hinweisen:

Collaborative, social, tagging holds promise as an approach to mediating these processes via the Web, but may lack the discourse dimension that is fundamental to the articulation of interpretations. We therefore take a hybrid semiformal approach to add structure to freeform folksonomies. Our experience demonstrates that this particular brand of tagging requires tools designed specifically for this sensemaking task by providing enough support to initiate the annotation, while not overwhelming users with suggestions.

Ein Tag als den Gegenstand in irgendeiner Form und Wertigkeit – die nicht immer erkennbar ist – beschreibendes Zeichen, erscheint als zweiseitige Verbindung zwischen dem konkret beschriebenen Gegenstand und einer abstrakt gegebenen Idee, die vom Taggenden aus einer bestimmten Assoziation und Motivation heraus als kennzeichnend angesehen wurde. Für den externen Beobachter und erst recht für eine zunächst nur die Verbindung zwischen dem konkreten Objekt und dem Tag auswertenden Maschine, bleibt dieser Hintergrund unsichtbar. Erkannt werden kann nur die eine Hälfte des Auszeichnungsprozesses, über die andere kann man bestenfalls, wenn man Wissen über den Kontext besitzt, mutmaßen:

“[...] following the social tagging paradigm, annotators in our approach will tag only those elements in a text that reflect their interests (there is no gold standard set of tags that can be automatically extracted, since there is no single, authoritative meaning).”

In ihrem Paper stellen die Autoren verschiedene Dimensionen des Problems heraus und ein Werkzeug namens “Claimspotter” vor:

ClaimSpotter is designed to support document sensemaking tasks: reading, highlighting areas of potential interest, making notes, looking for specific kinds of papers in the bibliography, and so forth. While researchers clearly do this all the time on paper, or with freetext annotations in various document viewers, the challenge was to support users in these tasks with our semantic tagging approach.

Der Volltext steht hier bereit: Formalization, User Strategy and Interaction Design: Users’ Behaviour with Discourse Tagging Semantics

Folksonomies und Bibliotheken, eine Themenausgabe des ASIS&T-Bulletins

Wer den Einführungsbeitrag zur Nutzung Sozialer Software in Bibliotheken von Jürgen Plieninger, Edlef Stabenau und Lambert Heller in der aktuellen Ausgabe von B-I-T online (Never run a changing system? – Über die Chancen des Einsatzes “Sozialer Software” in der Bibliotheksarbeit) schon gelesen hat, kann im aktuellen ASIS&T-Bulletin (October/November 2007) seine Kenntnisse mit einen kleinem Einführungsartikel von Diane Neal von der School of Library and Information Sciences, North Carolina Central University und einigen weiteren Beiträgen zum Thema Folksonomies vertiefen. So liest man bei Daine Neal u.a. folgende Erkenntnis, die man durchaus bei der Implementierung einer “Bibliothek 2.0″ im Hinterkopf behalten sollte:

In the end, many online users need and want control over the representation of their own documents. The sheer volume of tags and folksonomies present in today’s online environment (and, we must assume, the success users find in searching on their own tags for later retrieval) provides sufficient evidence that information professionals should not attempt to impede the folksonomy phenomenon. Some folksonomy skeptics argue in favor of more traditional, controlled approaches to online document representation, such as top-down hierarchical taxonomies and faceted schemes. These methods certainly hold value in many contexts, but it seems counterproductive to simply dismiss the value of user-assigned descriptors. It seems more productive for us to work with users in the development of mostly unfettered, but still appropriately controlled, tagging systems. This practice is becoming known in some circles as collabulary.

Introduction Folksonomies and Image Tagging: Seeing the Future?

Bedeutungslos? Joshua Schachter erläutert die del.icio.us-Philosophie

“Beware librarians” – some people want to give tags a specific, underlying meaning. Don’t let them.

Del.icio.us-Gründer Joshua Schachter fasst in diesem undatierten Text ein paar Erfahren aus der Entwicklung von Web 2.0-Angeboten zusammen.

Das Internet leidet an zuviel Information, erklärt Andrew Cantor bei USA Today

The Web will continue to grow, but it will also splinter more and more often as bursts its britches.

Andrew Cantor, CyberSpokesman bei USA Today, stellt fest: Internet suffering from information overload und weist den allgemeinen USA Today-Leser zum Beispiel auf Probleme der Folksonomien hin:

The problems with tagging are obvious as you think about it. There’s polysemy— the same word but with different meanings, e.g., apple or window.

Then there’s the opposite — different words for the same thing. What if the best article on television has been tagged “tele” by a Brit, but you search on “TV”? Or tagged as “cat” and you search on “cats”?

When you have a lot of people doing the tagging, of course, the aggregate wins out and while you’ve have plenty of people using “TV” and “tele,” the majority will (hopefully) use “television.” But the majority’s tags will tend to be broader because there’s more overlap in a broad space than a narrow one — that is, there are more people who will think of something as a “dog,” and fewer who will think of it as a “Bulgarian Shepherd Dog.”

Ergo, there are going to be a lot of things tagged “dog” (294 million as I write this). But the Net is so big that even the narrow category is overloaded. There are 219,000 Google hits on “Bulgarian Shepherd Dog.”

Tagging-Theorie, mit Tim Spalding von Library Thing

The Summer of my German Soldier is actually a pretty good book (I hear). Although Amazon won’t let me confirm it, one suspects all five negative tags come from one user. Is it fair to let one anonymous reader shape a book’s tag cloud so completely?

Ich weiß nicht genau, ob wir When tags work and when they don’t: Amazon and LibraryThing von Library Thing Chef Tim Spalding schon hatten, ich halte ihn aber in jedem Fall – besonders angesichts des Trends, auch OPACs mit Tagfunktion zu versehen – für sehr lesenswert. Denn wie auch bei anderen Anwendungen Sozialer Software ist es hier notwendig darauf zu achten, dass man eine gewisse kritische Masse an Partizipanten und/oder eine Art “Redaktion” mit einschaltet um einerseits eine allzu einseitige Bewertung von Titeln zu gewährleisten und andererseits bei Rezensionen auch eine gewisse Qualität abzusichern und auch Missbrauch (Flaming etc.) vorzubeugen. Abgesehen davon sollte man, sofern solche Vorhaben des Catalogue Enrichment plant, auch die anderen Hinweise, die sich in Spaldings Text finden, berücksichtigen, soweit sie sich für Bibliothekskataloge anwenden lassen (besonders natürlich den letzten):

  • Figure out why your customers would want to tag your stuff. Don’t fool yourself.
  • Make tagging as easy as possible. (Amazon’s are quite easy to add, although registration is a pain.)
  • Understand that commercial tagging can turn people off. Avoid crass commercialism. Respect your taggers—these people are helping you out!
  • Make taggers feel like it’s “their” thing. Encourage users to give out their tag URLs—people love to show off—and let them export their tags any way they want.
  • Keep tagging social. Stop selling and start connecting. If you connect people up right, the selling will follow. Think Tupperware!
  • Consider whether a non-commerce site has the data you need. Back when LibraryThing had a million tags, Amazon could have bought our data for the price of a cup of coffee. Now, that we’re big and important and have three employees, that’ll be THREE cups of coffee, buster!

Eine weitere Tagging-Erkenntnis findet sich in einem (noch) aktuelleren Posting bei Thingology:

the trend is clear. The more you have to keep track of, the more you tag.

Die Web-Informations-Prosumer erschließen sich selbst: der aktuelle Pew Internet Report.

Just as the internet allows users to create and share their own media, it is also enabling them to organize digital material their own way, rather than relying on pre-existing formats of classifying information.
(…)
On a typical day online, 7% of internet users say they tag or categorize online content.

Im aktuellen Pew Internet Report geht es um Tagging, bei dem die Internetnutzer bekanntlich Internetinhalte selbst inhaltserschließen können. Und anscheinend tun sie es ganz gern und intensiv und selbst wenn es so manche im Bereich der bibliothekarischen Sacherschließung geschulten Informationsprofis nicht wahrhaben wollen, scheint dieses Verfahren im Alltagsgebrauch zusammen mit einer “googlianischen” Volltexterschließung für den Standardbedarf an Internetinhalten effektiver als die eine oder andere Virtuelle Fachbibliothek.
Wenn ich eine ViFa aufbauen würde (könnte, dürfte..), wäre eine diesbezügliche Einbindung meiner Benutzer jedenfalls einer der vorrangigen Aspekte, denn letztlich wissen die Benutzer im Netzwerk (Stichwort: Schwarmintelligenz) zumeist noch besser, welche WWW-Quellen für sie relevant sind, als es der Bibliotheksmitarbeiter tut, der zentnerweise gegoogelte Links in eine Black Box schaufelt. Und wenn eines Tages die Benutzer der Virtuellen Fachbibliotheken dank Catalogue Enrichment auch noch im OPAC die Printmaterialien über ihre Folksonomien ergänzend erschließen…dann sind wir wohl bei der Virtuellen Fachbibliothek 2.0 angekommen.

Folksonomies, als Power Law

What amazes scientists is that this simple, uncoordinated system works so well. In spite of the enormous number of alternative words that can be used as tags, people tend to converge on a narrow vocabulary. Plotting the rank of the words versus their frequency reveals that tag vocabulary, like word usage in languages such as English, follows a power law. The most common word occurs twice as often as the next most common, which occurs twice as often as the next, and so on.

Der “Tagger” taggt einfach so vor sich hin und der Wissenschaftler wundert sich: Die Verteilung des Vokabulars der Folksonomies bei del.icio.us etc. folgt anscheinend einem so genannten Power Law. Das meldet jedenfalls der Nachrichtenticker des Science Magazine: Folk Wisdom for Web Sites