IBI-Weblog » Suchmaschinen http://weblog.ib.hu-berlin.de Weblog am Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin Wed, 28 Jun 2017 08:24:09 +0000 en hourly 1 http://wordpress.org/?v=3.0.4 Google, was geht? Das Scenario Magazine berichtet aus dem Beta Lab. http://weblog.ib.hu-berlin.de/p=9071/index.html http://weblog.ib.hu-berlin.de/p=9071/index.html#comments Wed, 07 Sep 2011 15:42:20 +0000 Ben http://weblog.ib.hu-berlin.de/?p=9071 Thomas Geuken, Psychologe vom Copenhagen Institute for Future Studies, das thematisch zwangsläufig vieles erforscht, was auch die Bibliotheks- und Informationswissenschaft umtreibt, fuhr für das institutseigene Scenario Magazine ins New Yorker Beta Lab Googles und hat dabei ein an Einblicken reiches Interview mit der im Unternehmen für Forschung und Entwicklung verantwortlichen Corinna Cortes geführt. Beispielsweise zeigt [...]]]>

Thomas Geuken, Psychologe vom Copenhagen Institute for Future Studies, das thematisch zwangsläufig vieles erforscht, was auch die Bibliotheks- und Informationswissenschaft umtreibt, fuhr für das institutseigene Scenario Magazine ins New Yorker Beta Lab Googles und hat dabei ein an Einblicken reiches Interview mit der im Unternehmen für Forschung und Entwicklung verantwortlichen Corinna Cortes geführt.

Beispielsweise zeigt bereits die Kernfrage, was denn die wissenschaftliche Herausforderung der Arbeit bei Google ist, deutliche Parallelen zu dem, was unsere Disziplin tut:

“[...] how to learn in an incomplete world and a digital universe full of dirty data (vast amounts of user-generated data of very poor quality; ed.). This is where the true challenge for Google lies – to provide users with relevant and valid knowledge on the basis of a large quantitative body of data,”

In gewisser Weise lebt hier das alte Ziel der Fédération Internationale de Documentation (FID) fort, nämlich

“the collection and storage, classification, dissemination and utilization of all types of information” (vgl. Gisela Ewert and Walther Umstätter: “Die Definition der Bibliothek,” in Bibliotheksdienst 33 (1999), S.961)

Sie wird nur um die explizite Ausrichtung auf das Verhältnis zwischen dem Nutzer mit seinem konkreten Informationsbedürfnis und dem ubiquitären Infoversum erfüllt von dirty data erweitert. Google erscheint also als eine Art FID des 21. Jahrhunderts und da das Geschäftsmodell zu stimmen scheint, wohl auch mit stabilerer Perspektive und unbestritten gesamtgesellschaftliche größerer Wirkung. Das Ziel wird nicht nur formuliert und als Utopie skizziert, sondern in den Labs direkt in mannigfaltiger Weise durchgetestet.

Eine Variante betrifft das, was man als Social Curating und/oder Human Sorting bezeichnen kann. Die Prozessierung digital erfasster sozialer Beziehungen ermöglicht eine starke Individualisierung des Retrievals und beruht nicht zuletzt auf der Idee umfassender Empfehlungssysteme: Was meine Peers relevant erscheint, könnte auch für mich von Interesse sein. Weblogs wie dieser sind eine Vorstufe, Facebook und Google+ der Stand der Zeit. Sind Datenmengen und Datennutzungsgeschichte (was oft zusammend fällt) umfassend genug ist, sind solche Verfahren auch relativ präzise und natürlich datenschutzrechtlich hoch problematisch.

Das Ziel Googles ist, so der Beitrag und so die Beobachtung um Google+, die Zusammenführung der klassischen algorithmisierten Prozessierung enormer Datenmengen mit der zusätzlichen sozusagen Gegenspiegelung des Datennutzungsverhaltens. So jedenfalls lese ich den Satz:

“Mankind’s ability to find qualitative bits of data and knowledge is, in other words, something that Google would like to use to make their own data even more valid.”

Cortes betont, dass die “guten Daten” der Nutzer perspektivisch die Hälfte des verarbeiteten Datenbestandes bei Google ausmachen sollen. Hier zeigt sich schön der Unterschied zum Facebook-Ansatz: Dienen dort die Inhalte zur digitalen Konstruktion und Abbildung sozialer Beziehungen, nutzt man bei Google soziale Interaktionen zur Konstruktion und Abbildung von Datenstrukturen und Relevanzen.

Wofür das Unternehmen diese Relationierung nutzen kann, zeigt der Abschnitt What do the users think? Was hier pragmatisch zum Filtern sozusagen der Gelben Seiten dargestellt wird, nämlich Nutzern aufgrund der Reviews eine wertende Sortierung (“service”, “price” and “staff”) von verfügbaren Dienstleistern anzubieten, ist auf nahezu alles anwendbar, was sich adressieren und mit maschinenlesbaren Eigenschaften markieren lässt.

Steht das Verfahren, können auch Einzelaussagen in Texten nach bestimmten Kriterien von der Crowd bewertet und relationiert werden. Für Anwendungen des Semantic Web in der Wissenschaftskommunikation z.B. im Sinne eines Post-Reviewings dürfte dies von erheblichem Belang sein. Auch hier – und das wäre dann eine Aufgabe für die Forschung des Instituts für Bibliotheks- und Informationswissenschaft – lassen sich die vergleichsweise “schmutzigen” (bzw. semantisch eher armen) Daten automatisierter Zitationsanalysen mit qualitativen Verfahren zur Diskursannotation koppeln. Die große Frage ist dabei, ob die Crowd der Wissenschaftsgemeinschaften sich auf so etwas einzulassen bereit ist.

Google forscht offensichtlich zunächst lieber auf anderen Gebieten, z.B. der so genannten Augmented Reality:

“Corinna Cortes takes out her Android phone and snaps a photo of a Sprite can on the table in front of us. In best science fiction style, a scanning line runs back and forth on the display, and voilà, the telephone tells us that it is a Sprite in front of us and provides a lot of information about the object.”

Weiterhin erfährt der Autor des Beitrags etwas über den Übersetzungsdienst und erhält einen kleinen Einblick in das Engagement des Unternehmens bei der Entwicklung von Robot Cars, das wenigstens die Sportwagenliebhaber nicht allzusehr begeistern dürfte.

Inwiefern der Allround-Kuratierungsdienst Google als großer Datenverarbeitungsbruder uns damit und auch mit den anderen Diensten auf einen digitalen Paternalismus zuführt, wird an anderer Stelle zu diskutieren sein. Der Mensch ist offensichtlich ein Optimierungstier und liebt Sicherheit und Überblick. Beides verspricht das Unternehmen. Thomas Geuken geht damit leider ziemlich unkritisch um. Aber das war wohl auch Ziel des kleinen Reports, der mit viel Sympathie für Google und Corinna Cortes sowie Liebe zum Detail geschrieben wurde:

“She wears sneakers even at work.”

Den Artikel aus dem Scenario Magazine kann man hier abrufen: What’s up Google, New York?

]]>
http://weblog.ib.hu-berlin.de/?feed=rss2&p=9071 0
Bing ist besser als sein Vorbild, meint die New York Times http://weblog.ib.hu-berlin.de/p=7254/index.html http://weblog.ib.hu-berlin.de/p=7254/index.html#comments Fri, 10 Jul 2009 10:13:00 +0000 Ben http://weblog.ib.hu-berlin.de/?p=7254 People won’t start dumping Google en masse; Google is a habit. Die New York Times betrachtet Bing und Google im Vergleich und kommt zu dem Ergebnis: ” if you value your time, you should give Bing a fling.”: Bing, the Imitator, Often Goes Google One Better]]>

People won’t start dumping Google en masse; Google is a habit.

Die New York Times betrachtet Bing und Google im Vergleich und kommt zu dem Ergebnis: ” if you value your time, you should give Bing a fling.”: Bing, the Imitator, Often Goes Google One Better

]]>
http://weblog.ib.hu-berlin.de/?feed=rss2&p=7254 0
Semantic Web=Searchwiki, meint die NZZ http://weblog.ib.hu-berlin.de/p=6343/index.html http://weblog.ib.hu-berlin.de/p=6343/index.html#comments Fri, 28 Nov 2008 09:00:33 +0000 Ben http://weblog.ib.hu-berlin.de/?p=6343 Doch auch ohne RDF/XML-OWL-GRDDL lässt sich ein Semantic Web realisieren; auch ohne dass Programmierer die Bedeutung einer Web-Ressource in maschinenlesbarer Form vollständig durchdekliniert haben, können Maschinen aus verschiedensten Quellen Metainformationen ernten. Mit einer kürzlich lancierten Dienstleistung namens Searchwiki offeriert der kalifornische Suchmaschinenbetreiber [Google] den Benutzern die Möglichkeit, die Suchresultate direkt zu manipulieren. Durch diese Eingriffe [...]]]>

Doch auch ohne RDF/XML-OWL-GRDDL lässt sich ein Semantic Web realisieren; auch ohne dass Programmierer die Bedeutung einer Web-Ressource in maschinenlesbarer Form vollständig durchdekliniert haben, können Maschinen aus verschiedensten Quellen Metainformationen ernten. Mit einer kürzlich lancierten Dienstleistung namens Searchwiki offeriert der kalifornische Suchmaschinenbetreiber [Google] den Benutzern die Möglichkeit, die Suchresultate direkt zu manipulieren. Durch diese Eingriffe erhält die Suchmaschine ein Feedback, das es ihr erlaubt, die Qualität der Suchresultate zu verbessern.

Die Neue Zürcher Zeitung ist heute unterwegs, um ihren Lesern das Funktionieren von Suchmaschinen auf schlichte Weise zu erklären. Ob allerdings Ausführungen wie die obige tatsächlich fundiert und sinnvoll zu diesem Zwecke sind – darüber lässt sich streiten genauso wie darüber, was man unter Semantic Web eigentlich versteht. Vielleicht wäre es zu diesem Thema hilfreich gewesen, nicht nur mit einem Google-Vertreter zu sprechen, sondern sich zusätzlich eine weitere Expertise zum Beispiel aus der Schweizer Informationswissenschaft einzuholen. Mehr hier: Auf der Suche nach der Suchmaschine der Zukunft und Das Internet jenseits von Google

]]>
http://weblog.ib.hu-berlin.de/?feed=rss2&p=6343 1
Google-Telefonsuche, in Indien http://weblog.ib.hu-berlin.de/p=5989/index.html http://weblog.ib.hu-berlin.de/p=5989/index.html#comments Wed, 24 Sep 2008 14:25:02 +0000 Ben http://weblog.ib.hu-berlin.de/?p=5989 Consumers call up a toll-free number from either a landline or mobile and request the information they need. Google either delivers the information through an SMS or reads it out. Auch wer keinen Zugang zu digitalen Datendiensten und stattdessen vielleicht einen der seltenen klassischen Telefonanschlüsse besitzt, kann alsbald selbst mit einem Wählscheibentelefon Google nutzen. Vorausgesetzt [...]]]>

Consumers call up a toll-free number from either a landline or mobile and request the information they need. Google either delivers the information through an SMS or reads it out.

Auch wer keinen Zugang zu digitalen Datendiensten und stattdessen vielleicht einen der seltenen klassischen Telefonanschlüsse besitzt, kann alsbald selbst mit einem Wählscheibentelefon Google nutzen. Vorausgesetzt er lebt in Hyderabad, Delhi, Mumbai, Bangalore oder Kolkata. Mehr dazu gibt es in den rediff-news: Google entices mobile phone users with voice search

]]>
http://weblog.ib.hu-berlin.de/?feed=rss2&p=5989 1
Goog7e Birthday http://weblog.ib.hu-berlin.de/p=3110/index.html http://weblog.ib.hu-berlin.de/p=3110/index.html#comments Tue, 27 Sep 2005 13:07:30 +0000 Philipp_Mayr http://weblog.ib.hu-berlin.de/?p=3110 Google hat heute Geburtstag. 7 Jahre alt, also maximal in der 2ten Klasse. Mal sehen wie gut die Suche funktioniert, wenn Google Abitur macht! Meldungen zum Geburtstag: Googleblog: We wanted something special for our birthday… Heise: Google vergrößert den Suchindex SEW: End Of Size Wars? Google Says Most Comprehensive But Drops Home Page Count]]>

Google hat heute Geburtstag. 7 Jahre alt, also maximal in der 2ten Klasse. Mal sehen wie gut die Suche funktioniert, wenn Google Abitur macht!

Meldungen zum Geburtstag:

  • Googleblog: We wanted something special for our birthday…
  • Heise: Google vergrößert den Suchindex
  • SEW: End Of Size Wars? Google Says Most Comprehensive But Drops Home Page Count
  • ]]>
    http://weblog.ib.hu-berlin.de/?feed=rss2&p=3110 4