Tag Archives: Suchmaschinen

Neue Buchveröffentlichung: Web-2.0-Dienste als Ergänzung zu algorithmischen Suchmaschinen

30 Aug

von Dirk Lewandowski & Christian Maaß

Mit Frage-Antwort-Diensten – wie z. B. Yahoo Clever oder LycosIQ – ist eine Ergänzung oder sogar eine Konkurrenz zu den bisherigen Ansätzen in der Web-Suche entstanden. Während Google und Co. automatisch generierte Trefferlisten bieten, binden Frage-Antwort-Dienste die Anwender als Fragesteller und Antwortgeber in die Suche ein. Insofern handelt es sich bei diesen Diensten um eine Art „menschliche Suchmaschine“, bei der die Suchanfragen von Anwendern und nicht durch einen Suchmaschinenroboter beantwortet werden. Der Fragesteller erhält dabei direkte Antworten und muss nicht die häufig langen und unübersichtlichen Suchergebnislisten durchsuchen, so die Vision.

Die hier skizzierte Vision führt unmittelbar zu der Frage, inwieweit solche Suchdienste in der Praxis tatsächlich mit traditionellen Suchmaschinen konkurrieren oder diese qualitativ ergänzen können. Der vorliegende Band beleuchtet die hier aufgeworfene Fragestellung aus verschiedenen Perspektiven, um auf die Bedeutung von Frage-Antwort-Diensten zu schließen.

Das Buch kann direkt beim Verlag oder über den Buchhandel bezogen werden. Alternativ stehen das Buch und die einzelnen Artikel an dieser Stelle zum kostenlosen Download zur Verfügung; eine kompakte Zusammenfassung ausgewählter Ergebnisse wurde im Rahmen eines Fachbeitrags in der Zeitschrift “Information – Wissenschaft und Praxis” veröffentlicht, der hier ebenfalls zum Download zur Verfügung steht:

Visuelle Suche: Marktüberblick und Trends

20 Jul

Es ist allgemein bekannt, dass algorithmenbasierte Suchmaschinen wie Google und Yahoo zu den meistgenutzten Internetanwendungen zählen. Dies bedeutet allerdings nicht, dass solche Suchmaschinen automatisch die besten Suchergebnisse liefern und besonders anwenderfreundlich sind. Nicht zuletzt aus diesen Gründen wird seid geraumer Zeit über alternative Suchdienste diskutiert. Dabei steht momentan die Auseinandersetzung mit semantischen Suchdiensten im Vordergrund (wie z. B. Powerset, Evri, Hakia, Trueknowledge, Spock, etc.), die eine Formulierung natürlichsprachiger Suchanfragen unterstützen sollen – so die Vision. Die in diesem Zusammenhang geführte technische Diskussion stellt vordergründig auf Themen wie Maschinenlernen, Natural Language Processing oder SPARQL ab. Weitaus weniger Beachtung wurde in letzter Zeit der Präsentation von Suchergebnissen und der Navigation durch die Ergebnislisten geschenkt. Gerade aber in diesem Bereich lassen sich interessante Ansätze identifizieren, die – vor allem im Bereich der vertikalen Suche – einen deutlichen Mehrwert im Vergleich zu horizontalen Suchmaschinen wie Google bieten. Im weiteren Verlauf werden daher ausgewählte Suchmaschinen vorgestellt, die sich mit der Visualisierung von Suchergebnisseiten und der Navigation durch große Datenbestände beschäftigen. Die in diesem Zusammenhang diskutierten Ansätze lassen sich drei Themenbereichen zuordnen:

  • Visuelle Suche im E-Commerce
  • Zeit- und domänenspezifische Visualisierung von Suchergebnissen
  • Visuelle Suchansätze ohne thematischen Schwerpunkt

Visuelle Suchansätze im E-Commerce haben insbesondere im Zuge der Auseinandersetzung mit dem viel beschworenen Web 2.0 an Bedeutung gewonnen. Kennzeichnend für diese Suchmaschinen ist es, dass sie eine farb- oder konturenbasierte Suche unterstützen, um z. B. ähnliche Kleidungsstücke zu identifizieren. Bekannte Beispiele für diesen Suchmaschinentyp sind Like.com, Pixsta, Etsy oder DaWanda. Wenngleich mit einer stark visuell ausgerichteten Präsentation der Suchergebnisse lange Ladezeiten einhergehen, bieten sie dennoch einen entscheidenden Vorteil für die Shopbetreiber: Im Vorfeld von Kaufentscheidungen suchen potenzielle Käufer gezielt im Internet nach Fotos und Videos. Eine visuelle Suche kann insofern – in Abhängigkeit der angebotenen Produkte – in idealtypischer Weise die Informationsbedürfnisse der Anwender befriedigen. Besonders deutlich kommt dieser Vorteil im Automobilbereich zum tragen. So kommt eine Studie von eMarketer zu dem Ergebnis, dass ein Käufer durchschnittlich zwischen vier und sechs Stunden im Internet nach Fotos und Videos ihrer präferierten Fahrzeuge suchen. 60 % dieser Zeit enfällt dabei auf die Suche nach Bildern und Videos. Die verbleibenden Zeit verwenden die Kaufinteressenten mit der Suche nach textbasierten Informationen (z. B. Preise, Leistungsmerkmale etc.), die jedoch erst im späteren Zeitpunkt des Kaufentscheidungsprozesses an Bedeutung gewinnen.

Eine Vorreiterrolle im Bereich der visuellen Suche nimmt ebenfalls der C2C-Marktplatz Etsy ein, der z. B. die ortsbasierte Suche nach Verkäufern auf visuellem Wege unterstützt. Mit lediglich einem Klick auf eine Landkarte erhält der Anwender hier Informationen zu verschiedenen Anbietern. Darin ist eine Vereinfachung bei der Suche zu sehen, da die Anwender nicht mehr dazu gezwungen sind, teilweise sehr komplexe Suchmasken auszufüllen, wie das z. B. bei Spezialsuchen im Immobilienbereich der Fall ist.

Auf einer ähnlichen Grundidee wie Etsay basiert BrowseGoods. Der Anwender kann hier – im einfachsten Fall durch die Bedienung der Scrollradfunktion einer herkömmlichen Maus – in Produktgruppen zoomen, um durch verschiedenen Produktvarianten zu navigieren. Gleichzeitig wird aus der Größe der verschiedenen Kategorien ersichtlich, wie viele Produkte der jeweiligen Kategorie zugeordnet sind.

Unter dem Stichwort „zeitbasierte Visualisierung“ werden solche Suchansätze subsumiert, die eine zeitbasierte Sortierung und visuelle Aufarbeitung der Suchergebnisse unterstützen. Eine solche zeitbasierte Visualisierung bieten redaktionell gepflegte Angebote bereits seid geraumer Zeit an. Exemplarisch hierfür sei z. B. die BBC Library genannt. Bei diesem Projekt werden historische Ereignisse aus dem Vereinigten Königreich auf einer Zeitleiste abgetragen. Auf diesem Wege ist es für den Anwender faktisch möglich, die Geschichte im Zeitverlauf zu durchreisen. Die technische Herausforderung bei visuellen Suchverfahren ist nun darin zu sehen, eine entsprechende Aufarbeitung die Suchergebnisse auf automatischen und nicht auf manuellem Wege zu generieren. In diesem Zusammenhang stellt sich z. B. die Frage, an welcher Stelle einer Zeitleiste ein im Jahr 2008 verfasster Artikel über die Rolle Otto von Bismarcks im Zuge der Gründung des deutschen Kaiserreichs visualisiert werden sollte. Es erstaunt wahrscheinlich kaum, dass die Realisierung einer solchen Informationsvisualisierung einen erheblichen Aufwand verursacht. So besteht z. B. ein Bedarf an NLP-Tools und verschiedenen linguistischen Verfahren, um bestimmte Entitäten (z. B. Personen, Ereignisse etc.) extrahieren auf einer Zeitleiste zueinander in Bezug zu setzen. Eine solche Umsetzung erfolgt z. B. im Alexandria-Projekt.

In eine ähnliche Richtung wie das Alexandria-Projekt geht auch die Nachrichtensuche SiloBreaker. Auf Grundlage von News-Feeds werden hier Nachrichten in Form von Personennetzwerken visualisiert, wobei zum einen Beziehungen zwischen Personen untereinander und Beziehungen zwischen Personen und Ereignissen angezeigt werden. In so einem Netz wird im Zuge der Suchanfrage nach Hillary Clinton z. B. eine enge Beziehung zu Barack Obama und den Ereignissen “Präsidentschaftswahl” und “SuperTuesday” aufgezeigt. Zum anderen bietet SiloBreaker in Abhängigkeit des Veröffentlichungszeitpunktes der News-Feeds eine visuelle Auswertung des Artikelvolumens an, um Trends bezüglich der Popularität bestimmter Themen zu visualisieren.

Weiterhin lassen sich im Bereich der vertikalen Suche verschiedene Ansätze identifizieren, die auf eine starke Visualisierung ihrer Daten oder auf ein besonders Informationsdesign setzen. Bei Marumushi handelt es sich um eine Art Nachrichtensuche, bei der die Nachrichten in Abhängigkeit ihrer Domäne und Veröffentlichungszeitpunktes in verschiedenen Farben und Größen dargestellt werden. Damit wird die Aufmerksamkeit des Lesers auf visuellem Wege auf bestimmte Themen gelenkt, die zum Zeitpunkt des Seitenbesuchs als besonders wichtig zu werten sind. Die Dienste MusicMap und Musicovery kann man in einer weiten Begriffsumschreibung ebenfalls als eine Art visuelle Suche zu interpretieren. Sie versuchen auf in Form verschiedener Farbkombinationen und Graphen ähnlich Musiker in Bezug zueinander zu setzen, um dem Anwender relevante Musikvorschläge anzeigen zu können.

Der Großteil der bislang vorgestellten Suchdienste fokussierte sich auf bestimmte Themengebiete. Aber auch im Hinblick auf die allgemeine Websuche existieren interessante Ansätze. Dabei stehen vor allem SearchMe und Viewzi im Vordergrund. SearchMe präsentiert die Suchergebnisse z. B. in Form von Screenshots der betreffenden Seiten. Auf den ersten Blick wirkt diese Ergebnispräsentation visuell ansprechend. Die damit verbundenen langen Ladezeiten und der Umstand, dass die Ergebnisse nur schlecht zu lesen sind, spricht zum gegenwärtigen Zeitpunkt jedoch gegen eine dauerhafte Nutzung.

Fazit: Zum gegenwärtigen Zeitpunkte existieren zahlreiche Ansätze, um Suchergebnislisten auf visuellem Wege besser aufzuarbeiten und die Navigation durch komplexe Datenbestände zu unterstützen. Mit Blick auf ihren Verbreitungsgrad muss jedoch konstatiert werden, dass bislang keiner der hier geschilderten Dienste einen hohen Bekanntheitsgrad in der breiten Öffentlichkeit erringen konnte. Ein Grund hierfür mag sicherlich darin bestehen, dass Google nach wie vor auf traditionellem Wege zufrieden stellende Suchergebnisse liefert und ein Großteil der Internetnutzer deshalb nicht nach alternativen Suchansätzen Ausschau hält. Hinzu kommt der Umstand, dass die visuellen Suchmethoden teilweise sehr lange Ladezeiten haben, bis die Suchergebnisse präsentiert werden. Letztendlich setzen zeitbasierte Visualisierungsmethoden ein äußerst komplexes Datenmodell voraus, um verschiedene Sichten auf den Datenbestand zu generieren. Die dazu erforderlichen Techniken – insbesondere im Bereich des semantischen Webs – befinden sich zu großen Teilen noch im Forschungsstadium.

Social Bookmarking und Tagging in der Praxis

9 Jul

von Christian Maaß und Dirk Lewandowski

Algorithmenbasierte Suchmaschinen wie Google und Yahoo sind bereits seid längerer Zeit Gegenstand empirischer und theoretischer Forschungsarbeiten. Trotz der intensiven Auseinandersetzung mit diesem Thema muss jedoch konstatiert werden, dass die Relevanz der Suchergebnislisten dieser Suchmaschinen häufig gering ist [GMPO08]. Es erstaunt daher nicht, dass bereits seid länger Zeit die Frage gestellt wird, inwieweit alternative Suchdienste in qualitativer Hinsicht mit algorithmenbasierten Suchmaschinen konkurrieren und zu einer Verbesserung der Internetsuche beitragen können [Ne05]. Besonders aussichtsreich erscheinen dabei Social-Bookmark-Systeme, bei denen Webseiten nicht von einem Suchmaschinenroboter, sondern von teilweise mehreren tausend Menschen gemeinschaftlich indiziert werden [GMH07]. Sie konnten insbesondere im Zuge der Diskussion um das so genannte Web 2.0 eine große Aufmerksamkeit entfachen [Ma08]. Wie auch für viele Web-2.0-Anwendungen typisch, basiert die Funktionsweise der Bookmarksysteme im Wesentlichen auf Tags: Indem die Anwender Bookmarks mit Schlagworten („Tags“) annotieren und auf einem Social-Bookmark-Dienst wie Mister Wong oder Deli.cio.us im Internet veröffentlichen, tragen sie zu einer Verbesserung der Auffindbarkeit der Bookmarks bei. Aus der Kombination aller im Index vorhandenen Tags entsteht dann ein gemeinschaftlicher und – im Gegensatz zu algorithmischen Suchmaschinen – von Menschen aufgebauter Index, eine so genannte Folksonomie. Sie ermöglicht die Navigation durch das Beziehungsgeflecht von Bookmarks und Tags.

Aus diesen Ausführungen geht hervor, dass die Tagqualität eine zentrale Rolle spielt, damit Social-Bookmark-Systeme befriedigende Suchergebnisse generieren. Erste empirische Untersuchungen deuten aber darauf hin, dass ein Großteil der Bookmarks nicht mit Tags ausgezeichnet wird [Le06]. Es hat sich weiterhin gezeigt, dass die Fehleranfälligkeit menschlicher Eingaben bei der Verschlagwortung und das Fehlen systematischer Beziehungen zwischen den Schlagworten eine Erschließung der Webinhalte durch Tags erschweren [HMD08]. Dies führt zu der grundlegenden Frage, welchen Stellenwert Social-Bookmarking-Systeme im Allgemeinen und das Konzept des Tagging im Speziellen in der Praxis spielen und inwieweit die Anwender mit diesen Anwendungen bzw. Konzepten vertraut sind.

Methodische Vorgehensweise und Beschreibung der Stichprobe

Zur Beantwortung der im vorangegangenen Abschnitt skizzierten Forschungsfrage wurde im Frühjahr 2008 über einen Zeitraum von einer Woche eine Benutzerbefragung auf dem Internet-Portal Lycos durchgeführt. Der Fragebogen wurde dabei nur auf der Suchseite des Portals eingebunden. Insofern konnte in gewissen Grenzen sichergestellt werden, dass vordergründig Anwender an der Umfrage teilnehmen, die zur Befriedigung ihrer Informationsbedürfnisse gezielt auf Suchdienste zurückgreifen. Gerade bei diesen Anwendern liegt es nahe zu hinterfragen, welche Erfahrungswerte sie mit alternativen Suchdiensten wie dem Social Bookmarking und dem in diesen Kontext diskutierten Konzept des Tagging haben.

Der Fragebogen deckte vier Bereiche ab: (1) allgemeine Fragen zu Suchmaschinen, (2) bisherige Erfahrungen der Anwender mit Frage-Antwort-Diensten, (3) Fragen über Kenntnis und Anwendung von Social-Bookmark-Systemen und (4) Erfahrungen im Umgang mit Tags. In diesem Beitrag werden schwerpunktmäßig die Ergebnisse im Hinblick auf die Nutzung von Social-Bookmark-Diensten und die Erfahrungswerte der An-wender mit dem Konzept des Tagging beleuchtet.

An der Umfrage beteiligten sich insgesamt 714 Personen, bei denen zu statistischen Zwecken Daten über das Alter, Geschlecht und Internetnutzung erfragt wurden. Bei 60 % der Befragten handelte es sich um Männer, 32,75 % der Umfrageteilnehmer waren weiblich und 7,25 % gaben keine Angabe zum Geschlecht ab. Etwa 50 % der Befragten nutzt täglich das Internet und 83 % sind mehrmals pro Woche online.

Kurzdarstellung und Diskussion der Ergebnisse

Um eine Aussage zur Bedeutung von Social-Bookmark-Systemen treffen zu können, wurden als Vergleichswerte Fragen zu algorithmischen Suchmaschinen erhoben. Bezüglich der Nutzungsintensivität stellte sich dabei heraus, dass diese Suchmaschinen – wie auch schon in anderen Studien dokumentiert [AGOF08] – zu den bekanntesten und meistgenutzten Internetanwendungen zählen. Knapp 40 Prozent der befragten Anwender (n = 714) nutzen diese Dienste mehrfach pro Woche. Im Gegensatz dazu sind Social-Bookmark-Systeme momentan noch vergleichsweise unbekannt. So gaben 73,51 % der Befragten an, diese Dienste weder zu kennen noch zu nutzen (vgl. Abb. 1). Social-Bookmark-Systeme sind insofern noch nicht in der breiten Bevölkerung bekannt und nach wie vor eine Domäne sehr erfahrener Internetnutzer.

Auch im Hinblick auf die Nutzungsintensität konnten Social-Bookmark-Systeme bislang noch nicht mit algorithmenbasierten Suchmaschinen aufschließen. So stellte sich z. B. heraus, dass knapp 42 % der Befragten Social-Bookmarking-Systeme seltener als einmal im Monat nutzen. Die wichtigsten Gründe für die bislang geringe Nutzungsintensität wurden darauf zurückgeführt, dass bislang kein Verwendungszweck für diese Angebote bestand (40 % der Befragten) oder deren Funktionsweise unklar blieb (26,61 % der Befragten); wie sich im weiteren Verlauf noch zeigen wird, bereitete den Anwendern insbesondere das Konzept des Tagging große Probleme.

Zum jetzigen Zeitpunkt wäre es aufgrund dieses Umstands allerdings verfrüht darauf zu schließen, dass Social-Bookmark-Systeme keine Daseinsberichtigung haben. Vielmehr beklagten auch 60 % der Nutzer algorithmenbasierter Suchmaschinen die fehlende Relevanz der Ergebnislisten oder die hohe und unübersichtliche Zahl der Suchergebnisse. Weiterhin wurden massive Werbeeinblendungen (52 % der Befragten) und tote Links bei Suchmaschinen wie Google und Yahoo als störend empfunden (30 % der Befragten). 75 % der Befragten, die Social-Bookmark-Systeme kennen und nutzen (n =17), gaben jedoch an, dass sie zufrieden bis sehr zufrieden mit diesen Diensten sind. Zum Ver-gleich: Bei algorithmenbasierten Suchmaschinen beläuft sich dieser Wert auf 91,5 %. In Anbetracht des noch frühen Lebenszyklus von Social-Bookmark-Systemen ist dieser hohe Wert beachtlich.

Der im Zuge der Untersuchung gewonnene Eindruck, dass die Bedienung von Social- Bookmark-Diensten auf Probleme stößt, spiegelte sich auch im Hinblick auf das Tagging wider. Bei der Frage, ob Internetnutzer den Begriff Tagging kennen und diese Funktionalität nutzen, gaben 84,12% der Umfrageteilnehmer an, dass ihnen dieses Konzept nicht bekannt sei. 10,07% der Befragten sind zwar mit diesem Konzept vertraut, allerdings nutzen sie die manuelle Verschlagwortung nicht (vgl. Abb. 3). von Social-Bookmark-Systemen ist dieser hohe Wert beachtlich.

Weiterhin stellte sich heraus, dass bei den Befragten grundsätzlich ein geringer Anreiz zur Verschlagwortung besteht (vgl. Abb. 4). So gaben mehr als 50 Prozent der Befragten an, nur selten Tags zu vergeben. Die Gründe für die geringe Akzeptanz lagen vor allem darin, dass die Anwender entweder das Konzept des Tagging nicht verstehen oder bislang keinen Verwendungsgrund für die Verschlagwortung sahen.

Der hohe Unbekanntheits- und Nutzungsgrad des Tagging im Zuge dieser Umfrage lässt sich unter anderem auf das hohe Durchschnittsalter der Befragten zurückführen (vgl. Abschnitt 2), zumal Web-2.0-Dienste bislang überwiegend von jüngeren Bevölkerungsgruppen genutzt werden. Dennoch ist das hier skizzierte Umfrageergebnis alarmierend, zumal die Funktionalität von Web-2.0-Anwendungen im Allgemeinen und die der Social-Bookmark-Systeme im Speziellen auf dem Konzept des Tagging aufbaut. Um die Auffindbarkeit von Bookmarks und damit auch die Qualität dieser Dienste zu verbessern, bedarf es somit einer drastischen Vereinfachung des Tagging. Ein Ansatzpunkt in diese Richtung könnte darin bestehen, den Prozess des Tagging zu automatisieren. Erste Testergebnisse deuten darauf hin, dass auf diesem Wege eine Verbesserung der Annotationen zu erwarten ist [HMD08]. Auch im Zuge dieser Untersuchung stellte sich heraus, dass so ein Ansatz auf großes Interesse stößt: So gaben 40 Prozent der Befragten an, sie wünschen sie eine Vorschlagsfunktion, bzw. sie nutzen eine Vorschlagsfunktion für Tags, wenn der Anbieter entsprechende Funktionalitäten bereitstellt. Im Gegensatz dazu bevorzugen lediglich 8 Prozent der Befragten eine individuelle Verschlagwortung.

Fazit

Unsere Untersuchung hat gezeigt, dass Social-Bookmark-Systeme zum gegenwärtigen Zeitpunkt noch nicht in der breiten Bevölkerung angekommen sind. Der Teil der Befragten, die diese Dienste nutzen, ist mit diesen Angeboten jedoch zufrieden. Als problematisch ist der Umstand anzusehen, dass das Konzept des Tagging (besonders bei älteren Anwendergruppen) auf Probleme stößt. Der Fokus weiterer Forschungsarbeiten sollte vor diesem Hintergrund darauf liegen, das Konzept des Tagging drastisch zu vereinfachen. Auch im Hinblick auf die sich anbahnende Konvergenz des Web 2.0 und semantischen Webs ist dies von höchster Bedeutung: Der Erfolg beider Ansätze basiert im Wesentlichen auf der Qualität der Metadaten.

Der Beitrag wurde in ähnlicher Form für die Konferenz “Mensch & Computer 2008” angenommen. Weitere Studienergebnisse – z. B. im Hinblick auf die Bedeutung von Frage-Antwort-Diensten – werden in Kürze hier veröffentlicht.

Der Markt für Internet-Suchmaschinen

17 Mai

von Christian Maaß, Andre Skusa, Andreas Heß und Gotthard Pietsch

SuchmaschinenmarktMit dem exponentiellen Wachstum des Internets sind Suchmaschinen wie Google und Yahoo zu den meistgenutzten Internetanwendungen avanciert, die etwa 90 Prozent der Internetnutzer in Deutschland regelmäßig zu Recherchezwecken nutzen (vgl. auch AGOF 2008). Insbesondere im Vorfeld von Kaufentscheidungen spielen sie – sowohl für Unternehmen als auch Privathaushalte – eine immer wichtigere Rolle, um gezielt nach bestimmten Produkten und/oder Dienstleistungen zu recherchieren (vgl. Maaß/Scherm 2007). Zur Befriedigung ihrer Informationsbedürfnisse können die Anwender grundsätzlich auf verschiedene Suchmaschinen zurückgreifen; allein für den deutschsprachigen Raum sind weit über hundert verschiedene Suchmaschinen verfüg-bar (vgl. für einen Überblick z. B. www.mysuche.de).

Mit Blick auf die Praxis muss jedoch ein Oligopol algorithmenbasierter Suchmaschinen – bestehend aus Google, Yahoo und MSN – konstatiert werden, dass den weltweiten Markt dominiert und dessen Vormachtstellung man in der Öffentlichkeit bereits seit geraumer Zeit kritisiert. Teilweise wird in diesem Zusammenhang darauf hingewiesen, dass aufgrund dieser Marktkonstellation eine Gefahr für die Informationsvielfalt und -auswahl im Internet besteht, die nahezu durch eine Handvoll Unternehmen mit kommerziellen Interessen beeinflusst wird (vgl. hierzu auch Gasser/Thurman 2007). Zu ähnlichen Äußerungen kommt es seitens der Bundesregierung (vgl. Die Grünen 2005, 2006), die bereits seit längerer Zeit auf die Monopolisierungstendenzen im Suchmaschinenmarkt hinweist und sich für ein größeres Angebot alternativer Suchdienste ausspricht. Grundsätzlich kann man in jüngerer Zeit auch beobachten, dass in zunehmenden Maße Suchmaschinen mit alternativen Suchansätzen in den Markt treten. Exemplarisch hierfür seien die vom Wikipedia-Gründer Jimmy Wales gegründete Suchmaschine Wikia (vgl. www.wikia.com) oder die zahlreichen sozialen Suchdienste genannt, bei denen die Anwender in die Generierung des Indexes bzw. der Suchergebnisse einbezogen werden (vgl. hierzu z. B. Gräfe/Maaß 2008). Immer häufiger wird auch über die Bedeutung der Suche mit mobilen Endgeräten debattiert, in der man einen großen Wachstumsmarkt sieht. In Anbetracht dieser Entwicklungstendenzen drängen sich unweigerlich verschiedene Fragen auf, die mit der Wettbewerbssituation auf dem Suchmaschinenmarkt zusammenhängen:

  • Welche alternativen Suchansätze gibt es?
  • Welche Marktchancen haben Suchmaschinen mit neuen Suchansätzen?
  • Inwieweit ist die Marktposition algorithmenbasierter Suchmaschinen gegenwärtig angreifbar?

Im weiteren Verlauf dieses Beitrags werden diese Fragen ausführlicher diskutiert. Zu diesem Zweck gilt es zunächst die Entwicklung und wirtschaftliche Bedeutung des Suchmaschinenmarktes aufzuarbeiten. Sodann erfolgt auf Basis einer industrieökonomischen Perspektive die Auseinandersetzung mit den hier skizzierten Fragestellungen. Ein Fazit fasst die erarbeiteten Ergebnisse zusammen.

Der Beitrag wird in ähnlicher Form im “Handbuch Suchmaschinen” erscheinen, das von Prof. Dr. Dirk Lewandowski herausgegeben wird und im Sommer/Herbst erscheint.

Download: Der Markt für Internet-Suchmaschinen (First Draft!)

Soziale Suchdienste und algorithmenbasierte Suchmaschinen im Vergleich

16 Mär

Soziale Suchdienste und algorithmenbasierte Suchmaschinen im Vergleich

In jüngerer Zeit kann man beobachten, dass im zunehmenden Maße Suchmaschinen mit alternativen Suchansätzen in den Markt treten. Eine besondere Rolle spielen dabei die so genannten sozialen Suchdienste, die in verschiedenen Ausprägungsformen existieren und bei denen die Anwender – im Gegensatz zu Suchmaschinen wie Google, Yahoo oder Ask – in die Generierung des Indexes einbezogen werden. Bislang steht die wissenschaftliche Auseinandersetzung mit solchen Suchdiensten jedoch noch am Anfang. Im Rahmen eines Projektes mit Prof. Dr. Dirk Lewandowski haben wir im Wintersemester 2007/2008 daher ein Seminar zum Thema „Soziale Suchdienste“ durchgeführt. Dabei ging es unter anderem darum, die Trefferrelevanz von algorithmenbasierten Suchmaschinen mit sozialen Bookmarksystemen und Frage-Antwort-Diensten zu vergleichen. An dieser Stelle möchte ich in Kurzform einen Teil der Ergebnisse vorstellen, die in wenigen Wochen ausführlicher als Herausgeberband erscheinen; die unten skizzierten Ergebnisse entstammen der Seminararbeit von Olga Gammer, Heidi Meißner, Magdalena Preckel und Robert Oehlert.

Um eine Antwort darauf zu finden, inwieweit soziale Suchdienste mit Google & Co. konkurrieren können, wurde ein Relevanztest mit den folgenden drei Suchdiensttypen durchgeführt:

  • Bei den algorithmenbasierten Suchmaschinen wurden Google, Yahoo und MSN gewählt, bei denen es sich um die drei größten Suchmaschinen mit einem eigenen Index handelt.
  • Mit Mister Wong und del.icio.us wurden das bekannteste deutschsprachige und englischsprachige soziale Bookmarksystem in die Untersuchung mit aufgenommen.
  • Schließlich wurden auch die Frage-Antwort-Dienste LycosIQ und Yahoo Clever in die Auswertung einbezogen, die ebenfalls als eine Ausprägung sozialer Suchdienste anzusehen sind.

An jeder der hier genannten Suchdienste wurden über 50 Suchanfragen gestellt, deren Ergebnisse einer Gruppe von Juroren anonymisiert vorgelegt wurde. Den Juroren war somit weder der Rank der Suchergebnisse noch die zu evaluierende Suchmaschine bekannt. Unter anderem wurden dabei die

  • Precision der Suchergebnisse,
  • Verständlichkeit der Suchergebnisse und
  • Vertrauenswürdigkeit der Suchergebnisse bewertet.

Die Precision bezieht sich auf den prozentualen Anteil der relevanten Treffer im Vergleich zur Gesamtzahl der gefundenen Treffer. Dabei stellte sich heraus, dass Google mit einer Precision von 46 Prozent am besten abschnitt (vgl. Abb. 1). Im Vergleich zu MSN liefert Google etwa 15 Prozent mehr relevante Treffer. Vergleicht man die algorithmischen Suchmaschinen mit den Social-Bookmarking- und Frage-Antwort-Diensten, erzielen letztgenannte deutlich mehr relevante Ergebnisse. Das insgesamt schlechte Abschneiden der Bookmarksysteme wurde vor allem darauf zurückgeführt, dass sie sehr viele tote Treffer aufweisen und offenbar Probleme haben, ihren Index auf einem aktuellen Stand zu halten.

Precision

Abb. 1: Precision der Suchergebnisse

Auch im Hinblick auf die Verständlichkeit der Suchergebnisse, wiesen die Bookmarksysteme den größten Anteil unverständlicher Treffer auf. Besonders auffällig war dabei, dass die Juroren bei del.icio.us 25 Prozent aller Treffer als unverständlich bewerteten (vgl. Abb. 2).

Verständlichkeit

Abb. 2: Verständlichkeit der Suchergebnisse

Weiterhin wurde überprüft, inwieweit die Suchergebnisse als vertrauenswürdig wahrgenommen wurden. Auch bei diesem Kriterium schnitten Google & Co. eindeutig besser als soziale Bookmarksysteme ab (vgl. Abb. 3).

Vertrauen

Abb. 3: Vertrauenswürdigkeit der Suchergebnisse

Aus den an dieser Stelle nur knapp skizzierten Ergebnissen geht hervor, dass soziale Suchdienste zum gegenwärtigen Zeitpunkt noch nicht mit algorithmenbasierten Suchmaschinen konkurrieren können. Dem ist aber auch hinzuzufügen, dass soziale Bookmarkdienste zur Verwaltung privater Linksammlungen und nicht als Suchdienst konzipiert wurden.

Nachtrag (20.03.2008): Die vollständigen und ausführlichen Ergebnisse dieses studentischen Projektes werden Mitte 2008 sowohl als Herausgeberband als auch als kostenloses PDF veröffentlicht. Die PDF-Datei wird auf der Seite von Prof. Dr. Dirk Lewandowski und auf dieser Seite veröffentlicht.

Alternative Suchdienste: Sieben Thesen zur Bedeutung des Social Bookmarking

6 Mär

von Christian Maaß, Gernot Gräfe und Andreas Heß

sabreMit dem exponentiellen Wachstum des Internet sind Suchmaschinen wie Google und Yahoo zu den meistgenutzten Internetanwendungen avanciert, die etwa 90 Prozent der Internetnutzer in Deutschland regelmäßig zu Recherchezwecken nutzen (vgl. auch AGOF 2007). Insbesondere im Vorfeld von Kaufentscheidungen spielen sie – sowohl für Unternehmen als auch Privathaushalte – eine immer wichtigere Rolle, um gezielt nach bestimmten Produkten und/oder Dienstleistungen zu recherchieren (vgl. Maaß 2008). Zur Befriedigung ihrer Informationsbedürfnisse können die Anwender grundsätzlich auf verschiedene Suchmaschinen zurückgreifen; alleine auf der Internetseite „Suchfibel“ sind mehr als 600 verschiedene Suchmaschinen aufgelistet (vgl. www.suchfibel.de). Mit Blick auf die Praxis muss jedoch ein Oligopol algorithmenbasierter Suchmaschinen – bestehend aus Google, Yahoo und MSN – konstatiert werden, dass den weltweiten Markt dominiert.

Die Vormachstellung von Google und Co. wird in der Öffentlichkeit bereits seit geraumer Zeit kritisiert. Teilweise sieht darin z. B. eine Gefahr im Hinblick auf die Informationsvielfalt und -auswahl im Internet, die faktisch durch eine Handvoll Unternehmen mit kommerziellen Interessen beeinflusst wird. Zu ähnlichen Äußerungen kommt es seitens der Bundesregierung, die bereites seit längerer Zeit auf die Monopolisierungstendenzen im Suchmaschinenmarkt hinweist und sich für ein größeres Angebot alternativer Suchdienste ausspricht (vgl. 2006). Es erstaunt daher kaum, dass immer häufiger die Frage gestellt wird, inwieweit alternative Suchdienste in qualitativer Hinsicht mit algorithmenbasierten Suchmaschinen konkurrieren und zu einer Verbesserung der Internetsuche beitragen können (vgl. Neymanns 2005).

Vor diesem Hintergrund ist in der Wirtschaftspresse häufig von so genannten soziale Bookmarksystemen die Rede, bei denen Webseiten nicht von einem Suchmaschinenroboter, sondern von teilweise mehreren tausend Menschen gemeinschaftlich indiziert und bereits als Alternative zu Google & Co. angesehen werden. „Allerdings ist es erstaunlich, dass [...] nur wenige Untersuchungen zur Qualität von Suchmaschinen vorliegen, sowohl international als auch (besonders eklatant) im deutschsprachigen Raum“ (Lewandowski 2007, S. 244-245). In einem in Zusammenarbeit mit Gernot Gräfe und Andreas Heß entstandenen Beitrag erarbeiten wir daher sieben Hypothesen zur zukünftigen Bedeutung sozialer Bookmarksysteme im Bereich der Internetsuche, um eine konzeptionelle Grundlage für weitere Studien in diesem Kontext zu legen. Der hier angehängte Beitrag wurde auf der SABRE-Konferenz 2007 in der Rubrik “Social Semantic Web” präsentiert.

Download: Alternative Suchdienste: Sieben Thesen zur zukünftigen Bedeutung des Social Bookmarking

 

Literatur

Die Grünen (2006): Google verleibt sich YouTube ein – und wird noch mächtiger, Onlinedokument 2006.

Lewandowski, D. (2007): Mit welchen Kennzahlen lässt sich die Qualität von Suchmaschinen messen? In: Machill, M.; Beiler, M. (Hrsg.): Die Macht der Suchmaschinen, Köln, 2007, S. 243-258.

Maaß, C.: E-Business Management – Gestaltung von Geschäftsmodellen in der vernetzten Wirtschaft, Stuttgart, 2008.

Neymanns, H. (2005): Suchmaschinen: Das Tor zum Netz, Bundestagsfraktion der Grünen, Berlin, Onlinedokument 2005.

Suchbefehle für Google

1 Mär

Empirische Studien weisen darauf hin, dass die meisten Suchanfragen bei Google & Co. im Durchschnitt aus lediglich ein bis zwei Suchwörtern bestehen. Weiterführende Parameter oder Suchoptionen werden nur in den seltensten Fällen genutzt. In der Regel sind viele Suchbefehle sogar vollkommen unbekannt. Dies gilt z. B. für Suchanfragen, um nach MP3-Dateien, Aktienkursen oder bestimmten Dokumenten zu recherchieren. In diesem Beitrag sollen daher ausgewählte Suchbefehlte vorgestellt werden, um Suchanfragen präziser formulieren zu können.

Einfache Suchbefehle:
Um Google bestmöglich nutzen zu können, reichen oftmals schon einfache Suchbefehle aus, um Suchanfragen zu präzisieren.

  • Suchwort A +Suchwort B: Das Wort hinter dem „+“ muss in den Suchergebnissen auftauchen.
  • Suchwort A -Suchwort B: Das Wort hinter dem „-“ darf nicht in den Suchergebnissen vorkommen. Anders formuliert wird nur nach dem Suchwort A, nicht jedoch nach Suchwort B gesucht.
  • „Suchwort A Suchwort B“: Es werden nur Suchergebnisse angezeigt, bei denen die Suchwörter zwischen den Anführungszeichen in exakter Reihenfolge aufgelistet werden.
  • *bahn: Bei dieser Suchanfrage fungiert der Stern fungiert als Platzhalter. In den Suchergebnissen führt Google alle Ergebnisse auf, die auf „bahn“ enden, wie z. B. Autobahn, Eisenbahn, etc.
  • ~auto: Durch diese Suchanfrage werden in der englischen Version von Google nach Synonymen gesucht. Bei dem hier verwendeten Beispiel würde Google insofern Seiten mit dem Begriff „Auto“ und „car“ auflisten.

Fortgeschrittene Suchbefehle:

Neben diesen Basisbefehlten kann man mit Google auch gezielt nach Musikdateien oder Filmen recherchieren. Es ist jedoch wichtig darauf hinzuweisen, dass die dabei identifizierten Webseiten teilweise illegale Inhalte enthalten können. Im Folgenden werden diese weiterführenden Suchbefehle skizziert.

  • Der Befehl -inurl:htm -inurl:html intitle:”index of” mp3 “madonna” zeigt alle Webseiten zum Suchbegriff „Madonna“ auf, bei denen MP3-Dateien in ungeschützten Verzeichnissen liegen. Analog kann man nach anderen Interpreten suchen.
  • Einfacher gestaltet sich die Suche nach MP3 jedoch mit den diversen MP3 Suchmachinen, die in den letzten Monaten enstanden sind, wie z. B. BeemMP3, Skreemr oder Tagoo. Einen ausführlichen Bericht zu MP3-Suchmaschinen gibt es bei Heise-Online.

Fortsetzung folgt.