Suche nach Informationen

Wie wir wissen beschäftigt sich die Informatik mit dem Lösen von Problemen aller Art. Wie gehen wir heutzutage häufig vor, wenn wir ein Problem haben oder etwas nicht wissen? Richtig, wir nutzen eine Suchmaschine. Das Wort googeln hat sich sogar schon in den allgemeinen Wortschatz für das Suchen nach Informationen geschlichen. Neben Google gibt es noch viele weitere Suchmaschinen, wie wir später sehen werden.

Wir wollen uns im folgenden Lernbereich mit folgenden Punkten auseinandersetzen:

  1. Wie können wir Suchmaschinen professionell bedienen, um schnell und sicher die gewünschte Informationen zu erhalten?
  2. Welche Arten von Suchmaschinen gibt es und wie funktionieren sie?
  3. Haben Suchmaschinen immer recht und welche Gefahren gehen von Ihnen aus?

Los gehts!

Aufgabe 1

Seht euch folgendes Video zur Funktionsweise von Suchmaschinen an!

Aufgabe 2

Füllt folgende Lücken und übernehmt den Text unter der Überschrift „Suche nach Information“ in euren digitalen Hefter.

Aufgabe 3

Lest die Übersicht über die verschiedenen Typen von Suchmaschinen und übernehmt anschließend die zusammengefassten Informationen unter der Zwischenüberschrift Suchmaschinentypen in euren digitalen Hefter.

Suchmaschinentypen

Die Frage nach der richtigen Suchmaschine bringt oft eine ganze Menge an Antworten und „Geheimtipps“ hervor oder bricht sogar eine Diskussion los, die eher einem Glaubenskampf ähnelt als einem sachlichen Austausch über sinnvolle Optionen. Und dann ist da noch die weitverbreitete Meinung: Google ist DIE Suchmaschine. Aber ist sie das wirklich? Die Wahrheit ist: Es kommt auf die gesuchte Information an. Und eine sicherlich sehr gut funktionierende Suchmaschine, wie z.B. Google, muss man erst einmal zielführend bedienen können. Es lohnt sich also ein Blick auf die unterschiedlichen Typen von Suchmaschinen und deren Vor- und Nachteile:

Der am weitesten verbreitete Suchmaschinentyp bietet eine indexbasierte Suche. Die Suchmaschine liest dabei mit Hilfe von Crawlern automatisch eine Vielzahl von WWW-Dokumenten ein, analysiert sie algorithmisch (also mit Hilfe eines Computerprogramms) und legt dann einen Suchindex an, der bei späteren Suchanfragen kontaktiert wird. Die bekanntesten Beispiele für indexbasierte Suchmaschinen sind Google, Bing, Yahoo oder Ask. Vorteil ist die Schnelligkeit, mit der die jeweiligen Suchergebnislisten angezeigt werden, sowie der Umfang des Indexes.

Ein Katalog enthält Suchergebnisse, die von Menschen vorher zusammengetragen und geordnet und ggf. auch manuell gewichtet wurden. Im Normalfall steckt hinter einem Katalog eine alphabetische oder nach thematischen Kriterien geordnete Liste. Beispiele sind Open Directories und Kindersuchseiten (wie fragFINN.de oder blinde-kuh.de). Vorteil dieses manuellen Angebots ist, dass ein Mensch bereits für den späteren Nutzer eine Vorauswahl getroffen hat.

Eine Metasuchmaschine erstellt keinen eigenen Suchindex, sondern greift auf den Datenbestand indexbasierter Suchmaschinen zurück. Die einzelnen Suchergebnisse der durchsuchten Index-Suchmaschinen werden durch die Metasuchmaschine gewichtet und in einer neuen Ergebnisliste zusammengefügt. Beispiele sind www.metager.de und www.ixquick.de. Der Vorteil einer Metasuchmaschine liegt in dem potenziell größeren Datenbestand, der aus der Verknüpfung der Einzelbestände resultiert. Metasuchmaschinen werden im Vergleich zu den indexbasierten Suchmaschinen nur noch wenig genutzt.

Außerdem unterscheidet man zwischen Suchmaschinen, die das gesamte frei zugängliche Netzwerk oder nur Teilbereiche des Netzwerks durchsuchen.

Zusammenfassung Suchmaschinentypen

Aufgabe 4

Bearbeitet das Abschlussquiz: https://www.classtime.com/code/DGMWWV

Als Namen für das Quiz tragt ihr bitte Klasse_Klassenbuchnummer ein. Beispiel: Die Schüler*in Gerda Taro aus der Klasse 7/8 mit der Klassenbuchnummer 99 trägt den Namen 78_99 ein. Wer seine Klassenbuchnummer nicht kennt, der findet sie in LernSax im Informatikkurs unter Dateien > Klassenbuchnummer.xlsx.

Mit falschem Namen gilt die Wochenaufgabe als nicht bearbeitet!

Zusatz: Funktionsweise einer indexbasierten Suchmaschine

Erkundet den Ablauf einer Suchanfrage aus Sicht des Nutzers und erwerbt zusätzliches Expertenwissen über die Vorgänge im Hintergrund:

Die Suche beginnt mit der Eingabe eines Suchbegriffs, z.B. [Berlin], in das Suchfeld.

Suchmaschinenbetreiber unterhalten weltweit Datenzentren mit Servern, auf denen der Index gespeichert ist. Im Hintergrund werden sofort ein oder mehrere Datenzentren ausgewählt. Bei der Auswahl des richtigen Datenzentrums spielen räumliche Nähe, Geschwindigkeit und Auslastungsgrad eine entscheidende Rolle.

Bei großen Suchmaschinen ist der Index speziell für eine parallele Abfrage gebaut. Dadurch muss jeder Server nur einen Teil der Suche durchführen und gemeinsam kann so der gesamte Index schneller durchsucht werden. Eine Suchmaschine sucht genau genommen nicht nach einem bestimmten Wort, sondern nach Buchstabenmustern.
Nachdem der Suchlauf durchgeführt und das erste Suchergebnis zusammengestellt ist, muss deshalb noch einmal eine Überprüfung durchgeführt werden. Vielleicht hat sich der Nutzer ja vertippt und wollte etwas ganz anderes suchen? Kann man das Wort auch auseinander schreiben? Die Suchmaschine versucht, dies nachzuvollziehen, und zeigt bei Bedarf einen besseren Suchvorschlag an. Bei der Eingabe von [berln] wird beispielsweise [Berlin] vorgeschlagen.

Die Index-Server enthalten ausschließlich Wörter und Adressen. Sie verweisen auf die sogenannten Doc-Server. Auf den Doc-Servern liegen der Titel, Textauszüge und weitere Daten aus den in der Informationsaufbereitungsphase (siehe oben) gespeicherten Dokumenten. Diese Informationen sind zum einen für die Ausgabe nützlich (z.B. für die kurzen Textauszüge unter den Adressen, genannt Snippets), zum anderen sind sie die Grundlage für den PageRank-Algorithmus (siehe „Wie kommt ein Ranking zustande?“).
Eine Maßnahme, um den Suchablauf hinter den Kulissen trotz dieses komplexen Verfahrens zu beschleunigen, besteht darin, Ergebnisse häufiger Suchanfragen wie z.B. [Berlin] zwischenzuspeichern, d.h. nicht jedes Mal aufs Neue den Index zu durchsuchen, sondern auf bereits „fertige“ Suchergebnisse zurückzugreifen.

Im letzten Schritt müssen die Suchinformationen nun noch nutzerfreundlich angezeigt werden.
Schließlich sollen auf den ersten Blick die wichtigsten Internetseiten für den eingegebenen Suchbegriff erkennbar sein. Im Allgemeinen klickt der Nutzer eines der ersten zehn Suchergebnisse an, Ergebnisse, die weiter unten in der Liste auftauchen (also auf nachfolgenden Seiten) werden seltener angeklickt. Die Reihenfolge der Treffer („Ranking“) wird durch einen Algorithmus festgelegt.

Ihr seid auf dem besten Weg zu echten Recherche-Genies!