25 Jahre WWW (II): Vom Hypertext zum Author Rank. Oder: Wie Microsoft vor 25 Jahren beinahe das World Wide Web erfunden hätte und warum Google es bis heute nicht versteht.

Vor beinahe drei Jahren habe ich in einem kleinen Beitrag in der F.A.Z. auf einen Artikel der beiden Microsoft Vor-Denker Bill Gates und Nathan Myhrvold über das Prinzip Hypertext hingewiesen. Deren Artikel wurde von mir vor genau 25 Jahren – also im März 1989 – für die Zeitschrift Spektrum der Wissenschaft aus dem Amerikanischen übersetzt. So formulierten Gates und Myhrvold die Logik des Internet ausgerechnet im selben Monat, in dem Tim Berners-Lee im CERN sein Internet-Projekt vorstellte (siehe hierzu den Beitrag meines Czyslansky-Bruders Tim Cole hier im Blog).

Gates und Myhrvold schrieben vor 25 Jahren:
„Heutige Programme behandeln Dokumente als Dateien, die sich auf einer Computerdiskette befinden. Solche Dateien unterscheiden sich im Prinzip nicht wesentlich von einem Stück Papier oder gar von einer Papyrusrolle: Eine Textzeile folgt auf die andere. Dagegen stellt ein Programm für Koproduktionen mehrerer Autoren ein Dokument als komplizierte Datenstruktur dar, in der einzelne Textbrocken zu einem komplizierten Netz miteinander verflochten sind. Ein solches Dokument bezeichnet man als Hypertext.“

Gates und Myhrvold bezogen ihre Idee vom vernetzten Arbeiten lediglich auf die Struktur von Textdokumenten, die ihren sequentiellen Aufbau zu Gunsten einer dreidimensionalen Struktur überwinden.

Dass die Erstellung solcher Dokumente künftig aber selbst in elektronisch vernetzten Strukturen – im Internet – erfolgen sollte, darauf kamen die beiden nicht. Hätten sie sich beim Abfassen ihres kleinen Aufsatzes an den amerikanischen Ingenieur Vannevar Bush erinnert, dann würde heute wohl nicht Tim Berners-Lee als Begründer des Internet gelten, sondern Gates und Myhrvold.

Eigentlich ist das Internet schon 69 Jahre alt

Vannevar Bush war den beiden wohl ebenso vertraut, wie Berners-Lee. Dieser Vannevar Bush hat sich nämlich schon im Jahr 1945 das Internet erträumt. Ich möchte kurz aus seinem Traumprotokoll zitieren:

„Stellen Sie sich ein künftiges Arbeitsgerät zum persönlichen Gebrauch vor“, schrieb Bush damals, „das eine Art mechanisiertes privates Archiv oder Bibliothek darstellt . . . Wenn der Benutzer ein bestimmtes Buch zu Rate ziehen will, gibt er den Code über die Tastatur ein, und sofort erscheint die Titelseite des Buchs vor ihm, projiziert auf einen der Sichtschirme . . . Da dem Benutzer mehrere Projektionsflächen zur Verfügung stehen, kann er einen Gegenstand in Position lassen und weitere aufrufen. Er kann Notizen und Kommentare hinzufügen . . . Es braucht jedoch noch einen weiteren Schritt zur assoziativen Indizierung. Deren grundlegender Gedanke ist ein Verfahren, von jeder beliebigen Information – sei es Buch, Artikel, Fotografie, Notiz – sofort und automatisch auf eine andere zu verweisen . . . Es ist ein Vorgang, der zwei Informationen miteinander verbindet. Das ist das Kernstück . . . Der Benutzer drückt eine einzige Taste, und die Gegenstände sind dauerhaft miteinander verbunden . . . Ganz neue Arten von Enzyklopädien werden entstehen, bereits versehen mit einem Netz assoziativer Pfade . . . Der Chemiker, der sich mit der Synthese einer organischen Verbindung müht, hat alle Fachliteratur in seinem Labor vor sich, mit Pfaden, die sich mit Vergleichen zwischen Verbindungen befassen, und Seitenpfaden über ihre physikalischen und chemischen Eigenschaften . . . Es wird ein Berufszweig von Fährtensuchern entstehen, die sich damit beschäftigen, nützliche Pfade durch die ungeheure Menge von Aufzeichnungen und Dokumenten anzulegen.“

Google sucht Autoren, die dem Netz abhanden kommen: der Google Author Rank

Ja – so funktioniert das Internet heute: als vernetztes Erstellen von vernetzten Dokumenten. Und fast wäre es von Microsoft „erfunden“ worden. Aber was hat nun Google mit dem alldem zu tun?

Google hat das Finden der vielen Dokumente einfacher gemacht, in dem es anfangs das Prinzip der Vernetzung zum Kern seiner Algorythmen machte: je vernetzter – und verlinkter – ein Dokument ist, desto wichtiger muss es im Internet sein. Freilich stellte sich alsbald heraus, dass der Verlinkungsgrad eher auf die Sphäre der Konsumtion, denn auf die Sphäre der Produktion dieser Dokumente verwies. Ein gut verlinkter Text war selten ein Text, an dem wirklich viele Verfasser direkt und indirekt durch Zitation mitgewirkt hatten, sondern einfach ein häufig zitierter Text. Und so wurden gar die Zitateure zu den Königen des Web: die Vervielfältiger dominierten über die Erzeuger von Wissen.

Und so musste es früher oder später dazu kommen, dass Google auf die Idee kam, dass nicht der Grad der Vernetzung allein entscheidend sein durfte bei der Entscheidung über das berühmte Finde-Ranking, sondern dass der – originäre – Inhalt entscheidend sein sollte. Jeder Inhalt aber kommt von seinen Verfassen, von den Autoren. Und so entstand der Google Author Rank.

Der Google Author Rank soll künftig wesentlich über das Google Ranking eines Dokuments entscheiden: je größer die Themenkompetenz eines Autors, desto wichtiger soll sein Dokument sein. Also entscheidet Google erstmal über die Authentizität eines Dokuments und filtert ~~„dublicated content“~~ „duplicated content“ aus, um hernach über das Google+-Profil des Verfassers den Autor zu identifizieren. Hat ein Autor schon häufig über ein Thema publiziert und wurde „sein“ Content von vielen Lesern aufgerufen oder gar von Lesern mit eigenem guten Author Rank positiv bewertet, so ist der Artikel würdig, auf Rang 1 bei Google geführt zu werden.

Genial. Was soll daran falsch sein? Alles!

Denn gerade das vernetzte Arbeiten führt dazu, dass ein Inhalt immer seltener einem einzelnen Autoren zugeordnete werden kann. Die Kompilation wird zum Erkennungszeichen modernen Wissens. Über kurz oder lang – eher über „kurz“, denke ich – werden Urheberschaften nur noch selten festzumachen sein. Die Idee des Author Rank wird ad absurdum geführt. Mit der klaren Autorenzuordnung wird nicht nur unserem Urheberrecht der schwankende Boden entzogen, sondern auch dem Google Author Rank.

Was aber wird aus dem Internet nach Bush, Berners-Lee, Gates, Myhrvold und Google? Man wird sehen; in spätestens 25 Jahren.

2 Antworten

Tim Cole sagt:

1. April 2014 um 08:44

Ein genialer Text, fürwahr. Sogar die Typos sind genial. Dein „dublicated content“ enthält als Wortstamm das lateinische „dubius“, was laut Online-Wörterbuch als „zweifelhaft“ „schwankend“, „unentschlossen“ oder „unsicher“ übersetzt werden kann. Was uns lehrt, dass man nicht alles glauben sollte, was selbst ein von Google oder sonstwem hochgerankter Autor alles von sich gibt.
Michael Kausch sagt:

1. April 2014 um 10:29

Ich bin Franke und da ist es vom „duplicated“ zum „dublicated“ ein kleiner Schritt, lieber Dim Gole …