Knowledge Graph: Google will Daten & Fakten in Zukunft automatisch sammeln

search 

Vor gut zwei Jahren hat Google den Knowledge Graph in der Websuche eingeführt und kann seitdem zu vielen Suchanfragen harte Fakten und nützliche Informationen liefern, die für grobe Recherche-Arbeiten des Nutzers meist schon ausreichen. Bisher müssen diese Informationen allerdings händisch eingepflegt werden und sind daher sehr zweitaufwendig. Jetzt möchte Google diesen Prozess automatisieren und hat den „Knowledge Vault“ entwickelt.


Die Informationen aus dem Knowledge Graph, die etwa Daten und Fakten zu Personen, Orten und Marken liefern kann stammen in vielen Fällen nur aus wenigen von Menschen gepflegten Quellen. An erster Stelle steht die Wikipedia, die sehr oft für Beschreibungen und Bilder zum Einsatz kommt. Logische Verknüpfungen und Fakten liefert das CIA World Fact Book und Freebase. Das Wachstum dieser Daten ist natürlich auf menschliche Kapazitäten begrenzt und geht Google nun nicht mehr schnell genug.

Google Knowledge Graph

Da mit einer sehr hohen Wahrscheinlichkeit ALLE Informationen im Internet zu finden sind, und Google dieses ohnehin komplett indiziert hat, möchte man nun Bots & Spider unter dem neuen Programm Knowledge Vault nach Informationen suchen und diese dem Knowledge Graph zu Gute kommen lassen. Dadurch sollen nicht mehr nur Fakten gewonnen werden, sondern diese auch logisch miteinander verknüpft und dadurch neue Informationen gewonnen werden.

Die Verifizierung der Informationen findet dabei lediglich durch Abgleich mit vielen weiteren Quellen statt, wenn alle die gleichen Informationen liefern müssen diese zwar immer noch nicht richtig sein – meist schreibt der eine vom anderen ab – aber mit einer Wahrscheinlichkeit von 90 Prozent (so Google), sind diese dann korrekt. Mit diesem Wert kann man sich nicht zufrieden geben, aber er ist erst einmal ausreichend um das System in einen Testlauf zu schicken.

Dadurch soll Google in Zukunft nicht mehr nur die Frage nach dem morgigen Wetter beantworten können, sondern auch eine Antwort auf die gezielte Frage haben WARUM das Wetter morgen so wird. Wenn man einmal so weit ist, eignet sich dieses System auch als gutes Recherche-Tool und ist auf einem sehr guten Weg zum intelligenten System. Interessant wird das ganze natürlich auch dann, wenn auch persönliche Daten des Nutzers (Mails, Termine,…) mit einbezogen werden.


Zur Darstellung solcher Informationen entwickelt Google derzeit auch neue Konzepte wie etwa die Zeitleiste im Knowledge Graph mit dem sehr viele Informationen auf kleinstem Raum übersichtlich präsentiert werden können.

Noch ist das System nicht scharf geschaltet, in den nächsten Tagen möchten die Entwickler aber weitere Details nennen und könnten eventuell einen Testlauf ankündigen. Ein sehr umfangreiches Dokument zur Funktionsweise ist bereits Online zu finden und enthält viele technische Details zur Erkennung, Verifizierung und Aufbereitung von Informationen und wie diese miteinander verknüpft werden können.

» PDF-Dokument: From Big Data to Knowledge

[AndroidPolice]



Teile diesen Artikel: