Die Technik hinter dem Google Ranking

Google

Im Mai hat sich Google entschlossen, seinen Nutzern mehr Infos über die Google Technik zur Verfügung zu stellen. Vor einigen Wochen gab nun ein Googler weitere Infos wie das Ranking bei Google funktioniert.

Wie schon beim letzten Mal, möchte ich Euch auch heute einen Teil des Google Blog Postings übersetzen:

Wenn wir über Anfragen bei Google sprechen verwenden wir eckige Klammern [ ], um den Anfang und das Ende der Suche zu markieren. Eine Schreibweise die ich in diesem Post verwenden werde. (Seiten und Suchergebnisse verändern sich regelmäßig, daher kann es sein, dass sich einige Beispiele hier nicht so verhalten wie erklärt)

Seiten verstehen: Über die Jahren haben wir viel in unser Crawl und Index System investiert. Als Resultat haben wir einen großen und aktuellen Index. Im Bezug auf Größe und Aktualität haben wir unseren Indes auf andere Wege verbessert. Eine der Schlüsseltechnologien, die wir entwickelt haben um Webseiten zu verstehen ist das Assoziieren von Konzepten einer Seite, auch wenn sie nicht offensichtlich sind. Wir finden die offizielle Webseiten der Sprovieri Gallery in London für eine italienische Suchanfrage [galleria sprovieri londra], obwohl die Webseite weder London noch Londra enhält. Ein Amerikaner, der nach [cool tech pc vancouver, wa] sucht, findet die Homepage von cooltechpc.com, obwohl die Seite nicht erwähnt, das sich in Vancouver, WA, sind. Andere Techniken lassen uns die Wichtigkeit von Worten unterscheiden und sagen uns die Aktualität der Webseite

Anfragen verstehen: Es ist schwer, dass wir das verstehen was unsere Nutzer suchen, neben den wenigen Worten in ihrer Anfrage. Daher haben wir einige bemerkenswerte Fortschritte auf diesem Gebiet gemacht: Rechtschreibkontrolle, Vorschläge, Synonyme und ein starkes Analyse Konzept.

Die meisten Nutzer haben unser Rechtschreibsystem schon das ein oder andere Mal genutzt. Es erkennt, wenn jemand nach [kofee annan] googlet, dass er in Wirklichkeit nach Mr. Kofi Annan sucht, und Vorschlägte: Meinten Sie: kofi annan; sucht jemand hingegen für [kofee beans], dann meint er coffee beans. Das ganze international mit einer hohen Genauigkeit anzuwenden ist sehr schwierig, aber wir machen es gut.

Synonyme sind die Grundlage für unsere Arbeit mit dem Verstehen von Anfragen. Das ist eines der schwierigsten Probleme, dass wir bei Google lösen wollen. Obwohl für die Nutzer manchmal offensichtlich, ist des ein ungelöstes Problem beim der automatischen Sprachverarbeitung. Als Nutzer denke ich nicht darüber nach welche Worte ich für meine Suche nutze. Oft weiß ich nicht welche die richtigen Worte sind. Genau da kommt unser Synonymesystem in Aktion. Es kann unterscheiden für was eine Abkürzung in einer Suche heißt. zum Beispiel steht das „Dr“ bei der Suche [Dr Zhivago] für Doctor, bei [Rodeo Dr] meint es Drive. Googlet jemand nach [back bumper repair] bekommt er Ergebnisse über die Reparatur der hinteren Stoßstange. [Ramstein ab] liefert Resultate für die Ramstein Air Base, mit [b&b ab] Bed and Breakfasts in Alberta, Canada gemeint. Dieses Level des Verstehens von Suchen haben wir für fast 100 Sprachen entwickelt, und darauf sind wir sehr stolz.

Eine weitere Technik, die wir in unserem Ranking System Nutzen ist die Identifikation von Konzepten. Das verarbeiten von schwierigen Konzepten erlaubt uns mehr relevante Suchergebnisse wiederzugeben. Zum Beispiel versteht unser Algorithmus, dass bei [new york times square church] nach einer bekannten Kirche im Times Square gesucht wird und nicht nach Artikeln der New York Times. Wir hören aber nicht mit dem Identifikation von Konzepten auf; Wir nutzen weitere Konzepte um die Suchanfrage zu verbessern, zum Beispiel, wenn jemand nach [PC and its impact on people] schaut und sucht tatsächlich nach den Auswirkungen von Computern auf die Gesellschaft oder einer schaut nach [rainforest instructional activities for vocabulary] schaut aber nach Regenwald Lehrplänen. Unser Anfragen Analyse Algorithmus hat viele State of the art Techniken in sich eingebaut, und nochmals wir machen das international für fast jede Sprache in der wir Google anbieten.

Die Nutzer bestehen: Unsere Arbeit die Nutzerabsicht zu interpretieren, hat das Ziel dem User die Resultate zu liefern die er wirklich will, nicht nur das was sie in der Suchanfrage gestellt haben. Diese Arbeit beginnt mit einem Weltklasse-Lokalisierungs-System und macht mit einigen weiteren unserer Personalisierungstechnik weiter, zum Beispiel Universal Search.

Unser Fokus liegt darin „die besten lokalrelevanten Ergebnisse global zu servieren“ und wird in unserer Lokalisierungsarbeit ausgedrückt.
Die gleiche Suchanfrage bei unterschiedlichen Ländern getippt, kann ganz andere Resultate liefern. Sucht man in den USA nach [bank] sollte man Amerikanische Banken bekommen, anderes in Großbritannien: Dort sucht der Nutzer entweder nach Bank Fashion oder eben britischen Banken. Gleiches gilt auch für die vielen anderen englischsprachigen Ländern.[…]Sucht man in Australien, England und den USA nach football, ist jeweils etwas anderes gemeint. Diese Beispiele zeigen wie wir die lokalisierten Konzepte richtig hinbekommen haben. Die gleiche Suche kann in verschiedenen Ländern entscheidet unterschiedliche Dinge bedeuten. Zum Beispiel ist [Côte d’Or] eine Region in Frankreich – aber es ist auch ein großer Schokoladenhersteller im benachbarten französischsprachigen Belgien; und auch das bekommen wir richtig hin :-).

Personalisierung ist ein weiteres starkes Feature unserer Suche mit maßgeschneiderten Suchergebnissen für den individuellen Nutzer. So bekommen angemeldete Nutzer, die das Webprotokoll aktiviert haben Ergebnisse die sich an den Aufzeichnungen orientieren. Wenn jemand beispielsweise häufig nach Fußball Relevantem gesucht hat, bekommt er bei [giants] mehr Ergebnisse die mit Fußball zu tun haben, ein anderen bekommt vielleicht das Baseball Team. Ähnlich ist es wenn Sie Ergebnisse einer bestimmten Shoppingseite vorziehen. Sie bekommen dann erst Ergebnisse dieser Webseite, wenn Sie nach Produkten suchen. Durch Auswertungen wissen wir, dass die Nutzer mit der Personalisierung der Suche besser Ergebnissen bekommen.

Ein weiterer Fall von Nutzerabsicht ist die Suche [chevrolet magnum]. Magnum ist eine Auto von Dodge und nicht von Chevrolet. Daher zeigen wir Ergebnisse zu Dodge Magnum, aber mit einem Hinweis.

Unsere Arbeit an Universal Search ist ein weiteres Beispiel wie wir die Unserabsicht interpretieren, um ihnen das zugeben was sie (manchmal) wollen. Jemand der nach [bangalore] sucht, bekommt nicht nur wichtige Webseiten, er bekommt auch eine Karte, ein Video, das das Straßenleben in Bangalore. Auch aktuelle Nachrichten und Blogs über Bangalore werden gezeigt

» Google Blog

Was für den Erfolg von Google verantwortlich ist:

Eine kleine Seite: Eine einfache Seite ist schneller heruntergeladen und allgemein schneller vom Browser aufgebaut. Jeder extra Inhalt des Interfaces bremst das Laden der Seite ohne, dass die Nutzer davon profitieren können.

Komplexe Algorithmen mit einem einfachen Präsentation: Viele Suchfeatures benötigen einen Deal zwischen der Komplexität des Algorithmus und einer großen Analyse an Daten, um das möglichst flüssig zu gestalten. Der Trick: Alles komplexe hinter einem einfachen, intuitiven User Interface zu verstecken. Rechtschreibkontrolle, Auszüge, Sitelinks und Abfragenverfeinerung sind Beispiele für Funktionen die ausgefeilte Algorithmen benötigen und ständig verbessert werden. Für Nutzer unsichtbar, aber besser.

Features, die überall arbeiten Features müssen so gestalten sein, dass sie in allen Sprachen und Ländern funktionieren. Zum Beispiel das Problem mit der Rechtschreibkorrektur auf Chinesisch, wo die Anfragen oft nicht als Worte aufgebrochen sind oder Hebräisch/Arabisch, wo der Text von rechts nach links geschrieben ist.

Experiment, Experiment, Experiment. Durch Experimente versuchen wir, das was wir gemacht haben, zu bestätigen.
We try to verify that we’ve done the right thing by running experiments. Design, das viel versprochen hat, letztlich aber doch nicht sinnvoll war.

» Google Blog

Teile diesen Artikel: