Google Im Mai hat sich Google entschlossen, seinen Nutzern mehr Infos über die Google Technik zur Verfügung zu stellen. Vor einigen Wochen gab nun ein Googler weitere Infos wie das Ranking bei Google funktioniert. Wie schon beim letzten Mal, möchte ich Euch auch heute einen Teil des Google Blog Postings übersetzen:
Wenn wir über Anfragen bei Google sprechen verwenden wir eckige Klammern [ ], um den Anfang und das Ende der Suche zu markieren. Eine Schreibweise die ich in diesem Post verwenden werde. (Seiten und Suchergebnisse verändern sich regelmäßig, daher kann es sein, dass sich einige Beispiele hier nicht so verhalten wie erklärt) Seiten verstehen: Über die Jahren haben wir viel in unser Crawl und Index System investiert. Als Resultat haben wir einen großen und aktuellen Index. Im Bezug auf Größe und Aktualität haben wir unseren Indes auf andere Wege verbessert. Eine der Schlüsseltechnologien, die wir entwickelt haben um Webseiten zu verstehen ist das Assoziieren von Konzepten einer Seite, auch wenn sie nicht offensichtlich sind. Wir finden die offizielle Webseiten der Sprovieri Gallery in London für eine italienische Suchanfrage [galleria sprovieri londra], obwohl die Webseite weder London noch Londra enhält. Ein Amerikaner, der nach [cool tech pc vancouver, wa] sucht, findet die Homepage von cooltechpc.com, obwohl die Seite nicht erwähnt, das sich in Vancouver, WA, sind. Andere Techniken lassen uns die Wichtigkeit von Worten unterscheiden und sagen uns die Aktualität der Webseite Anfragen verstehen: Es ist schwer, dass wir das verstehen was unsere Nutzer suchen, neben den wenigen Worten in ihrer Anfrage. Daher haben wir einige bemerkenswerte Fortschritte auf diesem Gebiet gemacht: Rechtschreibkontrolle, Vorschläge, Synonyme und ein starkes Analyse Konzept. Die meisten Nutzer haben unser Rechtschreibsystem schon das ein oder andere Mal genutzt. Es erkennt, wenn jemand nach [kofee annan] googlet, dass er in Wirklichkeit nach Mr. Kofi Annan sucht, und Vorschlägte: Meinten Sie: kofi annan; sucht jemand hingegen für [kofee beans], dann meint er coffee beans. Das ganze international mit einer hohen Genauigkeit anzuwenden ist sehr schwierig, aber wir machen es gut. Synonyme sind die Grundlage für unsere Arbeit mit dem Verstehen von Anfragen. Das ist eines der schwierigsten Probleme, dass wir bei Google lösen wollen. Obwohl für die Nutzer manchmal offensichtlich, ist des ein ungelöstes Problem beim der automatischen Sprachverarbeitung. Als Nutzer denke ich nicht darüber nach welche Worte ich für meine Suche nutze. Oft weiß ich nicht welche die richtigen Worte sind. Genau da kommt unser Synonymesystem in Aktion. Es kann unterscheiden für was eine Abkürzung in einer Suche heißt. zum Beispiel steht das "Dr" bei der Suche [Dr Zhivago] für Doctor, bei [Rodeo Dr] meint es Drive. Googlet jemand nach [back bumper repair] bekommt er Ergebnisse über die Reparatur der hinteren Stoßstange. [Ramstein ab] liefert Resultate für die Ramstein Air Base, mit [b&b ab] Bed and Breakfasts in Alberta, Canada gemeint. Dieses Level des Verstehens von Suchen haben wir für fast 100 Sprachen entwickelt, und darauf sind wir sehr stolz. Eine weitere Technik, die wir in unserem Ranking System Nutzen ist die Identifikation von Konzepten. Das verarbeiten von schwierigen Konzepten erlaubt uns mehr relevante Suchergebnisse wiederzugeben. Zum Beispiel versteht unser Algorithmus, dass bei [new york times square church] nach einer bekannten Kirche im Times Square gesucht wird und nicht nach Artikeln der New York Times. Wir hören aber nicht mit dem Identifikation von Konzepten auf; Wir nutzen weitere Konzepte um die Suchanfrage zu verbessern, zum Beispiel, wenn jemand nach [PC and its impact on people] schaut und sucht tatsächlich nach den Auswirkungen von Computern auf die Gesellschaft oder einer schaut nach [rainforest instructional activities for vocabulary] schaut aber nach Regenwald Lehrplänen. Unser Anfragen Analyse Algorithmus hat viele State of the art Techniken in sich eingebaut, und nochmals wir machen das international für fast jede Sprache in der wir Google anbieten. Die Nutzer bestehen: Unsere Arbeit die Nutzerabsicht zu interpretieren, hat das Ziel dem User die Resultate zu liefern die er wirklich will, nicht nur das was sie in der Suchanfrage gestellt haben. Diese Arbeit beginnt mit einem Weltklasse-Lokalisierungs-System und macht mit einigen weiteren unserer Personalisierungstechnik weiter, zum Beispiel Universal Search. Unser Fokus liegt darin "die besten lokalrelevanten Ergebnisse global zu servieren" und wird in unserer Lokalisierungsarbeit ausgedrückt. Die gleiche Suchanfrage bei unterschiedlichen Ländern getippt, kann ganz andere Resultate liefern. Sucht man in den USA nach [bank] sollte man Amerikanische Banken bekommen, anderes in Großbritannien: Dort sucht der Nutzer entweder nach Bank Fashion oder eben britischen Banken. Gleiches gilt auch für die vielen anderen englischsprachigen Ländern.[...]Sucht man in Australien, England und den USA nach football, ist jeweils etwas anderes gemeint. Diese Beispiele zeigen wie wir die lokalisierten Konzepte richtig hinbekommen haben. Die gleiche Suche kann in verschiedenen Ländern entscheidet unterschiedliche Dinge bedeuten. Zum Beispiel ist [Côte d'Or] eine Region in Frankreich - aber es ist auch ein großer Schokoladenhersteller im benachbarten französischsprachigen Belgien; und auch das bekommen wir richtig hin :-). Personalisierung ist ein weiteres starkes Feature unserer Suche mit maßgeschneiderten Suchergebnissen für den individuellen Nutzer. So bekommen angemeldete Nutzer, die das Webprotokoll aktiviert haben Ergebnisse die sich an den Aufzeichnungen orientieren. Wenn jemand beispielsweise häufig nach Fußball Relevantem gesucht hat, bekommt er bei [giants] mehr Ergebnisse die mit Fußball zu tun haben, ein anderen bekommt vielleicht das Baseball Team. Ähnlich ist es wenn Sie Ergebnisse einer bestimmten Shoppingseite vorziehen. Sie bekommen dann erst Ergebnisse dieser Webseite, wenn Sie nach Produkten suchen. Durch Auswertungen wissen wir, dass die Nutzer mit der Personalisierung der Suche besser Ergebnissen bekommen. Ein weiterer Fall von Nutzerabsicht ist die Suche [chevrolet magnum]. Magnum ist eine Auto von Dodge und nicht von Chevrolet. Daher zeigen wir Ergebnisse zu Dodge Magnum, aber mit einem Hinweis. Unsere Arbeit an Universal Search ist ein weiteres Beispiel wie wir die Unserabsicht interpretieren, um ihnen das zugeben was sie (manchmal) wollen. Jemand der nach [bangalore] sucht, bekommt nicht nur wichtige Webseiten, er bekommt auch eine Karte, ein Video, das das Straßenleben in Bangalore. Auch aktuelle Nachrichten und Blogs über Bangalore werden gezeigt
» Google Blog Was für den Erfolg von Google verantwortlich ist:
Eine kleine Seite: Eine einfache Seite ist schneller heruntergeladen und allgemein schneller vom Browser aufgebaut. Jeder extra Inhalt des Interfaces bremst das Laden der Seite ohne, dass die Nutzer davon profitieren können. Komplexe Algorithmen mit einem einfachen Präsentation: Viele Suchfeatures benötigen einen Deal zwischen der Komplexität des Algorithmus und einer großen Analyse an Daten, um das möglichst flüssig zu gestalten. Der Trick: Alles komplexe hinter einem einfachen, intuitiven User Interface zu verstecken. Rechtschreibkontrolle, Auszüge, Sitelinks und Abfragenverfeinerung sind Beispiele für Funktionen die ausgefeilte Algorithmen benötigen und ständig verbessert werden. Für Nutzer unsichtbar, aber besser. Features, die überall arbeiten Features müssen so gestalten sein, dass sie in allen Sprachen und Ländern funktionieren. Zum Beispiel das Problem mit der Rechtschreibkorrektur auf Chinesisch, wo die Anfragen oft nicht als Worte aufgebrochen sind oder Hebräisch/Arabisch, wo der Text von rechts nach links geschrieben ist. Experiment, Experiment, Experiment. Durch Experimente versuchen wir, das was wir gemacht haben, zu bestätigen. We try to verify that we've done the right thing by running experiments. Design, das viel versprochen hat, letztlich aber doch nicht sinnvoll war.
» Google Blog
Splitterlogo->Google Google passt manchmal die Suchergebnisse an und zeigt an zwei verschiedenen Orten unterschiedliche Ergebnisse bei einer gleichen Suchanfrage an. Oft wurde Google wegen dieser Manipulation kritisiert. Nun reagiert Google mit einem Feature, dass die Nutzer auf diese Anpassung hinweisen soll. Der Hinweistext erscheint oben rechts, wenn eines oder mehr der folgenden drei Kriterien zu trifft:
- Ort: Standardmäßig stellen wir Ihren ungefähren Standord mit Ihrer IP fest und verwenden diese Infos zum anpassen der Suchergebnisse. Wenn Sie einen Ort nutzen wollen, melden Sie sich an oder erstellen Sie einen Google Account und geben Sie eine Stadt oder einen Straßennamen an. Diese Daten werden aber nicht nur für die angepassten Ergebnisse genutzt, sondern auch für besser Resultate in Google Maps und anderen Google Produkten. -Kürzliche Suchen: Unter Umständen nutzen wir eine Ihrer früheren Suchen, die Ergebnisse der neusten anzupassen. Dies geschieht wenn eine Suchanfrage auf eine frühere folgt. Die kürzlichen Suchaktivitäten geben Infos um zu Verstehen was die jetzige Anfrage bezwecken soll. Wir passen Ihre Ergebnisse nur ins positive an, egal ob Sie eingeloggt sind oder nicht. Um dies Durchführen zu können behalten wir die letzten Suchen für eine bestimmte Zeit in einem Cookie fest. Ist die Zeit abgelaufen verschwinden diese Infos. Spätestens jedoch wenn Sie Ihren Browser schließen. -Web History: Wenn Sie angemeldet sind und die Web History aktiviert haben, passen wir Ihre Suchergebnisse auch aufgrund Ihrer alten Anfragen an und welche Seiten Sie besucht haben. Ein wichtiger Hinweis zu Web History: Sie haben die Kontrolle. Sie können spezielle Einträge entfernen oder den Dienst jederzeit auf Pause setzen. Soll eine Suche nicht nach Ihrer Web History angepasst werden, melden Sie sich kurz ab.
Dieser Hinweis wird momentan an die Nutzer verteilt. Dies soll in wenigen Tagen abgeschlossen sein. So schaut er aus: customized_search Klickt man den Link an, erhält man weitere Infos: customized_search2 PS: Selbstverständlich passt Google nicht alle Ergebnisse an. Habt ihr diese Funktion? » Ankündigung
Google 1 Billionen oder eine 1 mit 12 Nullen - 1.000.000.000.000 - ist eine gigantische Zahl. Vor einigen Tagen hat der Google Bot die Billionste unique URL gefunden. Alle Seiten sind nicht in den Index aufgenommen. Kleiner Rückblick: Der erste Google Index von 1998 hatte 26.000.000 Seiten, 2000 waren es eine Milliarde. Wie findet der Bot so viele unique Webseiten? Eigentlich ist es ganz einfach. Google lässt den Bot auf einige bekannte Webseiten los und gibt dem Bot den Befehl allen Links zu folgen. Auf den verlinkten Seiten geht der Vorgang wieder von vorne los. So erreicht man sehr schnell viele Seiten. Google hat sogar mehr als 1 Billion Seiten gefunden, aber nicht alle davon waren einzigartig (unique). Oft gibt es Texte, die über mehrere URL erreichbar sind, aber exakt Wort für Wort gleich sind. Diese wurden für den Meilenstein abgezogen. Täglich kommen einige Milliarden solcher Duplikate hinzu, schreiben Jesse Alpert & Nissan Hajaj auf dem Google Blog. Bis vor einigen Jahren wurde auf der Startseite die Zahl der indexierten Seiten angezeigt. » Weiteres im Google Blog
Google Hinter dem, Was wir euch vor 2 Tagen noch als Suchergebnis-Test vorgestellt haben, könnte doch sehr viel mehr stecken als nur eine einfache Feedback-Funktion: Durch das voten und kommentieren von Suchergebnissen baut Google praktisch ein eigenes digg auf und macht aus der eigenen Websuche quasi ein Social Search. Ein jetzt aufgetauchtes Video zeigt die weiteren Funktionen dieses derzeitigen Tests. Wie man sieht scheint es sich um mehr als nur einen Test zu handeln, da Google noch sehr viel mehr außen herum gebastelt hat. Hat man ein Ergebnis kommentiert, nach oben gevotet oder gar aus den Ergebnissen komplett entfernt wird das nämlich nicht nur für euch selbst gespeichert, sondern ist auch für alle anderen User sichtbar. Nach jeder Suchanfrage kann man sich anzeigen lassen, welche Veränderungen die anderen User an diesen Suchergebnissen vorgenommen haben bzw. welche Kommentare sie dazu abgegeben haben. Durch dieses Social Search könnte man theoretisch - bis die Spammer das für sich entdecken - noch sehr viel bessere Suchergebnisse finden als durch die Standard-Ergebnisse die der GoogleBot zusammengestellt hat. Die eigenen Veränderungen an Suchergebnissen werden übrigens im Google Profile gespeichert und können jederzeit von euch wieder nachvollzogen oder rückgängig gemacht werden. Ich denke Google baut da mal wieder etwas sehr großes auf, dem andere Suchmaschinen sehr schnell nachfolgen dürften. Im Grunde ist das eine Mischung aus 4 sehr großen Bereichen des Web1.0 und 2.0: Suchmaschine, digg-Voting-Seiten (Übernahme damals gescheitert), Social Bookmarks und auch ein bißchen Wiki. Alles zusammengefasst würde eine neue große Informationsquelle hervorbringen. Natürlich muss Google aber auch aufpassen, dass man dadurch nicht seinen größten Trumpf aus der Hand gibt: Den PageRank. Wenn jeder die Suchergebnisse personalisiert und die Leute mehr Social als Normal suchen bietet Google keinen Vorteil mehr den andere Suchmaschinen nicht nachprogrammieren können. Das offizielle Ranking von Google würde zu stark in den Hintergrund rücken. Aber: Wer nicht wagt, der nicht gewinnt ;-) Ich bin mal wieder ganz begeistert von diesem Social Search und freue mich darauf wenn das ganze demnächst für alle verfügbar ist. Hat irgendjemand von euch jetzt schon einmal diese Suche testen dürfen? [TechCrunch]
Google Seit November 2007 testet Google eine Feedback-Funktion für die Suchergebnisse in der die Ergebnisse bewertet und sortiert werden können. Bis heute hat es dieser Test nicht in die Experimental Search geschafft, sondern wird nur bei sehr wenigen Usern getestet. Jetzt ist eine neue Version dieses Tests aufgetaucht in der die Ergebnisse auch kommentiert werden können. Google test
Wenn der User der Meinung ist, dass ein Suchergebnis in der Mitte der SERPs das beste ist, kann er es mit einem Klick auf den nach oben zeigenden Pfeil ganz an den Anfang der Ergebnisse schieben und quasi für dieses Ergebnis voten. Tun dies mehrere User, geht Google sicherlich davon aus dass dieses Ergebnis das relevanteste ist und wird es wahrscheinlich für jeden User weiter oben ranken. Das ganze funktioniert jetzt scheinbar auch andersherum, denn jetzt wird auch ein Pfeil nach unten angezeigt. Ob der das Ergebnis entfernt oder nur auf Platz 10 schiebt weiß ich nicht. Möglich wäre es auch dass einfach nur ein Vote nach oben zurückgenommen werden kann - falls die Seite doch nicht so relevant gewesen ist wie gedacht. Am Ende kann dann auch noch eine relevante Website, die nicht in den Ergebnissen vorkommt, vorgeschlagen werden. Neu dazugekommen ist auch eine Kommentar-Funktion. Scheinbar kann jedes Suchergebnis kommentiert werden - fragt sich nur wo diese Kommentare gespeichert bzw. später wieder angezeigt werden. Vielleicht werden diese bei Google Reviews gespeichert und später für die ganze Welt angezeigt. Etwa mit einem Link "Reviews for this Website" oder ähnlichem. Hat einer von euch diesen Test schon einmal gesehen? [TechCrunch] Nachtrag: » Suchergebnis-Test: Social Search - die Zukunft der Websuche? » SearchWiki: Ab sofort können Suchergebnisse personalisiert werden
Google vs. Blogger ? Derzeit tauchen in vielen Blogs Spekulationen darüber auf, dass Googles Liebe zu Weblogs langsam eingerostet sein könnte und Blogs teilweise überhaupt nicht mehr in den Suchergebnissen zu finden sind. Ganz schlimm hat es einige Blogs getroffen, deren Beiträge und Artikel teilweise komplett aus dem Index verschwunden sind. Nachvollziehen kann ich das ganze aber nicht. Bei Boedger ist beispielsweise kein einziger Beitrag zwischen dem 26.06.08 und dem 01.07.08 im Index zu finden, alle anderen Beiträge sind aber noch vorhanden. An der Indizierung liegt es nicht, da die Beiträge mit Googles Blogsuche komplett auffindbar sind. Will Google auf die Art die Blogsuche pushen und die Websuche nur wieder zu einer reinen Suche nach Webseiten machen? Eher schwer vorstellbar... In den letzten Tagen habe ich schon auf einigen anderen Seiten über dieses derzeitige Phänomen gelesen, daher meine Frage: Sind eure Blog-Beiträge auch verschwunden? Und wenn ja, welche Software benutzt ihr? Zumindest der GWB ist bei Google immer noch sehr gut gerankt - liegt es vielleicht daran dass wir eine eigene Blog-Software nutzen und Google die Seite nicht einwandfrei als Blog erkennen kann...? » Diskussion bei Boedger [thx to: uebel]
Google Ab sofort kann Google und Yahoo! Dateien im Flash Format (SWF) von Adobe durchsuchen und Ergebnisse liefern. Bisher wurden diese von den meisten Suchmaschinen wenig beachtet. Nach Angaben von Adobe hat man mit Google und Yahoo eng zusammengearbeitet um die dynamischen Inhalte richtig lesen zu können. Gerade Google habe, laut Bill Coughran, Senior Vice President für Entwicklung bei Google, intensiv am Auffinden und Verarbeiten der SWF-Dateien gearbeitet. "Nutzer erhalten bessere Suchergebnisse, weil eine Menge Informationen in SWF-Dateien stecken, die nun voll indiziert werden", erklärte Justin Everett-Church. Google hat schon einige Dateien in den Ergebnissen. Bei Yahoo soll das beim nächsten Update folgen. » Beispiel » Ankündigung [Golem]
Google-> Das nächste Firmware Update für die Playstation Portable (PSP) liefert neben einer Funktion, die die Abspielgeschwindigkeit auf Knopfdruck verändert, auch die Google Suche. Hierfür wird ein Symbol in das Netzwerkmenü eingebaut. Ruft man dieses auf, so kann man das gesamte Internet durchsuchen. Dieses Feature speichert die letzten 20 Suchabfragen. Laut dem Blog von Playstation erscheint dieses Update "bald". [Golem]
Google Viele Seiten haben einen Intro. Ich persönlich finde es unschön wenn man beim Besuchen einer Seite erst noch einmal auf weiter oder ähnliches klicken muss, um zur eigentlichen Seite zu gelangen. Dies dachte sich auch Google und hat nun einen Link eingebaut, der das Skippen des Intros sofort aus der Suche erlaubt: Beispielsuche: yuasa france [Blogoscoped]
Vor einen Wochen wurde die Onebox Sport in die Google Suche eingebaut. Sucht man in den nächsten Tagen auf einer nationalen Google Domain (google.at, google.ch, Google.de ...) nach Euro 2008 sieht man vor dem ersten Ergebnis ungefähr diese obengezeigte Onebox. Wer das Ergebnis eines Landes sucht, gibt "Euro 2008 Deutschland" ein und erfährt im Moment "Nächstes Spiel: gegen Polen, 8. Juni 20:45 ". Gadget Vor einigen Tagen wurde ein Desktop Gadget veröffentlicht, das EM Ergebnisse in der Seitenleiste anzeigt. Auf der 23 Tage Seite gibt es eines für iGoogle und die eigene Webseite » Gadget zu iGoogle hinzufügen
Google Ein neues Experiment wurde nun auf Google.com gestartet. Bei manchen Suchanfragen werden bei den Ergebnissen aus Foren Infos wie Autorenzahl, Beiträge und das Datum angezeigt. Bisher: Neu: Um die neue Version zu sehen muss man sich auf Google.com befinden und folgenden Text in die Adresszeile kopieren und auf Enter drücken:
javascript:void(document.cookie="PREF=ID=00fb173daf8671b1:TM=1211773860: LM=1211774226:GM=1:S=iRC8su7T5V-q6T0t;path=/; domain=.google.com");
Leerzeile entfernen Bei meiner Beispielssuche router vs modem werden bei den Ergebnissen aus Foren zum Beispiel "Discussion forum: 3 posts - 2 authors - 8 Dec 2001" vor dem Auszug gezeigt. Was durch das Javascript noch geändert wird, ist unklar. Wer wieder die normale Version haben möchte, muss das erstellte Cookie wieder löschen. Im Firefox gibt es ein Suchfeld bei den Cookies in den Einstellungen. Dort gebt ihr am besten "LM=1211774226" - ohne Anführungszeichen - ein, und löscht dann das gefundene Cookie. Danach sollte das Text "Discussion forum:..." nicht mehr erscheinen. [Blogoscoped] Entdeckt hat das übrigens Haochi!
Google Der Google Suchalgorithmus ist wohl die Ursache für den Erfolg von Google. Daher hat das bunte US-amerikanische Unternehmen Details zur Funktionsweise unter Verschluss gehalten. Wie Udi Manber, stellvertretender Leiter der Abteilung "Search Quality", nun auf dem Google Blog schreibt nicht wegen der Konkurrenz sondern um Missbrauch zu unterbinden. Dennoch gibt Google nun einige Informationen zum Suchalgorithmus preis und erklärt diese auch. Der Hintergrund für diese Entscheidung sei vor allem Druck durch die Konkurrenz und Kritiker. Daher habe nun die Geheimhaltung des Suchalgorithmus etwas gelockert. Hier die Übersetzung des Postings:
Search Quality ist der Name unseres Teams, das für das Ranking der Google Ergebnisse verantwortlich ist. Unser Ziel ist klar: Einige hundert millionenmal am Tag geben Menschen bei Google einen Suche auf. Innerhalb von Bruchteilen einer Sekunde muss Google entscheiden welche der Milliarden Webseiten die richtigen sind und in welcher Reihenfolge sie dargestellt werden müssen. Wir machen aber noch mehr - dazu später mehr. Obwohl sehr viele Menschen die Google Suche nutzen, ist nur sehr wenig über das Ranking bei Google bekannt. Und das ist unserer Absicht. Wir sind recht schweigsam über das was wir tun. Das hat zwei Gründe: Die Konkurrenz und Missbrauch. Der Wettbewerb ist ziemlich eindeutig. Kein Unternehmen will seine Geheimrezepte und Firmengeheimnisse mit der Konkurrenz teilen. Zum Missbrauch: Wenn wir unsere Bewertungsformel öffentlich machen würden, wäre das Spielen mit unsere System leichter. Sicherheit durch Dunkelheit ist nicht die beste Maßnahme, und wir beziehen uns nicht darauf, aber es beugt Missbrauch vor. Die Details zum Suchalgorithmus sind in vielen Dingen Googles Kronjuwelen. Wir sind sehr stolz auf sie. Schätzungen zufolge waren an der Entwicklung dieser tausende Entwickler und Wissenschafter beteiligt die jahrelang daran gearbeitet haben. Die Frequenz von Innovationen wurde nicht verlangsamt. Die komplette Geheimhaltung ist nicht ideal und dieser Blogpost ist Teil einer neuen Bemühung sich mehr zu öffnen als in der Vergangenheit. Wir wollen versuchen in der Zukunft Sie regelmäßig über neue Dinge zu informieren und alte Sachen zu erklären, Tipps zu geben, Nachrichten zu teilen und Gespräche zu eröffnen. Lassen Sie mich mit einigen Allgemeinen Informationen über unserer Gruppe anfangen. Mehr erscheint in weiteren Postings. Ich sollte mir die Zeit nehmen und mich selbst vorstellen: Mein Name ist Udi Manber und ich bin ein VP of Engineering bei Google, genauer gesagt bei Search Quality. Ich arbeite seit über 2 Jahren für Google und schon seit fast 20 Jahren mit den Suchtechnologien. Das Herz der Gruppe ist das Team das am innersten arbeitet. Das Ranking ist hart, härter als die meisten Menschen denken. Der Grund: Die Sprache ist schon immer mehrdeutig und wird auch immer mehrdeutig bleiben und Dokumente folgen keinen Regeln. Es gibt keine Standards wie man Informationen vermittelt und daher müssen wir in der Lage sein alle Webseiten zu verstehen - egal wer sie geschrieben hat und aus welchem Grund. Aber auch die Suchanfragen wollen erst einmal verstanden werden. Die meisten habe weniger als 3 Worte. Nicht zu erwähnen, dass es verschiedene Menschen mit verschiedenen Interessen gibt. All das müssen wir in wenigen Millisekunden tun. Der bekannteste Teil des Suchalgorithmus ist der PageRank, ein Algorithmus der von den Google Gründern Larry Page and Sergey Brin entwickelt wurde. PageRank wird noch heute verwendet, aber er ist heute der Teil eines großen Systems. Die andere Teile: Sprachmodelle (der Umgang mit Phrasen, Synonymen usw.), Fragemodelle (es ist nicht nur die Sprache, es kommt drauf an wie die Leute sie nutzen), Zeitmodelle (manche Anfragen beantwortet eine 30 Minuten alten Seite besser als eine die schon vor langer Zeit geschrieben wurde und sich bewährt hat), persönliche Modelle (nicht alle Menschen wollen die selben Sachen). Ein weiteres Team in unserer Grunde ist für die Qualitätsmessung zuständig. Dies erfolgt in vielen verschiedenen Arten, aber das Ziel ist das selbe: Der Verbesserung der Benutzererfahrungen. Das ist nicht das Hauptziel - es ist das einzige Ziel. Jede Minute erfolgen automatische Qualitätskontrollen (um sicherzustellen, dass nichts falsch läuft), regelmäßige Kontrollen unserer gesamten Qualität und, wohl am wichtigsten, die Kontrolle unserer Verbesserungen am Algorithmus. Wenn ein Entwickler eine neue Idee hat und einen neuen Algorithmus bastelt, wird diese Idee gründlich getestet. Statistiker verarbeiten die Daten und beziffern wie hoch die Verbesserung ist. Wir treffen uns einmal in der Woche (manchmal auch zweimal) um über solche Ideen zu sprechen und die Veröffentlichung vorzubereiten. 2007 haben über 450 Verbesserungen veröffentlicht - im Schnitt 9 in der Woche. Einige dieser Updates sind einfach und klar - zum Beispiel kommen wir mit hebräische Abkürzung zurecht (im Hebräischen werden werden Abkürzung durch ein " vor dem letzten Buchstaben gekennzeichen (IBM -> IB"M). Andere sind sehr kompliziert - bswp. das Update am PageRank aus dem Januar. Die meiste Zeit versuchen wir die Relevanz zu verbessern, aber wir arbeiten auch an der Vereinfachung von Algorithmen. Simple is good. Die internationale Suche stand in den letzten zwei Jahren im Mittelpunkt. Das bedeutet alle gesprochenen Sprachen, nicht nur die Großen. Letztes Jahr haben wir bspw. große Verbesserungen in Aserbaidschanisch, eine Sprache, die von 8 Millionen Menschen gesprochen wird, gemacht. In den letzten Monaten veröffentlichten wird Rechtschreibprüfungen für Estnisch, Katalanisch, Serbisch, Serbo-Kroatisch, Ukrainisch, Bosnisch, Kroatisch, Lettisch, Tagalog, Slowenisch und Persisch. Durch ein weltweites Netzwerk von Menschen erhalten wir viel Feedback und können so weitere Verbesserungen vornehmen. Ein anderes Team ist für neue Funktionen und neue User Interfaces zuständig. Ein großartiger Motor ist für ein tolles Auto notwendig, aber nicht ausreichend. Das Auto muss komfortabel und leicht fahrbar sein. Das Google Design ist sehr einfach. Nur sehr wenige unserer Nutzer haben jemals die Google Hilfe zur Suche gelesen und können Google trotzdem nutzen. (Wobei auch die Hilfe ständig verbessert wird und leicht lesbar ist.) Wenn ein neues Feature eingebaut wird, wollen wir sicherstellen, dass es intuitiv wird und von allen genutzt einfach werden kann. Eine der sichtbarsten Änderungen war die universelle Suche im letzten Jahr. Und natürlich am Google Notebook, Custom Search Engines und an iGoogle. Das UI Team wird von Experten unterstützt, die Anwenderstudien durchgeführt haben und neue Features bewerten. Sie reisen durch die Welt und machen sogar Hausbesuche um den Nutzer in seiner gewohnten Umgebung zu studieren (Keine Sorge sie kommen nicht unangemeldet!) Ein ganzes Team kämpft gegen Webspaming und anderen Missbrauch (Versteckte Texten, Kauderwelsch und anderen Methoden für ein höheres Ranking). Das Team bemerkt SPAM Trends und versucht durch skalierbaren Art und Weisen diese zu bekämpfen, wie alle Teams, erfolgt auch diese Arbeit international. Die Webspam Gruppe tauscht sich mit dem Google Webmaster Central Team aus und erhalten so Erkenntnisse. Auch gibt es andere Teams für bestimmte Projekte. Unsere Struktur ist aber sehr informell. Neue Projekte starten ständig. Eines der wichtigsten Dinge zur Suche ist, dass die Nutzer Erwartungen rapide ansteigen. Die Suchanfragen von morgen sich viel schwerer als die von heute. Genau wie das Moore's Law alle 18 Monate die Verdoppelung der Rechengeschwindigkeit regelt, gibt es ein ungeschriebenes Gesetz, das die Komplexität unserer schwierigsten Anfragen in kurzer Zeit verdoppelt. Das ist zwar unmöglich messbar, aber wir alle fühlen es. Wir wissen, dass wir uns nicht auf den Lorbeeren ausruhen dürfen und weiter hart mit der Herausforderung arbeiten müssen. Wie schon vorhin erwähnt, wollen wir Ihnen auch in den nächsten Monaten weitere Updates an der Suchqualität liefern.
» Google Blog
Google Die Product Search Onebox innerhalb der Suchergebnisse wurde ein wenig verbessert: Statt der klassischen Einkaufstasche, das Symbol der Produktsuche, wird jetzt ein kleines Thumbnail des ersten gefundenen Produkts angezeigt. Allerdings leitet ein Klick auf dieses Bild nicht, wie gedacht, direkt auf das Produkt, sondern zur eigentlichen Produktsuche. Product Search Onebox
Neben dem neuen Thumbnail, nutzt die Onebox auch das neue Zusammenfassungsfeature der Produktsuche: Statt einen konkreten Preis für ein Produkt anzuzeigen, wird jetzt die gefundene Preisspanne angezeigt. Obigen USB-Stick kann man also sowohl für 11$ als auch für 32$ kaufen und ist in 69 OnlineShops zu finden. Ich denke dass sind sehr sinnvolle Informationen die auf jeden Fall in die Onebox gehören. P.S. Manchmal wird mir die alte Onebox angezeigt und manchmal die neue - und das für die gleiche Suchanfrage... Scheint wohl gerade erst auf alle Server ausgeweitet zu werden. » Beispielsuche [Google OS]