Blogsearch Google hat seine Blogsuche intern komplett umgestellt: Ab sofort bestehen die Suchergebnisse nicht mehr aus den Daten die der Google FeedFetcher einsammelt, sondern stammen direkt aus dem Web-Index. Da viele Blogs in ihren Feeds nur ein Auszug aus dem eigentlichen Posting anzeigen, ist man jetzt dazu übergegangen den kompletten Blog zu scannen und so auch komplette Artikel durchsuchen zu können - mit einigen Nebenwirkungen. Der Vorteil alle Postings durchsuchen zu können liegt natürlich klar auf der Hand und ist verständlich, allerdings hat man es bisher noch nicht geschafft Postings auch als solche erkennen zu können. Teilweise wird die Blog-Navigation, die Blogroll und weitere Links die mit dem eigentliche Posting nichts zu haben zusammengefasst und durchsucht. Das ist natürlich nicht Sinn der Sache und macht aus der Blog-Suche quasi eine zweite Websuche. In Zukunft sollen nicht nur die Postings sondern auch die Kommentare dazu durchsucht werden, das lässt sich derzeit wohl nur durch das gesamte scannen einer Seite bewerkstelligen. Ein weiterer Punkt für den Wechsel war auch dass viele Webseiten mehrere Feeds anbieten und in dem gescannten Feed eventuell nicht alle Informationen vorhanden sind. Diesen Punkt lasse ich allerdings nicht gelten - allein der GoogleWatchBlog hat derzeit mehr als 4.300 Feeds, aber der Hauptfeed ist im Header der Seite angegeben und nur dieser beinhaltet den eigentlichen Content. Alle anderen Feeds gehören nicht in eine Blogsuche. Besser wäre es wenn man auf beide Systeme setzen würde. Erst wird der Feed gescannt, dann die Links darin verfolgt und schon hat man das komplette Posting im Index. Aber Google wird schon seine Gründe haben das ganze intern umzustellen. Nur leider leidet die Aktualität darunter - für den GWB ist gerade mal ein einziger Artikel in den letzten 6 Tagen im Index. Für die größte Blogsuchmaschine ein Armutszeugnis. Vielleicht wäre es auch gut einen neuen Quasi-Standard zu etablieren. Ein kleiner Tag innerhalb des Quellcodes könnte nicht nur dem Google-Bot helfen. Etwa vor dem Start eines Artikels ein < !- post_begin -> und danach ein < !- post_end -> und das gleiche für Kommentare und eventuell weitere Inhalte. Wäre sicherlich nicht verkehrt und würde die Indizierung stark vereinfachen. Dennoch verstehe ich nicht warum die Feeds aufgegeben worden sind, gerade jetzt wo man mit Feedburner und dem GReader quasi Feeds inklusive Nutzungs-Statistiken auf dem Silbertablett serviert bekommt... [Google OS]
Blogsearch Die englische Version der Google Blogsuche wurde heute Nacht in einer überarbeiten Fassung veröffentlicht. Die Startseite zeigt nun an, was derzeit in der Blogosphäre stark diskutiert wird. Der sogenannte Memetracker deckt insgesamt 11 Bereiche ab: Politik, USA, Welt, Wirtschaft, Technik, Videospiele, Wissenschaft, Unterhaltung, Filme, Fernsehen und Sport. Google setzt für die Darstellung die Google News Technik ein. Die Themen werden ähnlich wie bei News gruppiert. In den nächsten Monaten will Google diese Startseite auch in den anderen Sprachen von Google Blogsearch veröffentlichen und weitere Features wie Feeds hinzufügen. » Google Blog:Browse what the world is saying on Blog Search » Google Blogsearch
Finance Innerhalb eines Charts von Google Finance werden seit jeher Informationen über den aktuellen Kursanstieg- bzw. Verfall angezeigt - mittels Nachrichten aus diesem Zeitraum in den Google News. Ab sofort kann diese Quelle auch geändert werden, etwa in einen bestimmten Feed oder die komplette Blogosphäre. Finance CHart
Direkt neben dem Chart, in dem die Informationen angezeigt werden, kann jetzt als Quelle entweder die Google News, Blogsearch oder ein bestimmter Feed ausgewählt werden. Die Informationen aus dem Feed werden dann geladen und direkt innerhalb des Diagramm angezeigt. Leider nutzt Finance in diesem Fall nicht Googles riesiges Feed-Archiv, sondern greift direkt auf die Quelle zu - wodurch natürlich nur wesentlich weniger Informationen vorhanden sind, und auch nur aus dem aktuellen Zeitraum. Scrollt man bspw. 1 Jahr zurück, wird nicht der Feed aus dieser Zeit geladen, sondern einfach garkeine Informationen mehr angezeigt. Und das obwohl Google nachweislich diese Daten gespeichert hat. [Google OS]
Google vs. Blogger ? Derzeit tauchen in vielen Blogs Spekulationen darüber auf, dass Googles Liebe zu Weblogs langsam eingerostet sein könnte und Blogs teilweise überhaupt nicht mehr in den Suchergebnissen zu finden sind. Ganz schlimm hat es einige Blogs getroffen, deren Beiträge und Artikel teilweise komplett aus dem Index verschwunden sind. Nachvollziehen kann ich das ganze aber nicht. Bei Boedger ist beispielsweise kein einziger Beitrag zwischen dem 26.06.08 und dem 01.07.08 im Index zu finden, alle anderen Beiträge sind aber noch vorhanden. An der Indizierung liegt es nicht, da die Beiträge mit Googles Blogsuche komplett auffindbar sind. Will Google auf die Art die Blogsuche pushen und die Websuche nur wieder zu einer reinen Suche nach Webseiten machen? Eher schwer vorstellbar... In den letzten Tagen habe ich schon auf einigen anderen Seiten über dieses derzeitige Phänomen gelesen, daher meine Frage: Sind eure Blog-Beiträge auch verschwunden? Und wenn ja, welche Software benutzt ihr? Zumindest der GWB ist bei Google immer noch sehr gut gerankt - liegt es vielleicht daran dass wir eine eigene Blog-Software nutzen und Google die Seite nicht einwandfrei als Blog erkennen kann...? » Diskussion bei Boedger [thx to: uebel]
Google BlogSearch
Weblogs sind im Grunde zwar auch nur normale Webseiten, aber sie stellen doch eine so besondere Form da dass Google und viele andere hierfür eine eigene Suchmaschine anbieten. Da Blogs nicht mit normalen Webseiten verglichen werden können greift auch der PageRank an dieser Stelle nicht richtig, da Blogs allgemein eine sehr starke Verlinkung untereinander aufweisen. Wie Googles Blogsuche rankt geht jetzt aus einem neuen Patent hervor. Das von Google eingereichte Patent enthält Informationen darüber wie die Blogsuche ihre Ergebnisse bewertet und dementsprechend rankt: Positive Bewertung: » Blogroll-Links von hochqualitativen Blogs » Links von anderen Medien als Webseiten, z.B. eMails und Chats » Verwendung von Tags statt Kategorien, das fördert die Übersicht » Der PageRank des jeweiligen Blogs » Die Anzahl der Feed-Abonnenten » Anzahl der Aufrufe über die Suchergebnisse Negative Bewertung: » Täglich zur gleichen Uhrzeit neue Postings (Ouh Shit *g*) » Verschiedene Inhalte im Feed und der Webseite » Starkes Auftreten von doppeltem Content » Verwendung von Wörtern die oft in Spam-Blogs auftauchen ([email protected]) » Viele Posts mit der gleichen Länge » Verlinkung zur immer gleichen Webseite » Eine starke Häufung von Werbebannern (Ob das auch für AdSense gilt?) » Die Platzierung der einzelnen Banner (Layer-Ads dürften es schwer haben) Die Frage ist nur wie Google an all diese Daten herankommt. Wie kann ein Algorithmus zwischen normalem Link und Blogroll-Link unterscheiden? Woher weiß Google wieviele Feed-Abonnente es gibt, der Google Reader ist ja schließlich nicht alles, und mit Feedburner besteht soweit ich weiß keine Partnerschaft. Was andere User stören wird ist sicherlich dass auch Links aus eMails und Chats mit bewertet werden - 3x dürft ihr raten um welchen Messenger und welches eMail-Fach es sich dabei wohl handeln dürfte ;-) Google scheint mehr auszuwerten als wir dachten... Ansonsten ist die Liste natürlich sehr schön und ich wüsste jetzt spontan auch nicht wie ich die Bewertung noch verbessern würde. » BlogSearch-Patent
AJAX Search API
Analog zur News-Bar der AJAX Search API gibt es jetzt auch eine Blog-Bar für die eigene Webseite. Dabei handelt es sich um eine kleine einzeilige Leiste mit der man sich die aktuellen Themen aus der Blogosphäre via Blogsuche auf die eigene Webseite oder den eigenen Blog holen kann. Die einzigen Angaben die zur Generierung der Blog-Bar benötigt werden ist ein Titel, die Suchworte die in den betreffenden Postings auftauchen müssen und natürlich die URL der eigenen Homepage - wegen des API-Keys. Neben der horizontalen Blog-Bar kann man sich auch eine vertikale Leiste erstellen lassen die natürlich sehr viel mehr Informationen erhält und mehrere Beiträge gleichzeitig sowie Auszüge aus deren Inhalt anzeigen kann. Und so sieht die Blog-Bar aus: UPDATE: Funktioniert leider nicht...Wordpress filtert falsch :-( » Blog-Bar erstellen » Ankündigung im AJAX Search API Blog
Google Blogsuche
Wer hätte das gedacht: Googles Blogsuche darf sich jetzt offiziell als größte Blogsuchmaschine bezeichnen. In den letzten 2 Wochen wurde der Konkurrent Technorati nach einer sehr langen aber steilen Aufholjagd überholt. Diese hohe Userzahl dürfte aber wohl mehr an der Integration in Google festzumachen sein als an der Qualität der Suchmaschine. Marktanteile
Da Googles Blogsuche teilweise auf der Startseite zu sehen ist, in den Google News integriert ist, bei Google Alerts integriert ist, in OneBoxen erscheint und nebenbei auch noch die Standardsuchmaschine bei Blogger ist, ist es nicht verwunderlich dass der Spitzenplatz jetzt erreicht worden ist. Was die Suche in Weblogs selbst angeht ist Technorati aber immer noch das große Nonplusultra. Technorati ist sehr viel mehr als eine Suchmaschine, es ist eine Art Tor zur Bloggingwelt, es verknüpft die einzelnen Blogs miteinander und bewertet sie danach - im Grunde das PageRanking nur für Blogs. Warum die Googler so etwas bisher nicht auf die Beine gestellt haben weiß ich nicht, aber es geht ja anscheinend auch ohne. Die Frage ist nur ob Google damit zufrieden sein kann. Marktführer sein hin oder her, darauf dürfen sie sich nicht ausruhen, denn sonst wandern die Millionen neuen User ganz schnell wieder zu Technorati ab... » Genauere Zahlen und Gründe bei Hitwiste [Googlified]
Neue PopUp-Box
Über die PopUp-Box der englischen Startseite, die mittlerweile offiziell ist, kann man sich ja streiten. Hier haben sich bisher 3 weitere für Google wichtige Angebote befunden die nicht mehr über die Suchbox gepasst haben. Das Design scheint bei den Googlern favorisiert zu werden, und daher werden testweise noch 2 weitere Einträge hinzugefügt. Bei den neuen Einträgen handelt es sich um die Blogsuche und die neue Patentsuche. Wirklich schön ist diese Box zwar nicht, aber viele andere Möglichkeiten gibt es bei dieser Fülle von Suchen wohl auch nicht. So wie es auf der deutschen Startseite noch ist finde ich es am besten, sofort auf die More-Seite verlinken, ohne diese nervige Box... Eine Personalisierung dieser Box wäre wohl die bessere Lösung. Entweder sollte jeder User selbst auswählen können was hier auftaucht, oder es sollten nur die Dienste auftauchen die am meisten benutzt werden. Bei zweitem wäre aber wieder das Problem, das jeder User nur die Dinge sieht die er eh schon kennt und ihm somit nichts neues angeboten werden kann. Mal schauen wie das hier weitergeht... Bei mir wird die Box zur Zeit noch ohne die beiden Einträge angezeigt, und bei euch? [Google OS]
Google Blogsuche
Google testet in einem kleinen Userkreis mal wieder eine neue OneBox, diesmal unter den Suchergebnissen. Diesmal ist die Blogsuche in den Suchergebnissen integriert worden und bringt damit, neben der News-Onebox, eine noch sehr viel höhere Aktualität in die SERPs. Es ist eindeutig anzumerken dass die Googler Blogs zwar lieben, und für sich wichtig halten, aber sie auch wissen dass immer noch ein Großteil der Surfer gegen Blogs ist. Und eine OneBox die erst am Ende der Suchergebnisse auftaucht ist dabei eigentlich die ideale Lösung - sie ist zwar da, aber stört nicht bei der normalen Suche. Ich finde diese ganzen OneBoxen zwar sehr interessant, aber Google sollte diese Technologie endlich einmal ausreifen lassen und für alle Angebote öffnen. Wahlweise soll man den Benutzer einstellen lassen welche Boxen angezeigt werden sollen und welche nicht. Oder über den Suchergebnisse eine OneBox einbinden, die zeigt welche OneBox-Ergebnisse noch zur VErfügung stehen - fährt man dann mit dem Cursor darüber öffnen sich die Boxen und zeigen die Informationen. Zumindest auf diesem Markt sind andere Suchmaschinen schon sehr viel weiter, vorallem ask.com kann mit einer ganzen Menge interessanter OneBoxen glänzen - Google muss nachziehen! [Googlified]