Google Bildersuche enthält jetzt auch Bilder aus PDF-Dokumenten

images 

Schon seit mehr als einem Jahrzehnt befinden sich PDF-Dokumente bzw. deren enthaltener Text in den Suchergebnissen der Google Websuche. Im Jahr 2008 hatte man damit begonnen, auch die in den PDF-Dateien enthaltenen Bilder zu indizieren und den dort enthaltenen Text zu extrahieren. Die reinen Bilder hatte man bisher hingegen noch nicht weiter verwendet, doch das hat sich nun vor einiger Zeit geändert: Ab sofort sind auch die enthaltenen Fotos und Bilder in der Bildersuche enthalten und können über diese gefunden werden.


Google hatte es schon früh sehr gut verstanden, eine Beziehung zwischen Text und Bildern herzustellen und diese dadurch ebenfalls durchsuchbar zu machen. Doch gerade in einem PDF-Dokument kann man eigentlich fast zu 100% davon ausgehen, dass ein eingefügtes Bild zum Textinhalt passt, von daher ist es sehr verwunderlich dass diese Bilder nie indiziert worden sind. Jetzt werden diese ebenfalls aus dem Dokument extrahiert und können von den Nutzern gefunden werden, was die Anzahl der Zugriffe auf PDF-Dokumente noch einmal erhöhen dürfte.

bildersuche pdf indexing

Wird ein Bild in einer PDF-Datei gefunden, ändern sich auch einige Buttons im eigentlichen Suchergebnis: Statt der Möglichkeit, nur das Bild einzeln anzeigen zu lassen, gibt es nun nur einen Button der das vollständige PDF-Dokument anzeigen kann. Ein reines Anzeigen des Fotos ist natürlich nicht möglich, doch immerhin das Vorschaubild kann im JPG-Format gespeichert werden – was aber in den meisten Fällen eine geringere Qualität und Größe als das Original-Bild hat.

Dass es sich um eine PDF-Datei handelt, wird dem Nutzer sowohl bei dem Button als auch bei dem Titel des Bildes angezeigt. Dieser wird relativ zuverlässig aus der PDF-Datei extrahiert, einen weiteren Beschreibungstext gibt es allerdings nicht. Zusätzlich wird auch noch die Originalgröße des Bildes im PDF-Dokument angezeigt und auch die Möglichkeit angeboten, nach ähnlichen Bildern zu suchen. Ob diese Funktion wirklich neu ist, ist allerdings nicht ganz klar. Ich persönlich habe es zumindest noch nie gesehen.

[Google OS]



Teile diesen Artikel: