Google Cloud Video API: Künstliche Intelligenz kann jetzt auch Objekte in Videos erkennen

Veröffentlicht am 9. März 2017 von Jens

In den letzten Jahren haben Technologien zur Erkennung von Bildern bzw. Objekten in Fotos große Fortschritte gemacht und vor allem dank der Künstlichen Intelligenz sind die Ergebnisse mittlerweile sehr zuverlässig. Auf der Cloud Next-Konferenz hat Google nun den nächsten Schritt angekündigt, und hat eine API vorgestellt, mit der sich auch Objekte in Videos erkennen und sogar nach diesen durchsuchen lassen.

Die Google Bildersuche oder auch die Suchfunktion von Google Photos setzt seit vielen Jahren nicht mehr nur auf vom Menschen hinzugefügte Textbeschreibungen, sondern vor allem auf die automatische Erkennung von Foto-Inhalten. Wie gut das funktioniert, kann jeder mit Google Photos selbst ausprobieren, und die Trefferquote ist extrem hoch. Mit einer Chrome Extension kann eine solche Technologie auch auf Facebook ausprobiert werden.

Während sich die Algorithmen bei der Erkennung eines Fotos genügend Zeit lassen und ein Bild in aller Ruhe analysieren können, sieht es bei einem Video schon ganz anders aus. Nicht nur dass ein Video praktisch aus Abertausenden oder Millionen von Einzelbildern besteht, sondern die Objekte bewegen sich auch noch und können sich immer wieder ändern, drehen oder durch einen Szenewechsel auf einmal verschwinden. Das war jahrelang eine große Herausforderung, aber jetzt will Google entscheidende Fortschritte gemacht haben.

Die neue Technologie ermöglicht gleich mehrere Dinge auf einmal: Zum einen können Objekte Live erkannt und zurück gemeldet werden, zum anderen kann die Künstliche Intelligenz auch das gesamte Video auf einmal analysieren und eine grobe Zusammenfassung über die am häufigsten auftretenden Objekte liefern. Zu guter letzt gibt es auch eine automatische Erkennung von Szenenwechseln, die dann direkt angesprungen und durchsucht werden können.

Mit der Cloud Video API können Entwickler diese neue Technologie nun auch sehr einfach nutzen und Videos analysieren lassen. Eine Voraussetzung ist es dabei allerdings, dass das Video in der Google Cloud Platform gespeichert ist und nur dann für die API verwendet werden kann. Die Ergebnisse werden dann gemeinsam mit einem Wahrscheinlichkeitsfaktor zurück geliefert, der angibt wie treffsicher sich der Algorithmus ist.

Das ganze wird natürlich wieder durch die Künstliche Intelligenz und Machine Learning ermöglicht, denn nur so kann eine ausreichend große Datenbank an Objekten aufgebaut werden, um zuverlässige Ergebnisse liefern zu können. Mit solchen Technologien und einer Verknüpfung von anderen Dingen wie etwa der mittlerweile auch sehr guten Spracherkennung dürfte es schon bald kein großes Problem mehr sein, sich von einem Algorithmus innerhalb kürzester Zeit eine Inhaltsangabe eines Videos zu bekommen.

» Google Cloud Video

[TechCrunch]

Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | GWB-Newsletter

Teile diesen Artikel: