Googles Bildgenerator Imagen 3 hat zuletzt große Fortschritte gemacht und konnte nicht zuletzt durch den neuen Unterbau von Gemini 2.0 auch einen starken Leistungssprung machen. Dieser ermöglicht es nun, allen Nutzern ein Feature anzubieten, das man vor längerer Zeit aufgrund von komplexen Problemen zurückziehen musste: Geminis Imagen kann jetzt wieder für alle Nutzergruppen Fotos von Personen erstellen.
Praktisch in Windeseile haben sich KI-basierte Textgeneratoren verbreitet und dafür gesorgt, dass das Internet auf allen Ebenen mit eben diesen geflutet wird. Weil es kaum noch möglich ist, echte Autortexte von ihren KI-Pendants zu unterscheiden, hat die Google-Tochter Deepmind eine interessante Technologie entwickelt: Ein weitgehend stabiles Wasserzeichen soll KI-generierte Texte eindeutig erkennbar machen.
Das Unternehmen Google ist in sehr vielen Branchen aktiv und forscht auch in Bereichen, die aktuell noch nicht unbedingt zum Kerngeschäft gehören - aber vielleicht noch zu einem solchen werden könnten. Dazu zählen auch die recht hohen Investitionen im Bereich der Quantencomputer und der riesigen Herausforderungen, die diese mitbringen. Kürzlich konnte man dabei eine mehr als interessante Entdeckung machen: Laut Googles Forschen leben wir in einem Multiversum mit unendlich vielen Parallelwelten.
Innerhalb kürzester Zeit haben sich KI-generierte Bilder etabliert und durch die rasante Weiterentwicklung der KI-Modelle dermaßen an Qualität gewonnen, dass sie kaum noch von echten Fotos oder Kunstwerken zu unterscheiden sind. Weil die Unterschiede wohl schon bald selbst von Experten nicht mehr auszumachen sind, hat die Google-Schwester Deepmind die Technologie SynthID entwickelt, die langlebige Wasserzeichen in die Bilder integriert.
Google-CEO Sundar Pichai lässt keinen Zweifel daran, dass die Künstliche Intelligenz DAS große Thema bleibt, um das sich alle Entwicklungen und Produkte drehen - und dabei geht es nicht nur um Gemini. Jetzt hat Pichai im Rahmen der Quartalszahlen-Verkündung bekannt gegeben, dass allein in diesem Jahr 75 Milliarden Dollar in die KI-Projekte investiert werden sollen.
Bei Google steht die Künstliche Intelligenz nicht erst seit Gemini im Mittelpunkt aller Aktivitäten, sondern beschäftigt das Unternehmen schon seit vielen Jahren in allen Bereichen. Einen kriegerischen Einsatz der KI hat man dabei stets ausgeschlossen, doch dieser Grundsatz ist nun gefallen: Vor wenigen Tagen wurde das Versprechen gestrichen, KI nicht für Waffen einsetzen zu wollen. Das schockiert einige Mitarbeiter, ist aber nicht ganz überraschend.
Viele Nutzer verwenden die Google Websuche auch dafür, nach lokalen Ergebnissen zu suchen und sich etwa Restaurants, Werkstätten oder ähnliche Dinge in der Nähe anzeigen zu lassen. Jetzt wird eine interessante neue Funktion getestet, bei der per Künstlicher Intelligenz moderne und klassische Technologien kombiniert werden. Das neue Ask for me ruft Unternehmen in der Nähe einfach an.
Die Google Websuche ist seit vielen Jahren die dominierende Suchmaschine und hatte trotz aller Anläufe und hoher Investitionen der Mitbewerber nie einen echten Konkurrenten zu fürchten. Doch auch diese Dominanz ist nicht für die Ewigkeit und mittlerweile gibt es erste Anzeichen, dass die große Zeit der Suchmaschinen und damit auch von Googles Gelddruckmaschine ihren Zenit überschritten hat.
Google hat kürzlich den Start von Gemini 2.0 bekannt gegeben und das neue KI-Modell auch schon für die ersten Nutzer geöffnet, die sich vom gewachsenen Funktionsumfang überzeugen können. Mit der zweiten Gemini-Generation startet man offiziell in die Ära der KI-Agenten, die nach Googles Ansicht schon sehr bald eine tragende Rolle im Umgang mit der Künstlichen Intelligenz spielen sollen. Doch was sind diese KI-Agenten eigentlich und welche Möglichkeiten bieten sie?
Googles KI-Modell Gemini bietet allen Nutzern eine ganze Reihe von generativen Fähigkeiten, die schon seit dem Start alle wichtigen Medienbereiche abdecken und neben Text, Bild und Audio auch ganze Videos erstellen können. Vor wenigen Wochen wurde das neue Modell Veo 2 vorgestellt, das nach Eingabe einer kurzen Beschreibung die gewünschte Videosequenz generiert. In zahlreichen Beispielvideos zeigt sich jetzt, welche Qualität das neue Modell mittlerweile erreicht hat.
Samsung hat kürzlich die Galaxy S25-Smartphones vorgestellt, Google wird schon bald das Pixel 9a vorstellen und auch viele andere Smartphone-Hersteller legen demnächst nach. Wenn es etwas gibt, das auf einer Smartphone-Präsentation im Jahr 2025 nicht fehlen darf, dann ist es die Künstliche Intelligenz. Plötzlich gibt es nur noch "KI-Smartphones" und es zeigt sich, dass die Hersteller ein ernsthaftes Problem bekommen und die Google-Abhängigkeit weiter steigt.
Neujahr 2025! Die Silvestergrüße sind verschickt und hoffentlich alle gut in das Jahr 2025 gerutscht. Zeit für die Neujahrsgrüße, und auch dafür hat Google ein interessantes Produkt im POrtfolio: Mit Viola the Bird könnt ihr gemeinsam mit einem sympathischen Vogel das Violine-spielen lernen und das dabei erschaffene Werk als spaßigen musikalischen Gruß versenden. Eine gute Alternative zur Google Blob Opera.
Googles KI-basierte Bilderkennung ist den meisten Nutzern seit vielen Jahren aus Produkten wie Google Fotos oder auch der Bildersuche bekannt, wo sie für praktische Kategorisierungen sorgt. Doch die Bilderkennung kann sehr viel mehr, als es diese Produkte den Anschein machen, denn es geht längst weit über die Objekterkennung und Personenerkennung hinaus. Ein wirklich interessantes Tool zeigt euch jetzt, wie viele Informationen Googles Algorithmen aus einem einzigen Bild ziehen können.
Die generative Künstliche Intelligenz hat in den letzten Jahren enorme Fortschritte gemacht und sich vor allem durch die breite Verfügbarkeit von KI-ChatBots schnell etabliert. Trotz aller Möglichkeiten steht die KI noch ganz am Anfang und befindet sich in einer Zeit des Aufbruchs und der Weichenstellung. Jetzt haben ehemalige Google-Entwickler angekündigt, ein "Android für KI-Agenten" zu schaffen.
Von Googles starker Bilderkennung können sich alle Nutzer in Apps wie Fotos oder der Bildersuche überzeugen, denn die Ergebnisse und Kategorisierungen wären ohne eine solche gar nicht möglich. Mit den jetzt verfügbaren KI-Möglichkeiten wird die Bilderkennung auf ein ganz neues Level gehoben, dessen Umfang vielen Menschen vielleicht gar nicht bekannt ist. Wir zeigen euch, wie ihr die beeindruckende Cloud Vision API direkt im Browser ausprobieren könnt.