Das KI-Modell Gemini lässt sich nicht nur mit Fragen und Textinformationen füttern, sondern dank der Multimodalität auch mit einer ganzen Reihe von Dateiformaten. Jetzt erhöht Google die Grenzen für den Upload von Dateien für App-Entwickler und erleichtert gleichzeitig den Zugriff auf bereits in der Cloud befindliche Daten. Die Limits werden zum Teil deutlich erhöht.



Gemini kann mit Dateien wie Bildern, PDFs und anderen Formaten gefüttert werden, das gilt sowohl für Endnutzer als auch für die auf Gemini basierenden Apps per API-Zugriff. Um diese Dateien zu übermitteln, war bisher die Verwendung der Gemini Files API notwendig. Über diese lassen sich Dateien hochladen, die maximal 48 Stunden auf den Google-Servern zur Verwendung gespeichert werden. Das schränkt die Flexibilität ein und ist außerdem oftmals ein Umweg.

Zugriff auf Clouddateien

Statt wie bisher Dateien aus einem Cloudserver oder dem offenen Web herunterzuladen und bei Gemini wieder hochzuladen, kann nun der direkte Weg genutzt werden. Entwickler können eine öffentlich erreichbare URL angeben, von der Gemini die Datei bezieht. Alternativ kann eine solche auch signiert von AWS, Azure oder anderen Clouddiensten bezogen werden. Steht die Datei bereits im Google Cloud Storage zur Verfügung, lässt sich diese direkt und ohne Upload mit der Files API registrieren.

Höhere Dateilimits

Im Zuge dieses Updates werden nun auch die Limits für den Dateizugriff erhöht. Statt wie bisher 20 Megabyte, können diese jetzt bis zu 100 Megabyte groß sein. Das ist laut Google ideal für Prototyping, Echtzeitanwendungen und die Verarbeitung größerer Bilder oder kurzer Audioclips ohne Zwischenspeicherung. In obiger Infografik könnt ihr die Limits für die unterschiedlichen Datenquellen sehen.

Im Google-Blog gibt es eine schnelle Anleitung zum Ausprobieren dieser neuen Wege. Schaut doch bei Bedarf mal herein. Es ist anzunehmen, dass sich auch für Endnutzer schon bald höhere Limits ergeben könnten.

