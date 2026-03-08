Mit modernen KI-Modellen wie Gemini lassen sich sehr viele Aufgaben erledigen, Informationen organisieren oder auch umfangreiche Inhalte erstellen. Doch bei einigen vermeintlich simplen Dingen versagen sie aufgrund ihrer Architektur und werden daher an so manchem Bereich noch länger zu knabbern haben: Googles KI-Modell ist noch nicht einmal dazu in der Lage, ein Sudoku zu lösen.



Ich hatte hier im Blog erst vor wenigen Tagen erklärt, warum Gemini und Co die Uhrzeit nicht lesen können, was angesichts der KI-Power sowie der starken visuellen KI eigentlich keine große Herausforderung sein sollte. Schließlich lassen sich mit Gemini sehr umfangreiche Themen erörtern, ausarbeiten, Bilder erklären, Bilder manipulieren und vieles mehr. Aber es gibt auch noch andere Schwierigkeiten.

Gemini hat nicht nur ein Problem mit der Analoguhr, sondern auch mit einem Sudoku-Rätsel. Ich habe diese Erfahrung in den letzten Monaten immer wieder gemacht (aus reiner Neugier) und dabei je nach Modellauswahl Unterschiede bei der Selbsteinschätzung festgestellt: Der KI-ChatBot wurde von mir immer wieder mit einem Bild eines klassischen Sudokus gefüttert – in den unterschiedlichsten Schwierigkeitsstufen.

Gemini hat die Anfrage, das Sudoku korrekt zu lösen, niemals abgelehnt. Stattdessen hat der KI-ChatBot je nach Modellauswahl etwas länger überlegt und anschließend entweder eine ausgefüllte Grafik oder ein fertig gelöstes Sudoku in Textform ausgespuckt. Stets mit der Rückmeldung, dass das Rätsel nun fertig gelöst ist. Gelöst war es immer – aber kein einziges Mal war es korrekt oder gar nachvollziehbar.











Grafik: Leeres Sudoku | Geminis Lösung | Korrekte Lösung

Geminis Irrwege

Auf den ersten Blick sahen die Lösungen gut aus. Doch wenn man sich die ausgefüllten Gitter etwas länger anschaute, wurde schnell klar, dass man sich darauf nicht verlassen sollte. Zum Teil wiederholten sich Zahlen in einer Linie mehrfach. In einigen Fällen fehlten einige Ziffern. Nicht selten kam es sogar vor, dass Gemini die bereits ausgefüllten Felder (ein Sudoku ist schließen zu Beginn niemals leer) geändert hat. Was nicht passt, wird passend gemacht. In einigen Fällen werden unzählige Zeilen Programmiercode ausgegeben (der nicht von mir angefordert wurde).

In obiger Grafik könnt ihr beispielsweise sehen, dass Gemini viele Zahlen entgegen der Regeln mehrfach in einer Zeile, Spalte oder einem Block verwendet. Spricht man den KI-ChatBot darauf an, besteht dieser auf seiner korrekten Lösung oder gibt eine neue (ebenso falsche) Lösung aus.

Warum kann Gemini kein Sudoku lösen?

Die große Frage ist, warum Gemini kein Sudoku lösen kann. Ich habe darauf tatsächlich keine Antwort. Die Erkennung der Ziffern und deren Position im Gitter sollte für die Bilderkennung kein Problem sein. Die Logik zur Lösung eigentlich auch nicht, denn die Sudoku-Regeln sind denkbar einfach. Gerade die Logik soll es doch sein, was die KI-Modelle ausmacht. Doch an irgendeiner Stelle scheint Gemini stets die Motivation auszugehen. An der Ausgabe liegt es auch nicht, denn selbst wenn die Antwort in Textform ohne Grafik erscheint, ist es nicht korrekt.

Ich denke, dass das erfolgreiche oder eben nicht-erfolgreiche Lösen eines Sudoku-Rätsels genauso ein Gradmesser wie die Uhrzeit sein könnte. So lange die KI das nicht hinbekommt, sollte man vielleicht auch den anderen Antworten nicht vollends vertrauen. Kleiner Fun Fact: Google Goggles konnte schon 2011 Sudokus lösen.

