Nano Banana: Top oder Flop?

Google hat mit Nano Banana (offiziell Gemini 2.5 Flash Image) ein neues Bildmodell auf den Markt gebracht. Der Hype ist gross, wir haben uns das Modell mal genauer angeschaut.

Michael Ryser – 27. August 2025

Nano Banana ist seit weniger als 24 Stunden als Preview im Google AI Studio verfügbar. Was direkt auffällt: Bei Image-to-Image-Bearbeitungen liefert das Modell beeindruckende Ergebnisse. Hier setzt das Modell definitiv einen neue Massstäbe.

Ein dunkles Diagramm mit dem Titel "Image Editing: Overall Preference on LMArena". Die x-Achse misst den Durchsatz in "Pixel pro Sekunde", die y-Achse die "LMArena Elo-Werte" mit 95% Konfidenzintervallen. Vier Datenpunkte sind eingezeichnet: "Gemini 2.5 Flash Image" mit dem höchsten Wert, "ChatGPT 4o / GPT Image 1 (High)", "FLUX3 Kontext (max)" und "Gemini 2.0 Flash Image".

User-Bewertung verschiedener Image-to-Image-Modelle auf LM Arena. Google Deepmind

Bei der Text-to-Image-Bilderstellung überzeugt uns Nano Banana jedoch noch nicht vollkommen. Das Modell ist zwar schnell, doch mangelt es unseren Outputs oft noch am natürlichen Look. Aktuell wirken die Bilder noch sehr plastisch, besonders auffallen tut dies bei menschlichen Hautstrukturen.

Keine News mehr verpassen

News, Updates und Insights zu AI und unserer Arbeit.

Beratung anfragen

Resultate

Text-to-Image

Ein digitales Gemälde, das einen Meerblick von einem Fenster aus darstellt. Man blickt durch drei Bogenfenster, hinter denen eine farbenfrohe Unterwasserwelt mit Korallen, Fischen und einem Rochen zu sehen ist. Im Vordergrund steht ein grosser Blumenstrauss mit gelben, roten, rosa und orangen Blumen. Daneben liegen zwei Kissen auf der Fensterbank.

Prompt: A hyper-realistic photo of a bay window interior, a bright bouquet of colorful flowers in a transparent glass vase and two soft pillows arranged on the sill, beyond the glass lies a surreal underwater world with coral reefs and fish swimming past, inside illuminated with warm golden light, outside glowing in cold blue tones, high dynamic range, cinematic lighting, professional photography, 8k ultra detail, full frame DSLR, 50mm lens, depth of field, photorealistic atmosphere

Eine Frau in Jeans, schwarzem Top und schwarzer Lederjacke steht selbstbewusst in einer Wüste mit sandigen Dünen und einzelnen Kakteen.

Prompt: A woman with sun-kissed skin stands in a vast desert, looking directly into the camera with a confident, determined expression. The sun is high overhead, casting short, harsh shadows. The desert panorama in the background consists of gentle sand dunes in ochre and orange tones, punctuated by resilient plants like cacti. The sky is cloudless and brilliantly blue. The lighting is dramatic but realistic, with a focus on the woman in the center of the frame. The scene is captured in the style of a realistic photograph.

Eine weite Aufnahme einer Berglandschaft im Winter bei Sonnenuntergang. Die schneebedeckten Berge und die bewaldeten Täler sind in Rosa- und Violetttöne getaucht. Der Himmel ist sternenklar.

Prompt: An alpine winter landscape at golden hour. Highly photorealistic, soft, warm light illuminates snow-covered peaks and deeply snow-laden fir forests. The sky glows in shades of orange, pink, and purple, as the first stars appear on the horizon. The scene exudes a sense of calm and peace.

Eine Nahaufnahme eines Gesichts, die sich auf den Mund, die Nase und das Kinn konzentriert. Der Mund ist geschlossen, die Lippen sind glatt und leicht rosa.

Prompt: An extremely detailed and natural close-up of a 25-year-old woman's lips. The skin texture around the lips is highly detailed and natural. The lighting is soft and even to highlight the natural contours.

Image-to-Image

Eine Collage mit zwei Bildern. Oben ist eine Nahaufnahme eines Mannes in einem Büro zu sehen, der Papiere in der Hand hält. Das grösste Bild unten zeigt denselben Mann in einem Anzug, der in einer Wüstenlandschaft vor Sanddünen und Bergen steht und ein paar Papiere in den Händen hält.

Prompt: make him stand in a bright desert

Eine Collage mit zwei Bildern. Oben ist eine Nahaufnahme eines Mannes in einem Büro, der einen Stapel Papiere hält. Das grösste Bild unten zeigt denselben Mann in einem Büro, der eine grosse Tüte mit "Zweifel Nature" Chips hält. Rechts davon befindet sich ein Kopierer.

Prompt: make him hold this product instead of the papers

Eine Collage mit zwei Bildern. Oben links ist ein rot-weiss gestreiftes T-Shirt auf weissem Hintergrund abgebildet. Darunter ist eine Nahaufnahme eines Mannes mit Sonnenbrille und rot-weissem T-Shirt zu sehen, der an einem Strandtisch sitzt. Das grösste Bild auf der rechten Seite zeigt denselben Mann auf einem Liegestuhl am Strand, der auf ein kleines Gerät schaut.

Prompt: make the old man wear this stripped shirt

Eine Collage mit zwei Bildern. Oben links ist ein weisses Jil Sander T-Shirt auf weissem Hintergrund zu sehen. Darunter befindet sich eine Nahaufnahme eines älteren Mannes mit Sonnenbrille und einem weissen T-Shirt, der am Strand sitzt. Das grösste Bild auf der rechten Seite zeigt diesen Mann am Strand auf einem Liegestuhl, der auf ein kleines Gerät schaut. Im Hintergrund sind weitere Strandbesucher zu sehen.

Prompt: make the old man wear this jil sander t shirt

Eine Collage mit zwei Bildern. Das obere Bild zeigt ein rosafarbenes T-Shirt von Jil Sander auf weissem Hintergrund. Darunter ist eine Nahaufnahme einer jungen Frau, die ein weisses, gemustertes Oberteil trägt und Fahrrad fährt. Das grösste Bild auf der rechten Seite zeigt dieselbe junge Frau mit Sonnenbrille und einem rosafarbenen Jil Sander T-Shirt, die auf einer von Bäumen gesäumten Strasse Fahrrad fährt.

Prompt: make her wear this jil sander t shirt

Fazit

Nano Banana setzt bei der Bearbeitung und Komposition mit AI neue Massstäbe. Die Resultate sind beeindruckend. Der Kontext des Bildes wird nicht oder nur kaum verfälscht und die Produkte werden stark eingebunden. Es gibt weiterhin Schwächen, die jedoch teilweise der Natur der Sache geschuldet sind.

Anders sieht das Fazit für die klassische Bildgenerierung aus. Gemini Flash 2.5 ist keineswegs katastrophal bei der Erstellung von Bildern, doch gegenüber der Konkurrenz sind die Resultate nicht überragend.