KI-Bildgenerator: KI setzt neue Maßstäbe

geändert am 12. November 2024

AI Image Generator, der englische Begriff für KI Bild Generator revolutioniert die Bildgenerierung. KI-Bildgeneratoren erstellen visuelle Inhalte auf ganz neue Art und Weise. Aus Text oder aus Bildvorlagen entstehen beeindruckende Bilder. KI-Kreativität kennt keine Grenzen und reicht von abstrakt, über futuristisch bis hin zu fotorealistischen Darstellungen – ohne Kamera, Objektiv und Stativ oder Farbe und Pinsel. Mit Text-to-Image beginnt eine neue Ära im Bereich KI Bilder erstellen. Aber auch Image-to-Image ist auf dem Vormarsch.

KI-Bildgenerator, Esstisch mit Stühlen und Küche an der Seite
Erstellt mit playgroundai.com, Stable Diffusion XL, bis 500 Bilder pro Tag gratis, Stuhl vorne leider falsch, ansonsten beeindruckend. Allerdings reduziert sich die Qualität nach 50 Bildern.
Erzeugt mit Bing. Der Microsoft Image Creator basiert inzwischen auf Dall-E 3 und liefert mit die besten Bilder.

Welches sind die besten KI-Bildgeneratoren?

Alle hier gezeigten Bilder entstanden kostenlos. Teilweise lässt sich bei den KI-Bildgeneratoren der gewünschte Stil angeben. Dies kann je nach erzeugtem Bild z.B. fotorealistisch sein bis hin zu konkreten Angaben wie Ads-real estate oder bei Neuroflash die Aufforderung die Eingabe zu optimieren. Generell gilt für alle AI Bildgeneratoren, je besser und detaillierter die Eingabe, desto besser das Ergebnis.

Text-to-Image unter der Lupe

Um die KI-Bildgeneratoren unter die Lupe zu nehmen, formulierte ich folgenden Prompt als Texteingabe: „Esszimmer mit großem Fenster. Im Hintergrund moderne Küchenfront, im Vordergrund ein moderner Esstisch mit Stühlen“. Da ich nicht sicher bin, ob alle AI Image Generatoren Deutsch verstehen, denn öfters fehlte die verlangte Küchenfront im Hintergrund, probierte ich es noch auf Englisch mit: „Dining room with a large window. In the background modern kitchen front, in the foreground a modern dining table with chairs.“ Aber prinzipiell verstehen alle Generatoren Deutsch, das Problem mir der Küche passierte auch mit dem englischen Prompt.

KI Bilder erstellen – Beispiele mit Text-to-Image

Hier die einzelnen erzeugten KI Bilder. Wie zu sehen, fallen einige sehr gut, andere ungenügend aus, bei den letzten Bildern sind gravierende Fehler zu erkennen, wie doppelte Lampe, fehlende Stuhlteile oder falsche Perspektiven. Diese Tools habe ich deswegen nicht weiter aufgeführt:

Hier die einzelnen KI-Bildgeneratoren im Detail:

Midjourney

Midjourney mag zwar tolle Bilder generieren, aber die Anwendung ist eine Katastrophe und es ist schwierig ein kostenloses Testbild zu generieren. Um sich bei Midjourney anzumelden, benötigen Sie zunächst einen Discord-Account. Sobald Sie einen solchen eingerichtet haben, besuchen Sie die Midjourney-Website, melden sich dort mit Ihren Discord-Anmeldedaten an und wählen einen der verfügbaren Pläne aus. Anschließend erhalten Sie eine Einladung zum entsprechenden Discord-Server. Sollten Sie die Einladung nicht finden können, klicken Sie in Discord auf „Server hinzufügen“ und geben Sie dort „http://discord.gg/midjourney“ ein, um dem Server beizutreten.

Die Version 5 von Midjourney bietet eine breite Palette an Stilen und vor allem Bilder von sehr hoher Qualität. Zusätzlich optimierte Midjourney einige Bereiche der Bild-KI, insbesondere in Bezug auf Hände und Finger. Niji bedeutet Regenbogen und verhilft Midjourney Bilder zum aus japanischen Animationsfilmen bekannten Anime Style. Die Anwendung der Animes mit ihren überdimensionierten Augen, den detaillierten Gesichtszügen und lebendigen Farben, ist recht einfach, am Ende des Prompts einfach „–niji“ anhängen.

Der Burda-Verlag machte Furore mit seinem Extraheft Lisa Kochen & Backen „Geniale Pasta-Gerichte für Genießer“ mit 99 Pasta-Rezepten generiert von ChatGPT. Die Bilder im Heft stammen von Midjourney. Der KI-Bildgenerator eignet sich perfekt für Food-Fotografie. Überzeugen Sie sich selbst, hier finden Sie einige der KI-Fotos.

Artsmart AI

Artsmart AI* ist ein neuer, aber leistungsstarker KI-Bildgenerator. Das Tool basiert auf Stable Diffusion und ist sehr einfach zu bedienen. Die Qualität der mit Text-to-Image erstellten Bilder lässt sich durchaus mit Midjourney vergleichen, aber mit einer wesentlich benutzerfreundlichen Eingabeoberfläche, sprich playground, und mit attraktiveren Preisen.

Der KI-Bildgenerator punktet mit zahlreichen Funktionen. Neben dem Erstellen von Fotos aus Text oder einem Bild, lassen sich bestehende Bilder mit niedriger Auflösung upscalen, mit Inpainting Objekte im Bild mit einem Pinsel unkenntlich machen, mit Outpainting ein Bild um Teile ergänzen oder den Hintergrund entfernen. Der Hyper Realistic Mode verwandelt unnatürlich erscheinende KI-Charaktere in fast menschliche Wesen. Spannend ist auch die „Explore“-Funktion, hier finden Sie vorgefertigte Bilder mit den dazugehörigen Prompts.

Die nachfolgenden Bilder stammen aus der Community-Sammlung. Der Prompt fürs linke Bild war sehr ausführlich, rechts: „modern interior kitchen open concept marble details and trendy details“.

Die einzelnen Preispläne unterscheiden sich im Wesentlichen in der Anzahl Credits, die sie enthalten. Ferner fehlen beim günstigen Basic-Plan ArtSmart API und Extended Tune Storage. Basic umfasst 1.000, Standard 2.500 und Business 6.000 credits. Bevor Sie loslegen, sehen Sie wie viele Credits es kostet, im Schnitt ein Credit pro Aktion.

Einen Wermutstropfen besitzt der KI-Generator allerdings, es gibt keine kostenlose Testmöglichkeit, man kann höchsten ein Abo für einen Monat abschließen und die 30-tägige Geldzurück-Garantie nutzen, das ist schade.

Stabile Diffusion Online

Stable Diffusion XL ist ein latentes Text-zu-Bild-Diffusionsmodell, das in der Lage ist, fotorealistische Bilder aus beliebigen Texteingaben zu generieren. Es produziert unglaubliche Bilder und ermöglicht Milliarden von Menschen, innerhalb von Sekunden atemberaubende Kunst zu erschaffen. Je nach Auslastung und Warteschlange dauert es allerdings durchaus ein paar Minuten.

Die Stable Diffusion verfügt über eine Souffleur-Suchmaschine. Hier gibt es Ideen für die Texteingabe (Englisch), um aus einer Datenbank mit 12 Millionen Prompts nach generativen Bildern von KI-Künstlern aus aller Welt zu suchen.

Erstellen Sie direkt im Browser kostenlos schöne Kunst mit Stable Diffusion ONLINE. Das oben gezeigt Bild entstand mit der Eingabe auf Englisch und der Angabe Styles: Ads-real estate. Hier alternative Bilder mit folgendem Prompt: „Table with 6 chairs located in a modernly decorated dining room, highly detailed, IKEA styles, with modern kitchen in background, furniture in white color“. Beim rechten BIld anstatt „IKEA“ „modern“. Dies ist eine Kombination aus der Prompt-Ideen-Schmiede mit eigenen Ergänzungen. Beim rechten Bild ignorierte die KI allerdings die weißen Farben, elegant scheint wohl nicht Weiß zu sein.

Stable Diffusion gibt es auch als App im Google Play und im App Store unter dem Namen Dreamer AI Art. Und Animes lassen sich mit Anime Master generieren.

Dall-E 3 mit Bing

Das neuste Modell des Microsoft Image Creators Dall-E 3 hält locker mit Midjourney und Stable Diffusion XL mit. OpenAI hat in DALL-E 3 Schutzmaßnahmen integriert, um problematische Inhalte zu verhindern, z.B. gewalttätige, hasserfüllte oder diskriminierende Bilder. Das Modell blockiert Anfragen zur Erstellung von Bildern öffentlicher Personen, um Missbrauch (Deep Fake) zu verhindern. Im Vergleich zu anderen KI-Generatoren sind die Restriktionen bei DALL-E 3 streng, z.B. werden Anfragen mit Begriffen wie „sexy“ oder „Bikini“ sofort abgelehnt.

Die Bilder lassen sich direkt aus dem Bing Chat erstellen, einfach den deutschen Prompt mit „Zeichne: ….“ beginnen. Bing Chat übergibt die Aufgabe direkt an den Image Generator und erstellt vier quadratische Bilder (siehe oben).

Beim rechten Stuhl ist der vordere Fuß im Teppich verschwunden.

Pro:

  • Keine Kosten für die Nutzung
  • Hervorragende Bildqualität, vergleichbar mit Stable Diffusion XL & Midjourney
  • In Kürze auch direkt in ChatGPT Plus und Enterprise verfügbar

Contra:

  • Beschränkt auf die Erstellung von Bildern im quadratischen Format
  • Strikte Zensurregeln
  • Monatliche Beschränkung auf 100 Credits für die Bildgenerierung

SUPERMACHINE

Der KI-Bildgenerator SUPERMACHINE* nutzt Stable Diffusion bis hin zu SDXL als Grundlage und besitzt die Fähigkeit, mithilfe der Dreambooth-Technologie auch andere KI-Bildgeneratoren zu emulieren, darunter den äußerst populären Stil von Midjourney. Insgesamt bietet SUPERMACHINE* über 40 verschiedene Stile, um nach der Eingabe von Text einzigartige Ergebnisse zu erzeugen. Anwendungsgebiete sind unter anderem Blogs, Websites, Social Media sowie Selbstvermarktung und Verkauf. Mittlerweile findet der Bildgenerator in zahlreichen deutschen Agenturen und Marketingabteilungen Anwendung. Insbesondere die Bereiche Grafik und Design erfordern täglich neue Bilder, was SUPERMACHINE* erheblich erleichtert.

Die kostenlose Testversion umfasst 25 Credits, damit lassen sich je nach Anforderung rund 20 Bilder kreieren. Hier sind die recht moderaten Preise, bei jährlicher Zahlung schrumpft es nochmals auf $ 100 und $ 350.

NightCafe

NightCafe erzeugt KI-Kunst mit natürlich-sprachlichen Eingabeaufforderungen. Um das Tool zu verwenden, müssen Nutzer ein Konto erstellen. Für die Bildgenerierung nutzt NightCafe verschiedene AI-Modelle wie Stable Diffusion sowie VQGAN+CLIP zur künstlerischen Stilübertragung. Das ist äußerst praktisch, da sich so die diversen KI-Modelle testen lassen.

NightCafe wurde durch die Verwendung der VQGAN+CLIP-Methode zur Generierung von Text-zu-Bild-Kunstwerken berühmt und erfreute sich infolgedessen schnell wachsender Beliebtheit. Laut NightCafe erstellten Anwender über die NightCafe-Plattform bis Oktober 2022 bereits mehr als 35 Millionen KI-generierte Kunstwerke. Der Name NightCafe ist eine offensichtliche Anspielung auf das gleichnamige Gemälde von Vincent Van Gogh. https://nightcafe.studio/

Bei NightCafe lassen sich credits sammeln, damit wird die Bildgenerierung fast dauerhaft kostenfrei.

neuroflash

neuroflash* zählt zu den beliebtesten und leistungsstärksten KI-Textgeneratoren, insbesondere für deutsche Texte. Inzwischen kam der KI-Bildgenerator ImageFlash hinzu. Pro Monat lassen sich mit dem kostenlosen Plan fünf Bilder mit 1014 x 1024 px generieren. Der AI Bildgenerator funktioniert ganz einfach: Text eingeben, eventuell „optimiere meine Eingabe“ wählen und „Bilder erstellen“.

Weitere Einstellungen sowie eine Weiterbearbeitung sind bei neuroflash* leider nicht möglich, da ist man der KI etwas ausgeliefert. Im Tutorial weisen sie daraufhin, wie ein Prompt aufgebaut sein sollte. Subjekt, Details & Umgebung, Stil/Künstler/Media Typ, also als Beispiel „Schildkröte, unter Wasser, expressionistisches Gemälde“ und das auf Englisch, wo dies über „optimiere meine Eingabe“ automatisch erfolgt. Auch sollte ein Prompt keine verneinende Aussagen enthalten, das versteht die KI nicht, also nicht „ohne Bart“, sondern stattdessen „glattrasiert“.

Die Bildqualität ist recht hoch, wie das Testbild oben beweist, nur die Küche sieht etwas eigenartig aus. An die Bilder von Midjourney kommen sie noch nicht ganz ran.

MyEdit

Die Verwendung von KI-generierten Bildern (Text-to-Image) mit MyEdit erweist sich für Künstler, Designer und Content-Ersteller als äußerst hilfreich. Beschreibungen lassen sich in einzigartige Kunstwerke, Illustrationen oder Grafiken für digitale Plattformen und Printmedien umwandeln.

Designer können mithilfe des KI-Bildgenerators und präzisen Beschreibungen ihre Konzepte visuell darstellen. Sie lassen sich exakt an verschiedene Inhalte und Texte anpassen, wodurch ein einheitliches Storytelling entsteht.

Sie können täglich 5 Sets KI-generierter Bilder kostenlos erstellen oder ein preiswertes Abo lösen:

MyEdit stammt von der Firma Cyberlink, die mit dem PhotoDirector* noch weitere Fotobearbeitungssoftware mit KI anbietet.

Gencraft

Gencraft ist eine relativ neue KI-gestützte Plattform, die es Nutzern ermöglicht, Kunst mit Hilfe von fortschrittlicher KI-Algorithmen zu erzeugen. Welches KI-Modell Gencraft genau benutzt ist auf der Website nicht ersichtlich. Gencraft erlaubt in der kostenlosen Version die Generierung von 10 Bildern täglich für den nicht-kommerzielle Gebrauch. Für die kommerzielle Nutzung heißt es upgraden.

Die Verwendung von Gencraft ist einfach. Text eingeben oder in der Premiumversion lassen sich auch eigene Bilder hochladen. Es stehen zahlreiche Styles bis hin zu 3D zur Auswahl sowie die Eingabe des Bildseitenverhältnis. Die KI Bilder lassen sich als HD herunterladen, in der Bezahlversion sogar bis 4K. Achtung: die Preise für einen Upgrade von € 3,99 oder € 9,99 verstehen sich pro Woche und nicht pro Monat. Aber die Bilder sind recht beeindruckend, hier in verschiedenen Seitenverhältnissen, allerdings stimmen im Bild rechts die Lampen nicht.

Image-to-Image noch in den Kinderschuhen

Bei der Image-to-Image-Technologie lädt der Anwender ein Bild hoch und gibt zusätzliche Anweisungen in Textform. Dann dient das Bild als Vorlage. Leider ist dies noch nicht soweit ausgereift, wie Text-to-Image. Was bisher nicht funktioniert ist die Angabe, das Bild so zu behalten wie es ist und nur die Umgebung zu verändern.

Es geht also beispielsweise nicht, das Bild eines Fußballers zu nehmen, die Person nicht zu verändern und nur mehr Aktion ins Bild zu bringen. Die KI – egal auf welchem KI-Modell basierend, ändert die Person. Oder als Vorlage etwa eine junge Frau mit einem roten Schwarzwälder Bollenhut zu nehmen und diese in eine ältere Dame mit schwarzem Bollenhut zu verwandeln. Seltsamerweise funktionierte das Älterwerden, aber nicht die Farbänderung des Hutes. Hier besteht also noch Handlungsbedarf für solche Anwendungen.

Andersherum funktioniert es natürlich, falls die Bewegungsform mit einer anderen Person gewünscht wird. Was ebenfalls geht, ist das Hochladen eines Bildes ohne Person. Hier habe ich bei Nightcafe mit SDXL Beta ein Start Image hochgeladen (lasse ich weg, da urhebergeschützt) und diese Bilder daraus generiert. Das Ursprungsbild sah vom Design her ganz anders aus, der Prompt war: „kitchen like the Start image“, aber die wesentlichen Element, wie Esstisch im Vordergrund und Küche im Hintergrund stimmen. Beim linken Bild stimmt der Tisch leider nicht.

Das Noise weight reguliert, wie weit das Bild vom Startbild abweicht. Das linke Bild entspricht 0 %, das rechte 100%. Je mehr Rauschen dem Startbild hinzugefügt wird, desto größer die Abweichung.

Bild-KI und die Kunst Bilder zu generieren

Ein KI-Bildgenerator funktioniert, indem er aus Daten lernt, wie bestimmte Bilder aussehen. Mit diesem Wissen kann der AI Image Generator dann eigenständig KI Bilder erstellen, die ähnlich wie existierende aussehen, aber komplett neu sind. Bild-KI ermöglicht, visuelle Inhalte zeitsparend und produktiv zu erstellen, ohne dass ein Mensch jedes Detail zeichnen oder fotografieren muss. Text-to-Image verwandelt Text in Bilder, die immer besser werden. Image-to-Image nimmt Bilder als Vorlage für die Gestaltung eines neuen Bildes.

Warum sind KI-Bildgeneratoren so faszinierend?

KI-Bildgeneratoren sind in der Lage, Bilder jeglicher Couleur zu generieren. Bild-KI umfasst Bilder für folgende Einsatzgebiete (und mehr):

  • Mode
  • Technologie
  • Landschaften
  • Porträts
  • Tiere
  • Abstrakte Kunst
  • Illustrationen
  • Food
  • Fahrzeuge
  • Innendesign
  • Sport
  • Natur
  • Fantasy-Welten

Und ähnlich wie ChatGPT & Co. aus wenigen Eingaben ganze Texte erstellt oder KI-Videogeneratoren beeindruckende Videos, generieren KI-Bildgeneratoren unglaubliche Bilder aus Texteingaben. KI Bilder erstellen wird damit zum Kinderspiel, ob im Marketing oder als neues Stilmittel in der bildenden Kunst. Bilder, die als Vorlage für neue Bilder dienen, sind ein weiteres Feld der Generierung von von KI-Kunst.

Vielfältigkeit KI-generierter Bilder

Ganz gleich, ob Mode, Technik, Architektur, Design oder Gastronomie – KI-Bildgeneratoren passen sich nahtlos verschiedenen Branchen an und erstellen Inhalte, die perfekt zum Produkt, zur Dienstleistung oder zur Marke passen.

Jeder Kunde ist einzigartig. KI-Bildgeneratoren ermöglichen personalisierte Bilder, die individuelle Vorlieben und Anforderungen berücksichtigen, ein weiteres Plus für Bild-KI im Marketing. Ein AI Image Generator ist ein Must-have in der Branche und KI Bilder erstellen gehört zum täglichen Werkzeug.

Zukunft des visuellen Marketings: KI-Bildgeneratoren in Aktion

Durch die präzise Erfassung von Stimmungen und Gefühlen können KI-Bildgeneratoren visuelle Inhalte schaffen, die eine tiefere emotionale Bindung zwischen Marke und Kunde herstellen. AI Image Generatoren können Emotionen zum Leben erwecken.

Durch die Integration individueller Markenmerkmale in generierten Bildern wird die Wiedererkennbarkeit gestärkt, was zu einer nachhaltigen Markenpräsenz führt. KI Bilder erstellen bedeutet die Zukunft schon heute realisieren.

Text-to-Image – Mensch und Maschine Hand in Hand

Die Ära der KI-Bildgeneratoren ist angebrochen, aber ihre wahre Stärke liegt in der Zusammenarbeit von menschlicher Kreativität und künstlicher Intelligenz. Gemeinsam schaffen Mensch und KI visuelle Meisterwerke, die das Marketing auf ein neues Level heben. Nutzen Sie KI-Bildgeneratoren, erleben Sie die Zukunft und präsentieren Sie ihre Produkte oder Marke mit der Magie der KI. Und dies funktioniert mit wenigen Texteingaben, Text-to-Image erlaubt fantastische KI Bilder zu erstellen.

Inpainting – Text-to-Image Objekte nachträglich einfügen

Inpainting ermöglicht, nachträglich Objekte in ein KI-Bild einzufügen. Dies funktioniert folgendermaßen. Mit einem Pinsel markieren Anwender den Bereich, wo die KI das Objekt oder die Objekte eingefügen soll. Dann erfolgt die Texteingabe, was ins Bild einzufügen ist und schließlich fügt die KI das Gewünschte an der markierten Stelle ein. Inpainting besitzt verschiedene Namen, bei Canva verbirgt sich die Funktion etwa hinter „Magic edit“.

Outpainting – mit Text-to-Image Objekte entfernen

Outpainting ist im Prinzip das Gegenstück zu Inpainting. Mithilfe eines Radiergummis markiert man den Bereich, wo die KI etwas entfernen soll, im Prompt gibt man an, was sie genau entfernen soll.

Auf welchen KI-Modellen beruhen KI-Bildgeneratoren?

Im Wesentlichen basieren KI-Bildgeneratoren auf folgenden KI-Modellen:

  • Midjourney
  • Dall-E
  • Stable Diffusion
  • Imagen
  • GauGAN
  • Pixray-text2image
  • VQGAN+CLIP

Lesen Sie hier, was sich hinter den einzelnen KI-Modellen verbirgt und welche Sonderformen es gibt.

Fazit

Inzwischen gibt es zahlreiche KI-Bildgeneratoren am Markt. Sie basieren mehr oder weniger auf denselben KI-Modellen, deshalb unterscheiden sie sich oft nur in der Handhabung und im Preis. Midjourney dürfte nach wie vor die beste Qualität liefern, ist aber dermaßen unpraktisch für Nicht-IT-Nerds, dass andere Optionen punkten. Artsmart AI* und SUPERMACHINE* sind gute Beispiele dafür. Aber auch die Gratisversionen müssen sich nicht verstecken, allen voran Stable Diffussion ONLINE mit SDXL und seit Oktober Dall-E 3 über Bing Chat. Die Image-to-Image-Anwendungen sind leider noch nicht für alle Gestaltungswünsche aus den Kinderschuhen raus.