OSS Stable Diffusion
Stable Diffusion ist ein Modell zur Generierung von Bildern mit Hilfe von künstlicher Intelligenz (KI). Auf Basis von Textbeschreibungen oder anderen Bildern erstellt das Programm automatisch Bilder, Grafiken oder sogar Videos [1]. Dazu nutzt Stable Diffusion ein sogenanntes Diffusionsmodell. Dieses lernt schrittweise ein Bild durch Hinzufügen von rauschen zunächst unkenntlich zu machen und dann Schritt für Schritt das Rauschen zu entfernen, um das ursprüngliche Bild herzustellen. So kann später durch Eingabe von verschiedenem Rauschen ein neues Bild hergestellt werden [2].
Anwendungsfelder
Obwohl Stable Diffusion in erster Linie nach einem kreativen Tool klingt, kann eine Bildgenerierungs-KI auch in Computer Vision Anwendungen hilfreich und sinnvoll sein. Die Erstellung synthetischer Bilder ist beispielsweise beim Training von Erkennungs- und Navigationssystemen nützlich. Im Bereich der Alltagsrobotik oder des autonomen Fahrens kann Stable Diffusion helfen, sogenannte Edge Cases darzustellen. Diese stellen im Datensatz seltene oder fehlende Szenarien da, die für eine robuste Ausführung kritisch sind.
Lizenz
Stable Diffusion unterliegt der CreativeML Open RAIL-M Lizenz [3]. Danach kann das Programm frei genutzt werden, sofern die angegebenen Einschränkungen eingehalten werden. Diese umfassen unter anderem das Verbot zur Erzeugung gesetzeswidriger Bildinhalte.
Der Code selbst unterliegt der MIT Licence [4].
Mehr zu Lizenztypen gibt es hier.
Betriebssystem und Programmiersprache
Die gängigsten Stable Diffusion Implementierungen verwendet das Python Framework PyTorch und sind somit mit den Betriebssystemen Windows 10 und 11, Linux und Mac kompatibel [5].
Erforderliche Kenntnisse
Die Nutzung von Stable Diffusion bedarf keiner spezifischen Vorkenntnisse. Für die Arbeit mit der zugrundeliegenden Technik hinter Stable Diffusion sind Kenntnisse in den Grundlagen von Maschinellem Lernen, Convolutional Neural Networks, (Variational) Auto Encoders und Erfahrungen mit dem Framework PyTorch hilfreich.
Vorteile
Auf verschiedene vorhandene Grafikleistung skalierbar [5]
Freie Nutzung durch offene Lizenz
große Communities für spezialisierte Modelle und Finetunings
Nachteile
Bei KI-Generierung übliche Frage nach Bildrechten
Sehr große Varianz in Ergebnisqualität
Referenzen
[1] aws. Was ist Stabile Diffusion? [Online]. Abrufbar: https://aws.amazon.com/what-is/stable-diffusion/. [Abruf November 6, 2025].
[2] D. Bergmann, C. Stryker. Was sind Diffusionsmodelle? [Online]. Abrufbar: https://www.ibm.com/de-de/think/topics/diffusion-models. [Abruf November 6, 2025].
[3] GitHub-Seite von Stable Diffusion, Lizenzmodell: https://github.com/Stability-AI/stablediffusion/blob/main/LICENSE-MODEL
[4] GitHub-Seite von Stable Diffusion: https://github.com/Stability-AI/stablediffusion?tab=readme-ov-file#readme
[5] R. Rodriguez. (Oktober 13, 2025). Stable Diffusion Requirements: CPU, GPU & More for Running. [Online]. Abrufbar: https://www.aiarty.com/stable-diffusion-guide/stable-diffusion-requirements.htm. [Abruf November 6, 2025].

