Generative Künstliche Intelligenz (KI) hat sich zu einer der aufregendsten und vielseitigsten Technologien unserer Zeit entwickelt. Sie kann Texte, Bilder und faszinierende Videos erstellen, Musik komponieren und sogar Webseiten generieren. In diesem Blogbeitrag werfen wir einen Blick auf die praktischen Anwendungen, Herausforderungen sowie künftige Entwicklungen generativer KI.
Steigende Kundenerwartungen, globale Vernetzung, Digitalisierung und Daten verändern kontinuierlich die Art und Weise, wie Unternehmen agieren und konkurrieren. Um diesen Herausforderungen zu begegnen, werden vor allem im Bereich generativer KI maßgeschneiderte Lösungen benötigt.
Begriffe und technologische Basics
Generative KI ist eine Form der künstlichen Intelligenz, die gestützt auf ihre Trainingsdaten Inhalte wie Text, Bilder, Musik und Videos produzieren kann. Sie nutzt große Datensätze und komplexe Modelle, um Muster zu erkennen und auf Basis dieser Muster neue Inhalte zu erstellen.
Prägnantes Beispiel: Sora ist ein Text-zu-Video-Modell von OpenAI, das fotorealistische Videoclips aus Texteingaben generiert. Sora ist noch nicht frei zugänglich, soll aber noch 2024 veröffentlicht werden. Die Ergebnisse sind spektakulär, sehen Sie selbst:
Abb. 1: Hollywood-reife Videoclips von Sora (Quelle: YouTube)
Aber wie funktioniert das technologisch?
Generative KI nutzt eine Methode namens Maschinelles Lernen, speziell die Technik Deep Learning. Der Computer wird dabei mit gewaltigen Mengen an Text und Informationen gefüttert, um zu lernen, wie man Texte auf dem sprachlichen Niveau eines Menschen formuliert, Softwarecode schreibt und Inhalte zusammenfasst. Das Prinzip dahinter nennt sich große Sprachmodelle bzw. Large Language Models.
Jessica Trias Eisenberg, Product Manager bei HYPE Innovation erklärt:
„Large Language Models sind darauf trainiert, Wort für Wort abzuschätzen, wie ein Satz weitergehen sollte. Sie basieren im Grunde auf sehr cleverer Wahrscheinlichkeitsrechnung.“
Abbildung 2 zeigt die Wahrscheinlichkeit bestimmter Wörter nach Satzanfängen. „Der Computer nutzt diese Wahrscheinlichkeiten, um Sätze zu bilden“, so Trias Eisenberg.
Abb. 2: „Sehr schlaue Wahrscheinlichkeitsrechnung“ für Wörter (Quelle: LinkedIn)
ChatGPT, das wohl prominenteste Beispiel für generative KI, wurde Schätzungen zufolge auf über 300 Milliarden Wörter trainiert. Diese Anwendung von OpenAI GPT (Generative Pre-trained Transformer) kommuniziert mit Nutzern über textbasierte Nachrichten und Bilder und wurde Ende 2022 als eigenständiger Service veröffentlicht.
Heiß umkämpfter Markt
Als ChatGPT erschien, löste das einen regelrechten Hype um Künstliche Intelligenz aus. Innerhalb eines Monats zog der clevere Chatbot über 50 Millionen Nutzer an, was ihn zu einem der am schnellsten wachsenden Internetdienste ever macht.
Laut Gartner Hype Cycle der "Emerging Technologies 2023 – siehe Abbildung 3 – befindet sich das Thema generative KI zurzeit auf dem Höhepunkt der aufstrebenden Technologien mit großem Potenzial und wird in zwei bis fünf Jahren den Mainstream erreichen. Konkret heißt es dort:
„Generative KI…, aber auch andere aufkommende KI-Techniken bieten ein nicht zu unterschätzendes Potenzial, um das digitale Kundenerlebnis zu verbessern, intelligentere Geschäftsentscheidungen zu treffen und sich von der Konkurrenz abzuheben.“ (Quelle: Gartner)
Auch Verbraucher sehen viele Vorteile. Sie glauben, dass generative KI die Art und Weise verändern wird, wie Unternehmen mit ihnen in Kontakt treten und ihre Probleme lösen. Umfragen zufolge erwarten fast 70 Prozent der Befragten, dass die meisten Unternehmen in naher Zukunft generative KI nutzen werden, um ihre Kundenzufriedenheit zu verbessern, und mehr als die Hälfte assoziiert den Einsatz von KI mit Premium-Marken.
Heißt im Endeffekt: Die Integration von generativer KI in die Customer Journey bietet enorme Chancen und ist für Unternehmen unverzichtbar. Mehr dazu können Sie auch in unserem Blogbeitrag "Was kann Künstliche Intelligenz leisten? Ein Überblick" lesen.
Das Wettrennen der Premium Player von Meta bis Microsoft treibt die Innovation jedenfalls massiv voran und führt zu immer leistungsstärkeren und smarteren KI-Anwendungen. So präsentierte Alphabet-Tochter Google im Mai 2024 eine verbesserte Version ihres Sprachmodells Gemini. Apple will Berichten zufolge eine Kooperation mit OpenAI eingehen und einen Chatbot ähnlich ChatGPT in iPhones integrieren.
Abb. 3: Gartner Hype Cycle der "Emerging Technologies 2023" (Quelle: Gartner)
Konkrete Anwendungen und Anbieter
Schon heute gibt es vielfältige Einsatzmöglichkeiten generativer KI. Hier einige der wichtigsten Anbieter und Beispiele:
Text-zu-Text: ChatGPT (OpenAI)
Der bereits erwähnte Chatbot ChatGPT von OpenAI überrascht mit Texten und Dialogen, die von Menschen stammen könnten. Er hilft zum Beispiel bei:
- Texterstellung: Schreiben von Artikeln, Blogbeiträgen, Marketingmaterialien etc.
- Übersetzungen: Übersetzen von Texten in verschiedene Sprachen
- Programmierung: Generieren von Softwarecode; Beantworten technischer Fragen
- Kundenservice: Automatische und effiziente Beantwortung von Kundenanfragen
Text-zu-Bild: ChatGPT/DALL-E (OpenAI)
DALL-E von OpenAI kann aus Textbeschreibungen Bilder erzeugen, für viele Bereiche:
- Grafikdesign: Erstellen von Illustrationen und Designs
- Marketing: Gestaltung passender Bilder für individuelle Kampagnen
- Kreativprojekte: Unterstützung bei der Ideenfindung und Visualisierung
- Unterhaltung: Abwechslungsreiche Bilder für Stories und Spiele
Text-zu-Audio: Suno.ai
Suno.ai kann auf Basis von Text individuelle Audioinhalte entwickeln, wie z.B.:
- Podcasts: Entwurf gesprochener Inhalte auf Basis von Skripts
- Audiobücher: Produktion von Hörbüchern aus schriftlichen Texten
- Support für Sehbehinderte: Automatische Text-zu-Sprache-Umwandlung
Text-zu-Video: Sora (OpenAI)
Sora von OpenAI haben Sie schon kennengelernt. Der Produzent Hollywood-reifer Videoclips kann Ihnen in vielen Bereichen wertvolle Dienste leisten:
- Marketing/Werbung: Produktion faszinierender Werbevideos und Präsentationen
- Trainings: Entwicklung überzeugender Lehrvideos und interaktiver Lernmaterialien
- Visuelles Storytelling: Erstellung kreativer Medien und visueller Geschichten
Abb.4: Brainstorming mit der KI: Trisociation (Quelle: HYPE)
So unterstützt generative KI im Arbeitsalltag
Text-zu-Text, Text-zu-Bild, Text-zu-Audio, Text-zu-Video: Generative KI bietet zahlreiche Anwendungsmöglichkeiten, die Ihre tägliche Arbeit bereichern und erleichtern können. Jessica Trias-Eisenberg von HYPE stellte beim Deutschen Ideenmanagement-Forum 2024 einige leicht umsetzbare Beispiele für den Arbeitsalltag vor.
Neuen Text generieren
Mit Tools wie ChatGPT können Sie schnell und effizient neue Texte jeder Art erstellen. Der Chatbot kann z.B. Blogbeiträge, Berichte, Produktbeschreibungen, E-Mails oder Social-Media-Posts schreiben. Aber natürlich auch Gedichte, Kurzgeschichten oder Witze.
Existierenden Text umschreiben
Generative KI kann auch genutzt werden, um bestehende Texte umzuschreiben und zu verbessern. So können Sie z.B. ältere Inhalte schnell und professionell aktualisieren oder vorhandene Marketingtexte an verschiedenste Zielgruppen und Sprachstile anpassen.
Texte zusammenfassen
ChatGPT liefert Ihnen schnell und effizient kurze, präzise Zusammenfassungen langer Texte und hebt die jeweils wichtigsten Punkten hervor. Eignet sich hervorragend für sehr ausführliche Verbesserungsvorschläge, umfangreiche Berichte, Gutachten und mehr.
Dokumentenanalyse
Große Mengen an Textdaten zu analysieren, ist aufwändig. Trias Eisenberg: „Die KI hilft Ihnen dabei, schnell die wichtigsten Fakten oder den gemeinsamen Nenner aus mehreren Dokumenten herauszufiltern. Bei mehreren Verbesserungsvorschlägen zu ähnlichen Themen können Sie z.B. im Nu den roten Faden identifizieren.“
Brainstorming
Generative KI unterstützt auch gerne beim kreativen Brainstorming, indem sie Ideen für Kampagnen, Umfragen oder Gewinnspiele liefert. Oder bei der Formulierung von Bescheiden, knackigen Slogans oder Headlines hilft. Bearbeiter können die KI z.B. nutzen, um bestehende Ideen zu verfeinern oder sich für besonders gute Ideen weitere Anwendungsmöglichkeiten vorschlagen zu lassen.
Trisociation
Trisociation ist eine erweiterte Form des Brainstormings. Jessica Trias Eisenberg erläutert die Methode: „Hier werden drei scheinbar unverbundene Elemente kombiniert, um innovative Ideen zu generieren, zum Beispiel für neue Produkt- oder Geschäftsideen.“
Basierend auf den Begriffen Baum, Musik und Haus könnte die KI beispielsweise auch eine Idee für eine Kampagne entwickeln, die diese Elemente verbindet. Abbildung 4 zeigt das Ergebnis: eine Ideenkampagne zum Thema “Harmonisches Wohnen“ , mit dem lauschigen Slogan “Wo Natur, Klang und Zuhause verschmelzen.“
Text-zu-Bild: Logos & Co.
DALL-E erstellt auf Basis Ihrer Texteingaben beeindruckende Bilder, was bei der Gestaltung von Marketingmaterialien gute Dienste leisten kann. In unserem Beispiel ging es um die Erstellung eines Logos für eine Ideenmanagementkonferenz im Steampunk-Stil (s. Abb. 5). Die HYPE-Expertin hatte dazu folgende Aufgabe bzw. diesen Prompt formuliert: „Erstelle mir bitte ein Logo für die IDM Konferenz 2024 im Steampunk Stil, das Bild sollte im 3:2 Format sein, alle Infos zu dem Event findest du hier https://idm-forum.cventevents.com/event/05c130db-8cc8-4830-96f9-1639a6ad9cf4/summary “
Abb.5: Logoentwurf mit DALL-E (Quelle: HYPE)
Text-zu-Bild: Neue Produkt-Designs
Generative KI kann auch zur Erstellung fantasiereicher neuer Produktdesigns eingesetzt werden. Jessica Trias Eisenberg: „Die KI Midjourney sollte ein Bild erstellen, das einen Elefanten und einen Schmetterling kombiniert. So entstand die Chimäre Phantafly. Eine weitere KI, Stable Diffusion, sollte dann anhand des Phantafly-Bildes verschiedene Produkte generieren, wie Spielzeug oder Dekorationsartikel.“
Bild-zu-Text: Webseiten aus Skizzen
Umgekehrt kann die KI auch Text aus Bildern erzeugen – und sogar Code oder HTML aus handgezeichneten Skizzen. Webdesigner und andere Technikfans können damit im Handumdrehen Prototypen für Webseiten bauen, indem sie z.B. einfach ihre Entwürfe fotografieren und in funktionsfähigen Code umwandeln lassen.
Text-zu-Text: Prototyping mal anders…
Last, but not least ist die KI auch im Prototyping einsetzbar. Beim IDM-Forum 2024 wurde gezeigt, wie die KI Stable Diffusion generische Entwürfe für von Krabben inspiriertes Spielzeug liefert, siehe Abbildung 6. Trias Eisenberg: „Anhand dieser Entwürfe wurden dann die funktionalen Fähigkeiten und der Einsatzzweck der einzelnen Prototypen analysiert. Das ermöglicht eine schnellere und kreativere Entwicklung neuer Produkte.“
Sie sehen, Ihrer Fantasie sind (fast) keinen Grenzen gesetzt! Doch wie lässt sich die schlaue KI so mit Aufgaben füttern, dass sie auch wirklich allerbeste Ergebnisse liefert?
Abb. 6: Kreatives Prototyping mit Krabben (Quelle: HRB)
Tipps & Tricks für Prompt Engineering
Hier kommt Prompt Engineering ins Spiel – der Prozess oder besser die Kunst, Anweisungen oder Prompts so zu formulieren, dass wir die für uns passendsten, hilfreichsten Antworten von der KI erhalten. Dabei gilt: Umso besser die Prompts, umso besser die Ergebnisse.
Hier einige Tipps und Tricks von HYPEs Produktmanagerin Jessica Trias Eisenberg:
- Schreiben Sie klare Anweisungen. Geben Sie der KI präzise Details, Beispiele oder eine Persona an und nennen Sie die einzelnen Schritte, die zur Erfüllung einer Aufgabe erforderlich sind.
- Referenztexte anzugeben, hilft der KI auch. Weisen Sie das Tool an, anhand eines Referenztextes oder mit Zitaten daraus zu antworten
- Achten Sie darauf, dass Sie komplexe Aufgaben in einfachere Teilaufgaben aufteilen. Lange Dokumente lassen sich so stückweise zusammenfassen, um rekursiv eine vollständige Zusammenfassung zu erstellen.
- Und: Geben Sie der KI Zeit zum “Nachdenken“. Fordern Sie sie auf, eigene Lösungen zu finden, bevor es zu einer übereilten Schlussfolgerung kommt, und fragen Sie nach, ob es bei früheren Durchgängen etwas übersehen hat.
Also, merken: Klare und spezifische Prompts führen zu besseren Ergebnissen!
Gefahren durch visuelle KI
Generative KI bietet viele Möglichkeiten, das ist klar. Besonders spannend – Sie haben Beispiele gesehen – ist die visuelle KI-Generierung, d.h. realistisch aussehende Bilder und Videos. Aber genau da liegt das Problem. Ein kurzer Überblick über einige Risiken.
Abb. 7: Wenn Obama mit Angela… dann sind es Deepfakes (Quelle: Stern)
KI-Systeme können Menschen auch täuschen – selbst wenn sie darauf trainiert wurden, hilfreich und ehrlich zu sein. Das ist das Ergebnis einer Studie von Forschern am MIT.
„Wenn KI die Fähigkeit zur Täuschung erlernt, kann sie von böswilligen Akteuren, die absichtlich Schaden anrichten wollen, effizienter eingesetzt werden.“ (Quelle: ZDF)
Deepfakes
Deepfakes sind realistisch wirkende, manipulierte Medieninhalte (Foto, Audio, Video etc.), die kaum von echten Aufnahmen zu unterscheiden sind. Jeder von uns kennt die gefälschten Videos von Politikern oder Prominenten in oft skandalösen, aber auch erheiternden Situationen, siehe Abbildung 7.
Robocalls
Die KI kann z.B. auch Wahlen beeinflussen, indem sie gefälschte Newsartikel, Hetzbeiträge in sozialen Medien und fingierte Videos verbreitet. Das ist bereits Realität: So rief ein gefakter US-Präsident Joe Biden in automatisierten Anrufen Anfang 2024 Demokraten dazu auf, nicht an den US-Vorwahlen teilzunehmen.
Urheberrechtsverletzungen
KI-generierte Bilder können Urheberrechte verletzen, wenn sie unberechtigterweise geschützte Werken imitieren. Rechtliche Rahmenbedingungen für Entwickler und Nutzer müssen Künstler schützen, wenn ihre Werke ohne Genehmigung verwendet werden.
Nicht umsonst werden weltweit klare Richtlinien gefordert, um Missbrauch durch Künstliche Intelligenz zu verhindern.
EU weltweit Vorreiter bei KI-Regulierung
Umso wichtiger ist der EU AI Act (AIA), der weltweit erste umfassende Rechtsrahmen zur Regulierung von KI. Das im Mai 2024 verabschiedete EU-Gesetz zielt darauf ab, Regeln für KI-Systeme festzulegen, Innovation zu fördern sowie Bürgerinnen und Bürger der EU zu schützen. Hier einige wichtige Punkte aus dem AIA:
- KI-Systeme werden in verschiedene Risikokategorien eingeteilt – von minimalem bis hin zu hohem Risiko.
- Bestimmte KI-Anwendungen, die ein inakzeptables Risiko darstellen – etwa ein staatlich betriebenes Social Scoring wie in China – sollen komplett verboten werden.
- Entwickler von KI-Systemen müssen klare, transparente und verständliche Informationen über die Funktionsweise und Risiken zur Verfügung stellen.
- Alle von einer KI generierten Inhalte sollten entsprechend gekennzeichnet werden.
Resümee
Sie ahnen es: Generative KI ist gekommen, um zu bleiben… HYPE-Expertin Jessica Trias Eisenberg formuliert es so:
„Generative KI ist unaufhaltsam auf dem Vormarsch. Sie ist zwar noch nicht zu 100 Prozent ausgereift, wird aber zunehmend unverzichtbar. Die Technologie hat das Potenzial, unseren Arbeitsalltag und die gesamte Gesellschaft grundlegend zu verändern. Gleichzeitig ist es wichtig, die damit verbundenen Herausforderungen und Risiken zu erkennen und verantwortungsbewusst mit dieser mächtigen Technologie umzugehen. Jeder sollte sich damit auseinandersetzen und ihre Möglichkeiten nutzen!“