Generative KI in der digitalen Beschilderung: Was ist das, wie verwendet man es und was kommt als nächstes?
Sie haben schon von ChatGPT, DALL-E, Stable Diffusion und mehr gelesen. Sie alle sind Beispiele für den neuesten technischen Trend: Generative KI. In diesem Blog-Beitrag werden wir uns mit generativer KI befassen, wie man sie in der digitalen Beschilderung einsetzen kann und was die Zukunft bringt. Wenn Sie also mit Ihrer Digital Signage-Strategie der Zeit voraus sein wollen, lesen Sie weiter!
Einführung
Die Welt der generativen KI ist in Aufruhr. Leistungsstarke Algorithmen schreiben Code, entwerfen Geschichten und erstellen Bilder, die einen Turing-Test herausfordern würden. Im Verborgenen wühlen sich hochkomplexe maschinelle Lernprozesse durch Milliarden von Menschen geschaffener Wörter, Grafiken und Codes und werden von Minute zu Minute intelligenter und kreativer.
Und da diese Algorithmen über eine Web-API vollständig zugänglich sind, lassen sie sich leicht in Ihre Intuiface-Erfahrungen integrieren.
Lassen Sie uns einige Zeit damit verbringen, die Welt der generativen KI zu verstehen, ihren Wert für Digital Signage und wie Sie sie in Intuiface nutzen können
Was ist generative KI?
Generative künstliche Intelligenz (KI) ist ein Teilbereich des maschinellen Lernens, der es Computern ermöglicht, neue Inhalte - wie Text, Audio, Video, Bilder oder Code - zu erstellen, indem sie das Wissen über zuvor erstellte Inhalte nutzen. Die Ausgabe sieht authentisch aus und ist völlig original.
Die Algorithmen, die diese einzigartigen Inhalte erstellen, basieren auf Modellen, die Erkenntnisse über ein bestimmtes Thema widerspiegeln. Diese Lektionen werden nicht programmiert; stattdessen lernen die Algorithmen über einen Mechanismus, der als "Deep Learning" bekannt ist, selbst und verfeinern ihre Modelle, wenn mehr und mehr Daten zu einem Thema eintreffen. Zu den vielen faszinierenden Aspekten dieser Technologie gehört die Flexibilität der Lernmaschine, die sich an alle Aspekte des menschlichen Ausdrucks anpassen kann. Sowohl die Ästhetik eines Bildes als auch der Formalismus eines JavaScript-Codes sind realisierbar!
Was sind die beliebtesten Optionen der generativen KI?
Das bekannteste Beispiel für generative KI ist GPT - derzeit vertreten durch GPT-3.5, die neueste Version des Sprachvorhersagemodells der dritten Generation der GPT-Serie. Es wurde von OpenAI entwickelt und ist ein Algorithmus, der angepasst werden kann, um Bilder und alles mit einer Sprachstruktur zu erstellen: Er beantwortet Fragen, schreibt Aufsätze, entwickelt Zusammenfassungen längerer Texte, schreibt Softwarecode und übersetzt sogar Sprachen. OpenAI versorgte das GPT-Modell mit rund 570 GB Textinformationen aus dem Internet, um diese natürliche Sprachfähigkeit zu erreichen. Möchten Sie es ausprobieren? Gehen Sie zu ChatGPT, erstellen Sie ein kostenloses Konto und beginnen Sie eine Unterhaltung.
Für die Bilderzeugung sind die bekanntesten Optionen DALL-E (ebenfalls auf GPT basierend), Midjourney und StableDiffusion. Wie ChatGPT nehmen diese Dienste natürliche Sprache als Eingabe, aber ihre Ausgabe sind Bilder. Die Ausgabe kann in jedem gewünschten Stil erfolgen - von kunstinspirierten Themen wie Kubismus oder Impressionismus bis hin zu völlig realistischen Bildern, die wie Fotos aussehen, aber von einem Algorithmus erstellt wurden.
Wie generative KI funktioniert
Ha! Wenn Sie auf der Suche nach einer Abhandlung über die Wissenschaft des Deep Learning sind, ist dies nicht der richtige Ort. Worüber wir jedoch sprechen können, ist, wie diese Modelle den Nutzern präsentiert werden.
Sowohl Text- als auch Bildanfragen werden als "Aufforderung" übermittelt. Prompts sind Sätze in natürlicher Sprache, die das gewünschte Ergebnis ausdrücken. Die Erstellung von Aufforderungen ist eine sich entwickelnde Kunst, denn je spezifischer und anschaulicher eine Aufforderung ist, desto wahrscheinlicher ist es, dass Sie genau das bekommen, was Sie wollen.
Dieser Artikel ist nur ein Beispiel dafür, dass Souffleurhandwerk sowohl eine Wissenschaft als auch eine Kunst ist.
Jetzt können Sie sich den Wunsch erfüllen, "Yoda auf dem Eisernen Thron aus "Game of Thrones" auf dem Schlagmal im Fenway Park sitzen zu sehen." (Wir haben Stable Diffusion verwendet, um das Bild unten mit genau diesem Text zu erstellen).
Wie Sie weiter unten erfahren werden, sind die meisten generativen KI-Dienste über eine Reihe von APIs zugänglich. Über diese APIs können Unternehmensdienste - und, in unserem egoistischen Interesse, Digital Signage - die Technologie einbinden.
Wie der B2B-Markt generative KI einsetzt
Es gibt inzwischen eine lange (und wachsende) Liste von Unternehmen, die generative KI nutzen.
In der folgenden Grafik sind in der linken Spalte die gängigsten generativen Modelle auf dem Markt aufgeführt. Auf der rechten Seite sind verschiedene Lösungsbereiche und Unternehmen aufgeführt, die generative Modelle verwenden, um Dienstleistungen für diese Bereiche anzubieten.
QUELLE: https://www.battery.com/wp-content/uploads/2022/10/Battery-Ventures-OpenCloud-Report__2022.pdf
Wie herkömmliche digitale Beschilderung die Vorteile der generativen KI nutzen kann
Generative KI kann eine hervorragende Ergänzungstechnologie sein, um einzigartige und ansprechende Digital Signage-Erlebnisse zu schaffen. Mit ihr kann Digital Signage dynamisch Echtzeit-Inhalte erstellen und anzeigen, die perfekt in den Kontext passen. Diese Inhalte können durch das Nutzerverhalten oder externe Datenquellen beeinflusst werden, von Wettervorhersagen bis hin zu Echtzeitpreisen.
Beispiele hierfür sind:
- Erstellen Sie kontextabhängige Bilder, die die aktuellen Informationen, die Umgebung oder das Publikum widerspiegeln.
- Erstellen Sie Zusammenfassungen und/oder Übersetzungen von unvorhersehbaren Texten wie Nachrichtenberichten oder Sportereignissen.
- Schreiben Sie Nachrichten je nach Zielgruppe oder Dringlichkeit in verschiedenen Tönen und Längen um.
Die größte Hürde ist die Leistung, insbesondere bei der Bilderzeugung, da die heutigen Lösungen der generativen KI (noch) nicht sofort verfügbar sind. Je nach der Komplexität der Anfrage und der Komplexität des gewünschten Ergebnisses kann die Bilderzeugung sogar einige Sekunden dauern. Daher muss die Beschilderung bei der Inhaltsanforderung proaktiv sein, um sicherzustellen, dass es keine visuelle Latenz gibt.
Wie interaktive digitale Beschilderung den Wert von Generative AI erhöht
Durch die Einführung interaktiver digitaler Beschilderung, die Einblicke in die Präferenzen der Nutzer bietet, können Sie mit generativer KI noch weiter gehen. Jetzt sind Sie nicht mehr nur auf einen externen Kontext beschränkt. Sie kennen Ihr Publikum genau und können entsprechend kommunizieren.
Unter "interaktiv" verstehen wir jede Art von Mensch-Maschine-Konversation, sowohl aktiv als auch passiv. Zu den aktiven Optionen gehören Berührung, Gesten und Sprache, während zu den passiven Optionen Sensoren und Computer Vision gehören. Für alle Modalitäten gilt, dass Digital Signage in Kombination mit dem Kontext und den Bildschirminhalten die Interessen des Nutzers klar erkennen kann.
Beispiele hierfür sind:
- Nutzung von Nutzerdaten zur Erstellung personalisierter "Avatare" für die Dauer der Sitzung.
- Fügen Sie der Interaktion eine schrullige Persönlichkeit hinzu, indem Sie Witze und witzige Nebenbemerkungen für den Benutzer im Kontext einer ansonsten langweiligen digitalen Interaktion kreieren.
- Umwandlung einer Überprüfung von Warenkorb-Bestellungen in Konversationstext, um die Nutzung von Kiosken zu vermenschlichen.
- Verwenden Sie anonyme Gesichtserkennungstechnologie, um Alter/Geschlecht zu identifizieren und diese Informationen zur Anpassung der Kommunikation zu nutzen.
- Übersetzen Sie ständig wechselnde Datenquellen, wie z. B. einen Produktkatalog oder touristische Informationen.
Für jedes natürlichsprachliche Szenario kann der Entwickler - oder der Benutzer - entscheiden, ob der Text dynamisch in Sprache umgewandelt werden soll, entweder mit Hilfe von betriebssystemspezifischen Diensten oder mit Hilfe von generativen KI-Sprachdiensten wie VALL-E.
In allen Fällen ist das Kreativteam nicht mehr gezwungen, das breite Spektrum an potenziellen Nutzern/Szenarien/Anforderungen zu antizipieren. Sie können sich einfach auf eine generative KI-Ressource verlassen, die die schwere Arbeit in Echtzeit erledigt.
Einsatz generativer KI in Intuiface
Da viele generative KI-Dienste über Web-APIs zugänglich sind, kann eine textbasierte Abfrage (die "Eingabeaufforderung") programmatisch übermittelt werden, wobei die Text-/Bildantwort in Echtzeit zur Anzeige abgerufen wird. Dank Intuiface API Explorer können Intuiface-Anwender auf einfache Weise Integrationen mit diesen Web-APIs erstellen, auch wenn sie nur wenig oder gar kein Verständnis dafür haben, wie diese APIs eigentlich funktionieren.
Die meisten Web-APIs für generative KI erlauben eine begrenzte, kostenlose Nutzung und setzen ein Token- oder bildbasiertes Bezahlsystem voraus, um in großem Umfang eingesetzt zu werden. Hier sind einige API-Beispiele, die alle von Intuiface API Explorer unterstützt werden:
- OpenAI für die Erstellung, Vervollständigung und Übersetzung von Texten
- DALL-E (OpenAI-basiert) zur Bilderzeugung
Wie bereits erwähnt, kann ein gutes DALL-E-Beispiel in unserer User Community gefunden werden. - Stabile Diffusion für die Bilderzeugung
Hier wird erklärt, wie Sie die stabile Diffusion in Intuiface verwenden können. - Die offizielle ChatGPT API ist noch nicht verfügbar, wird aber vermutlich bald veröffentlicht...
So hat Paolo Tosolini vom Intuiface-Partner Tosolini Productions in unserer User Community ein großartiges Beispiel gepostet, wie er mit API Explorer eine Echtzeit-Integration mit DALL-E erstellt hat.
Während das oben dargestellte Beispiel eine Intuiface-basierte Benutzeroberfläche verwendet, die auf menschliche Eingaben angewiesen ist, um einen Prompt (und damit ein Bild) zu generieren, kann Intuiface auch Informationen aus der Umgebung eines Erlebnisses extrahieren und diese zur Erstellung eines Prompts verwenden. Die Eingabeaufforderung könnte zum Beispiel Wörter enthalten, die sich auf die aktuelle Temperatur, die Anzahl oder Anwesenheit von Passanten, die Tageszeit usw. beziehen. - die alle gesammelt und für einen generativen KI-Algorithmus in Echtzeit sinnvoll kombiniert werden.
Wie bereits erwähnt, muss der Erlebnisdesigner bei diesem Ansatz nicht mehr alle möglichen Szenarien identifizieren und proaktiv entsprechende Antworten erstellen. Bilder und Texte können automatisch von einem generativen KI-Dienst auf der Grundlage endloser Umgebungskontexte erstellt und nahezu in Echtzeit bereitgestellt werden. Eine solche automatische Inhaltsgenerierung ist eine Revolution für Digital Signage!
Generative KI und Digital Signage - ein Blick in die Zukunft
Die generative KI entwickelt sich ständig weiter und wird immer zugänglicher. Sie wird sich in Digital Signage-Netzwerken immer mehr durchsetzen, da sie immer billiger, schneller und einfacher zu nutzen ist. Dies wird es Unternehmen ermöglichen, einzigartige Erlebnisse zu schaffen, die auf den einzelnen Betrachter oder die Umgebung zugeschnitten sind.
Man kann sich einen vollautomatischen Helpdesk, eine Empfehlungsmaschine (für Kleidung, Mahlzeiten, Reiseziele) oder einen Reiseführer vorstellen. Die Möglichkeiten der generativen KI für Digital Signage - und unser Leben! - sind praktisch endlos. Mit der weiteren Entwicklung dieser Technologie werden die potenziellen Anwendungen exponentiell zunehmen.
Sie können noch heute mit der Erkundung beginnen. Nutzen Sie Intuiface, um Ihre Zehen ins Wasser zu halten, mit der Technologie zu experimentieren und sie zur Verbesserung Ihrer interaktiven Erfahrungen einzusetzen.