Wir werden nun betrachten, wie KI-Systeme aus Daten Regeln erlernen und sich durch Beispiele kontinuierlich verbessern.
Im Gegensatz zu klassischen Computerprogrammen, bei denen Regeln explizit vom Entwickler vorgegeben werden, lernt ein KI-System aus vorhandenen Daten. Ein traditioneller Spamfilter für E-Mails könnte beispielsweise eine Regel enthalten: „Falls die E-Mail das Wort Viagra enthält, markiere sie als Spam.“ Hier wird die Entscheidung durch feste Vorgaben getroffen. Ein KI-gestützter Spamfilter hingegen nutzt Machine Learning. Er erhält eine Sammlung bereits klassifizierter E-Mails – also Beispiele für Spam und Nicht-Spam. Das Modell erkennt Muster in den Daten, entwickelt Regeln auf Basis dieser Muster und verbessert seine Entscheidungen mit der Zeit.
Generative KI, insbesondere großer Sprachmodelle (wie ChatGPT) erzeugen neue Inhalte basierend auf sogenannten Prompts, also Benutzereingaben.
Ein Benutzer gibt eine Frage oder eine Aufforderung ein, und das Modell analysiert den Input, um eine passende Antwort zu generieren. Dies kann Texte, Bilder, Musik, Videos oder Programmcode umfassen.
Bekannte Beispiele für generative KI sind:
- ChatGPT für Textgenerierung
- Stable Diffusion für Bildgenerierung
- Suno für Musikkomposition
- Eleven Labs für Sprachsynthese
Sprachmodelle verwenden Wortvektoren (Embeddings), um Bedeutungen zu erfassen. Wörter mit ähnlicher Bedeutung liegen in dieser Darstellung nah beieinander. So kann das Modell Zusammenhänge zwischen Wörtern besser verstehen.
Ein entscheidender Mechanismus ist das Attention-Prinzip („Aufmerksamkeit“). Dabei analysiert das Modell, welche Wörter in einem Satz besonders wichtig sind. In dem Satz „Die Bank hat ihre Zinsen erhöht“ ist das Wort „Zinsen“ entscheidend, um die Bedeutung von „Bank“ richtig zu verstehen. Ohne diesen Kontext könnte „Bank“ entweder eine Sitzgelegenheit oder ein Finanzinstitut bedeuten.
Generative Modelle werden durch umfangreiche Trainingsprozesse optimiert. Dazu gehören:
- Masked Language Modeling: Einzelne Wörter im Text werden entfernt, das Modell muss sie korrekt vorhersagen.
- Next Sentence Prediction: Das Modell sagt vorher, welcher Satz als nächstes folgt.
- Next Token Prediction: Das Modell generiert Wort für Wort eine Antwort.
Unternehmen setzen KI-Modelle bereits erfolgreich ein, unter anderem für Betrugserkennung in der Finanzbranche (Analyse von Transaktionen in Echtzeit, um verdächtige Muster zu erkennen), Qualitätskontrolle in der Industrie (Automatische Fehleridentifikation in der Produktion), Absatzprognosen im Handel (Vorhersage künftiger Nachfrage) oder personalisierte Werbung: (Analyse des Kundenverhaltens und Optimierung von Marketingkampagnen).
Ein wichtiger Trend sind Foundation Models – vortrainierte Modelle, die vielseitig einsetzbar sind. Dazu gehören Spracherkennung, Textzusammenfassung oder Bilderkennung. Unternehmen können diese Modelle entweder direkt nutzen oder sie mit eigenen Daten anpassen.
Beim Einsatz von KI stellt sich daher die Frage, ob bestehende Modelle genutzt oder eigene trainiert werden sollen. Beide haben Vor- und Nachteile und die Wahl hängt von den Anforderungen und verfügbaren Ressourcen ab. Bestehende Modelle sind schnell einsetzbar, bieten aber wenig Möglichkeiten für individuelle Anpassungen. Dagegen bieten eigene Modelle mehr Kontrolle, sind aber deutlich aufwendiger und sehr ressourcenintensiv.