2023-05-27

Warum Chatbot nicht gleich Chatbot ist

Oder weshalb es mit den Bau- und Zonenreglementen abgeht, Baby!

Der KI-Kosmos entwickelt sich rasant. Besonders gut ist das zurzeit daran erkennbar, dass im letzten Jahr trainierte Modelle bzw. künstliche Intelligenzen bereits überholt sind oder dass Chatbots, die noch vor 2 Jahren entwickelt worden sind, heute aus technischer Sicht bereits veraltet sind. Denn es hat ein Quantensprung stattgefunden, dessen Nutzen der breiten Öffentlichkeit etwas entgangen ist. Dies erkennen wir daran, mit welchen Argumenten in den Medien von Exponenten des öffentlichen Lebens bis hin zu Kolumnistinnen über KI räsoniert wird. Dies ist allerdings verzeihlich, denn heute auf dem Markt befindliche Chatbots überzeugen oft tatsächlich nicht. Chatbot ist allerdings nicht gleich Chatbot.

Gerade am Beispiel Chatbot kann die rasante technische Entwicklung sehr gut illustriert werden.

Am Anfang war die klassische IT. Man kann schon lange Bots erstellen, indem die Maschine mit eindeutigen Regeln zur Bearbeitung von Inputs programmiert wird. Wenn der Maschine dann spezifische Fragen in einem festgelegten Format gestellt werden, wendet sie diese vordefinierten Regeln an und liefert eine vorab festgelegte Antwort. Wenn jedoch die Fragen nicht genau im vorgegebenen Format eingegeben werden oder wenn für die gestellte Frage keine vorprogrammierten Informationen vorhanden sind, versagt der Bot.

Dann kam das machine learning. Beim machine learning werden kleine neuronale Netzte bzw. Sprachmodelle trainiert. Das Training verläuft in der Regel so, dass die Maschine mit sehr vielen Beispielen gefüttert wird und selber Regeln zur spezifischen Problemlösung entdeckt und anwendet. Dies ist mit sehr viel Aufwand verbunden und die Bots können nur Aufgaben lösen, für die sie spezifisch trainiert worden sind. Im Gegensatz zu den Bots, die mit klassischer IT programmiert worden sind, sind sie jedoch nicht mehr auf exakt vorgegebenen Wortlaut bei der Fragestellung angewiesen und das Programmieren von jeglichen erdenklichen Antwortmöglichkeiten wurde hinfällig. Für viele Anwendungsfälle ist auch heute noch das Training von Modellen die beste Lösung - aber längst nicht für alle.

Heute werden fast wöchentlich neue generische vortrainierte Modelle geboren. 2018 wurden die ersten sogenannten large language Models vorgestellt. Sie bilden die Gundlage für die neuen generativen (engl: generative) vortrainierten (engl: pretrained) Modelle. Die sind nicht nur niederschwellig für alle und jeden zugänglich, sie läuteten auch eine neue Ära der Informationsverarbeitung ein. Das prominenteste Beispiel eines Bots dieser neusten Generation ist ChatGPT - wie es der Name sagt ein generischer vortrainierter Chatbot. Es werden fast wöchentliche neue vortrainierte Modelle vorgestellt – alle mit interessanten spezifischen Eigenschaften. Zu finden sind sie z.B. auf Hugging Face. Und das ist der oben erwähnte Quantensprung: wer KI nutzen möchte, muss nicht mehr für jeden Anwendungsfall selber Modelle trainieren. Er kann für viele Anwendungen auf vortrainierte Modelle zurückgreifen und so KI niederschwellig und effizient nutzen. Ein Beispiel für eine solche Nutzung stellen wir in unserem Demobeispiel Semantische Suche in den Luzerner Bau- und Zonenreglementen vor.

So. Diesen Text haben wir ganz ohne KI geschrieben. Vielleicht ein Fehler? Hätten wir die ChatGPT-Version nehmen sollen? Folgender Text ist mit dem prompt «schreibe den obigen Text in lustig» entstanden:

Chatbots im Wandel der Zeit: Von Retro bis Hightech

Der verdammte KI-Kosmos entwickelt sich so schnell weiter, dass die Modelle von gestern schon so out sind wie ein Faxgerät im Jahr 2023. Ich meine, Leute, vor gerade mal zwei Jahren waren die Chatbots der absolute Shit, aber jetzt sind sie technisch gesehen so veraltet wie ein Game Boy Color. Da hat doch echt ein Mega-Sprung stattgefunden, von dem die meisten von euch vermutlich noch gar nichts mitbekommen haben. Und das merkt man daran, wie die Promis und Kolumnistinnen in den Medien über KI labern. Apropos, kennt ihr diese Chatbots, die so gar nichts draufhaben? Ich sag nur: Epic Fail!

Lasst mich euch am Beispiel Chatbot zeigen, wie krass sich die Technik entwickelt hat. Am Anfang gab's die gute alte IT, wo man einen Bot gebastelt hat, indem man ihm klare Regeln zur Verarbeitung von Inputs eingetrichtert hat. Wenn man dann der Maschine eine spezifische Frage im genau vorgegebenen Wortlaut gestellt hat, hat sie diese Regeln angewendet und 'ne vordefinierte Antwort ausgespuckt. Aber wehe, die Fragen waren nicht nach dem Regelbuch gestellt oder es gab keine vorprogrammierten Infos dazu - der Bot war einfach überfordert, Alter.

Dann kam die erste Phase der KI, wo es plötzlich Methoden und Ressourcen gab, um spezielle Modelle zu allen möglichen Themen zu trainieren. Das lief so ab, dass man der Maschine eine riesige Ladung Beispiele reingeschoben hat und sie dann selbst Regeln zur Problemlösung entdeckt und angewendet hat. Das war echt 'ne Menge Arbeit, und die Bots konnten nur Aufgaben erledigen, für die sie speziell trainiert worden waren. Im Gegensatz zu den ollen IT-Bots waren diese aber nicht mehr so krass auf den exakten Wortlaut der Fragen angewiesen, und das ewige Programmieren von tausend verschiedenen Antwortmöglichkeiten war Geschichte. Danke, KI!

Und jetzt werden fast jede Woche neue supercoole vortrainierte Modelle geboren. Das sind so generische Dinger, die nicht nur für jedermann easy peasy zugänglich sind, sondern auch eine neue Ära in der Informationsverarbeitung einläuten. Das absolute Highlight unter den Bots dieser neuen Generation ist ChatGPT. Der Name sagt ja schon alles - ein generischer vortrainierter Chatbot. Und fast jede Woche werden neue vortrainierte Modelle vorgestellt, die alle so interessante spezifische Eigenschaften haben. Ihr könnt die Dinger zum Beispiel auf Hugging Face finden (ja, echt!). Das ist der absolute Gamechanger, Leute: Wenn ihr KI nutzen wollt, müsst ihr nicht mehr für jede kleine Anwendung selbst Modelle trainieren. Ihr könnt auf diese vortrainierten Teile zurückgreifen und KI viel einfacher und effizienter nutzen. Ist das nicht der Hammer? Wir zeigen euch das in unserem mega Demobeispiel "Semantische Suche in den Luzerner Bau- und Zonenreglementen". Oh ja, da geht's ab, Baby!


Lust auf mehr Blogs?

Wie haben wir poemAI.ch gebaut? Mit KI!

Markus Emmenegger verrät, wie wir künstliche Intelligenz bei der Erstellung der Website von poemAI.ch eingesetzt haben. In diesem Blog gibt es anschauliche Tipps, wie man KI im Arbeitsalltag einsetzen kann.

Mehr lesen
Datenschutzerklärung
I. Allgemeine Informationen

PoemAI stellt unter der Webadresse https://poemai.ch die Webseite und den Blog von poemAI bereit. Die Website dient insbesondere der Information über Produkte und Dienstleistungen von poemAI. Außerdem haben interessierte Personen die Möglichkeit, mit poemAI in Kontakt zu treten.

In dieser Datenschutzerklärung erläutern wir, wie wir personenbezogenen Daten erheben und verarbeiten. Personenbezogen sind dabei alle Daten, die auf eine natürliche Person beziehbar sind. Bei all unseren Datenverarbeitungsprozessen halten wir uns an alle gesetzlichen Vorgaben, insbesondere an jene des Datenschutzgesetzes.

II. Informationen über die Verantwortlichen

PoemAI ist für die Bearbeitung Ihrer personenbezogenen Daten verantwortlich. Für generelle Anliegen sowie Anliegen des Datenschutzes können Sie sich an einen oder beide Co-Founder wenden:

poemAI GmbH
Nathalie Portmann und/oder Markus Emmenegger
nathalie.portmann@poemai.ch und/oder markus.emmenegger@poemai.ch
Rämsiweg 8
6048 Horw
Tel.: 076 559 60 48

III. Datenverarbeitung zu betrieblichen Zwecken

PoemAI verwendet vereinzelte Personendaten (Namen, Adressen, Emailadressen, Telefonnummern) zu folgenden Zwecken:

  • Zum sicheren und stabilen Betrieb der vorliegenden Website
  • Zur Bewirtschaftung unserer Stamm- und Kundendaten im CRM
  • Zur Mitteilung von Neuigkeiten einschließlich Werbemassnahmen, die Sie interessieren könnten
  • Für Marketing-Zwecke
  • Für die Vertragserfüllung.

Diese Daten fallen beim Ausfüllen unseres Kontaktformulars oder einer andersweitigen Kontaktaufnahme an. Oder sie stammen aus öffentlich einsehbaren Websiten und Verzeichnissen.

Jegliche Verwendung von Cookies - oder anderer Tracking-Tools - durch diese Webseite oder Anbieter von Drittdiensten, die durch diese Webseite genutzt werden, dient dem Zweck, den von Ihnen gewünschten Dienst zu erbringen. Wir messen mit Google Analytics einzig die Besucherströme auf unserer Website. Wir können und wollen keine Besucher/innen unserer Website identifizieren.

IV. Stand der Datenschutzerklärung

Die Datenschutzerklärung ist aktuell gültig und hat den Stand 28.9.2023.