ein weißer futuristischer Kopf der sich digital aufbaut

Mögliche Risiken der künstlichen Intelligenz ChatGPT

Was hinter der künstlichen Intelligenz ChatGPT steckt und welche möglichen Risiken dadurch entstehen können.

Hype um KI.

Künstliche Intelligenz und künstliche neuronale Netze umfassen einen breiten Bereich von Methoden und Technologien. Maschinelles Lernen ist das zentrale Teilgebiet der KI. Der riesige Hype begann aber Ende letzten Jahres, als das u. a. von Microsoft finanzierte US-Unternehmen OpenAI ChatGPT einer breiten Öffentlichkeit vorgestellt hat. Obwohl KI-Sprachmodelle nicht neu sind, wurde der Öffentlichkeit erst mit dem Start von ChatGPT klar, welches Potenzial diese Technik entfalten kann. Waren Sprachmodelle bisher eher kompliziert zu bedienen oder nur über eine Programmierschnittstelle, kommt ChatGPT mit einer bestechend einfachen Oberfläche daher: Man chattet einfach per Tastatur und Browser mit dem System.

Wie ChatGPT tickt

ChatGPT ist eine Version von GPT, einem großen Sprachmodell, das ebenfalls von OpenAI entwickelt wurde. Aktuelle Sprachmodelle basieren auf neuronalen Netzwerken, die mit sehr viel Text trainiert werden. Neuronale Netze in der Informatik sind von der Art und Weise inspiriert, wie Neuronen im Gehirn kommunizieren. „Stellen Sie sich vor, ein Kind lernt eine Sprache. Kinder tun das spielerisch, indem sie aus bekannten Wörtern Sätze im Telegrammstil formen. Die Eltern helfen bei der korrekten Anordnung von Wörtern in Sätzen“, erklärt Werner Neuwirth, BSc, Data Scientist in der KI-Abteilung des BRZ. „Solche Programme agieren genauso. Es füllt Lücken mit Wörtern, um Sätze zu formen und adaptiert laufend deren Anordnung.“

Finden heißt nicht Wissen

Trotz explosionsartigen Wachstums des Internets wurden Suchmaschinen immer schneller und genauer. Abgesehen von der effizienteren Suche blieb aber das zugrunde liegende Suchverfahren seit zwei Jahrzehnten unverändert: Web-Seiten werden von Programmen, sogenannten Crawlern, analysiert und indexiert. Fundstellen werden gesammelt und gereiht. Suchmaschinen liefern so eine Liste der Dokumente, die der Anfrage entsprechen, aber nicht die eigentliche Information.  

Revolutioniert ChatGPT die Suche?

Werden nun Sprachmodelle wie ChatGPT die Google-Suche wie wir sie kennen ablösen? Die Forschung, die den menschlichen Experten eines Fachgebietes nachahmen will, steht noch immer vor großen Herausforderungen. Dennoch glaubt Microsoft in Anspielung an den ersten Internetbrowser an eine Revolution ähnlich der Einführung des World Wide Web. Technologie von OpenAI gemeinsam mit der Suchmaschine Bing und dem Webbrowser Edge sollen zum „Copiloten im Netz“ werden. Neben Bing soll ChatGPT vor allem auch in Office 365-Produkten und MS Teams zum Einsatz kommen. Ähnlich wie bei Bing werden die Antworten des Bots in einem eigenen Fenster in die Ergebnis-Seite der Suchmaschine integriert sein.

Wo Licht ist, ist auch Schatten

Der großflächige Einsatz von KI-Systemen und das damit verbundene technische Innovations­potenzial wird erwartungsgemäß Auswirkungen von breiter wirtschaftlicher, aber auch gesellschaftlicher Relevanz haben. Somit besteht die Herausforderung, KI-spezifische Risiken systematisch zu erfassen, messbar zu machen und unter Berücksichtigung von verschiedenen Dimensionen der Vertrauenswürdigkeit hinreichend zu reduzieren. Aber welche Risiken kennen wir?

Halluzination loves company

KI-Halluzination ist der Fall, wenn ein KI-System eine Antwort gibt, die nicht mit dem übereinstimmt, was Menschen als wahr kennen. Das System nimmt also etwas wahr, das in der realen Welt gar nicht existiert. Die Gefahr: Man kann als Rezi­pient abseits etwaig vorhandener Expertise kaum noch beurteilen, wie korrekt insbesondere kompliziertere Erklärungen tatsächlich sind. Die gleiche Gefahr besteht auch bei Social Media Plattformen wie Instagram oder TikTok. Der Wahrheitsgehalt von Beiträgen ist nur durch Vorwissen oder durch aufwendige Methoden ermittelbar.

Problem: Künstlicher Rassismus

Lerndaten veranlassen das Modell, schädliche oder anstößige Inhalte zu generieren. Jedes Modell wurde zum Teil auf Daten trainiert, die als anstößig wahrgenommen werden können. Dies kann dazu führen, dass das Modell ebensolche Inhalte generiert oder versteht, wenn es mit einem User interagiert. Wenn ein Sprachmodell beispielsweise mit Daten trainiert wird, die rassistische oder sexistische Sprache enthalten, kann es auch solche Inhalte generieren oder verstehen.

Urheberrecht als Problem

Es gibt kein Problem mit der persönlichen Nutzung von ChatGPT als Gesprächsassistent. Aber wenn es darum geht, KI-generierte Prosa in Inhalten anzuwenden, die für eine Verbreitung bestimmt sind – wie Marketing-Materialien, einem Whitepaper oder sogar Zeitungsartikeln –, rücken rechtliche Aspekte in den Fokus. Für den Fall, dass das Modell an einem Bestand erstellter Werke aus dem geistigen Eigentum anderer trainiert wurde, ist die rechtliche Situation in Bezug auf die Wiederverwendung dieser Inhalte noch zu klären. Für die Nutzung von urheberrechtlich geschützten Materialien für die Forschung macht das Urheberrechtsgesetz Ausnahmen. Mit welchen Material KI aber angelernt werden darf, beschäftigt die Rechtswissenschaft sicher noch eine Weile.

Technologie-Souveränität

Eine übergeordnete Fragestellung ist von entscheidender Bedeutung. Wer besitzt die Technologie, die Daten und die Ressourcen, um große Modelle zu erstellen und die Entwicklung und die revolutionären Durchbrüche zu steuern? Seit 2017 stammen rund 70 % der Modelle aus den USA, 15 % aus China. Bleibt dies in der Hand weniger großer Konzerne, werden diese die Nutzung, die Regulierung und auch die Behandlung von ethischen Fragestellungen bestimmen, so wie dies bereits im Internet, bei Suchmaschinen und sozialen Netzwerken der Fall ist?

Maschinelles Lernen im BRZ

Aufgrund der Komplexität der zugrunde liegenden Daten und der zu lösenden Fragestellungen weicht der Entwicklungsprozess von KI-Applikationen oft stark von klassischer Software-Entwicklung ab. Ausgehend von einem Anwendungsfall durchläuft die Entwicklung eines Machine Learning-Modells typischerweise iterativ mehrere Stufen: Datenexploration, Datenaufbereitung, Modellbildung, Evaluation des Modells, Deployment und Monitoring. Ein neuralgischer Punkt in der Entwicklung ist die Modellbildung, während der Data Scientists mit verschiedenen Algorithmen experimentieren. Am Ende dieser Experimentierphase soll ein funktionierender Prototyp eines Modells entstehen, der die anfangs gestellte Aufgabenstellung löst. Um aus so einem Prototypen eine eigene Applikation, die vielleicht sogar in Echtzeit Ergebnisse liefert, zu bauen, sind dann noch weitere Schritte, wie sie auch in der Software-Entwicklung üblich sind, notwendig. Neben der Erstellung des Machine Learning Codes werden auch eine Reihe an komplexen Umfeld-Systemen benötigt, um Modelle produktiv betreiben zu können. ­Typische BRZ-Anwendungsfelder sind:

  •  Fake-Check von Dokumenten
  •  Entscheidungsunterstützung
  •  Echtzeitanalyse
  •  Intelligente Automatisierung
  •  Objekterkennung
  •  Betrugserkennung
  •  Intelligente Suche
  •  Zielgenauigkeit von Fördermaßnahmen
  •  Prüfen von Dokumenten

Der Artikel ist in read_it Ausgabe 01/23 erschienen.

Trustworthy AI Gütesiegel auf einem Bild von einem Jungen Herren der ein iPad in der Hand hält

Vertrauenswürdige Künstliche Intelligenz

Künstliche Intelligenz (KI) wird viele Anwendungsfelder der digitalen Verwaltung transformieren. Der Computer ersetzt dabei keine Menschen, er unterstützt und beschleunigt lediglich komplexe Prozesse. Mit dem Prüfkatalog für "Trustworthy AI" unterstützen wir den Public Sector bei der Entwicklung von vertrauenswürdigen KI-Systemen.

Beitrag lesen Vertrauenswürdige Künstliche Intelligenz

Roboter als Verwaltungsmitarbeiter

Zukunftstechnologien

Texte analysieren, Bilder erkennen, Zahlen auswerten und Muster erkennen: Lernende Algorithmen und Künstliche Intelligenz werden bereits in vielen Gebieten eingesetzt. Welche Technologien können staatliche Einrichtungen nutzen, um Bürgerinnen und Bürgern noch bessere, sichere und datenschutzkonforme Services zu bieten?

Beitrag lesen Zukunftstechnologien