• Home
  • Aktuelles
    • Summer School 2025
    • Rückblick
    • Publikationen
  • Zentren
  • Wissen
  • Forum
  • Kontakt
  • Suche
  • Menü Menü

Übersicht Roboter im Alltag

  • Was ist die RimA-Wissensplattform?
  • Was sind eigentlich Service- und Assistenzroboter?
  • Serviceroboter auf dem Markt: Haushaltsroboter
  • Serviceroboter auf dem Markt: Reinigung im öffentlichen Raum
  • Serviceroboter auf dem Markt: Einzelhandel, Hotel- und Gastgewerbe
  • Serviceroboter auf dem Markt: Pflegeroboter
  • Serviceroboter auf dem Markt: Soziale Interaktion und Bildung
  • Serviceroboter auf dem Markt: Multi-Purpose-Roboter

Toolbox zur Entwicklung von Geschäftsmodellen

  • Einführung und Anwendung der Toolbox
  • Methode: Value Proposition Canvas
  • Methode: Lean Start-up und MVP
  • Methode: 55+ Geschäftsmodell-Muster
  • Methode: Heldenreise
  • Methode: Customer Journey
  • Methode: Target Costing
  • Methode: Business Model Canvas
  • Weitere Methoden
  • Beispiel Use Cases
  • Zwischen Sicherheit und okonomischer Tragfähigkeit
  • Best Practices und Illustrationsbeispiele 

Regulatorische Rahmenbedingungen für Serviceroboter im öffentlichen Raum

  • Geltende Normen, Vorschriften und Gesetze für Serviceroboter im öffentlichen Raum
  • Identifikation der größten Herausforderungen
  • Entwicklung sicherer Reinigungsroboter
  • Praxishilfen für sichere Maschinen

Open Source Software (OSS)

  • Warum Open Source?
  • Open-Source-Software Lizenztypen
  • OSS für Interaktion
  • OSS Robotik-Framework ROS / ROS 2
  • Large Language Modelle (LLMs)

CE-Konformität

  • Allgemeines zur CE-Konformität
  • Grundlagen der CE-Konformität
  • Acht Schritte zur CE-Konformität
  • Schritt 1: Spezifikation erstellen
  • Schritt 2: EU-Richtlinien und Vorschriften ermitteln
  • Schritt 3: Technische Regeln ermitteln
  • Schritt 4: Festlegung des Konformitätsbewertungsverfahrens
  • Schritt 5: Produktkonformität mit den Richtlinien und Normen prüfen und sicherstellen
  • Schritt 6: Technische Dokumentation erstellen
  • Schritt 7: Konformitätserklärung(en) erstellen
  • Schritt 8: CE-Kennzeichnung anbringen

Benchmarking und Vergleichskriterien

  • Forschung durch Wettbewerbe in der Robotik
  • Basistechnolgien für Reinigungsroboter im öffentlichen Raum
  • Benchmarking-Szenario: Wettbewerb Parkreinigung
  • Benchmarking in Simulationen

OSS für Computer Vision

  • OSS OpenCV für Computer Vision und Bildverarbeitung
  • OSS TensorFlow für Maschinelles Lernen und Künstliche Intelligenz

Mensch-Roboter-Interaktion

  • Blick in die Forschung: Mensch-Roboter-Interaktion
  • Kommunikationsstrategie eines Roboters

OSS für Personen- und Objekterkennung

  • OSS You Only Look Once (YOLO)
  • OSS FreeMoCap Motion-Capture-System
  • OSS Open Pose

OSS für Navigation

  • OSS für Navigation
  • OSS Nav2
View Categories
  • Home
  • Wissensplattform
  • Open Source Software (OSS)
  • Large Language Modelle (LLMs)

Large Language Modelle (LLMs)

6 min read

Sogenannte Large Language Models (LLMs) sind fortschrittliche Modelle maschinellen Lernens. Sie sind in der Lage, natürliche Sprache – also bspw. auch umgangssprachliche menschliche Gespräche – zu verstehen und zu generieren. Mit Hilfe sehr großer Datenmengen können diese großen Sprachmodelle trainiert werden. Dies geschieht durch das Erlernen von Parametern und dem Erkennen von Sprachmustern in den gefütterten Trainingsdaten [1].

Bei der Anwendung von LLMs stellen sich einige Herausforderungen. So benötigt das Training der KI eine enorm große Menge an Daten und damit auch eine dementsprechend hohe Rechenleistung. Ist das Modell einsatzbereit, stellen sich weitere Bedenken ein. Indem das LLM textbasierte Antworten auf Basis der zuvor zur Verfügung gestellten Datenmenge erstellt, werden häufig bestehende Vorurteile und Vorannahmen aus den vorliegenden Daten einfach übernommen und dadurch verstärkt. Zudem kann es bei den ausgegebenen Antworten auch immer wieder einmal zu sogenannten Halluzinationen kommen. Gemeint ist damit das Erfinden von Dingen, die nicht korrekt sind, aber als Fakten dargestellt werden. Eine Überprüfung dessen, was ein LLM ausgibt, ist also unerlässlich. Außerdem stellt sich stets auch die Frage nach dem Datenschutz, da die Server vieler der bekannten LLMs nicht in Deutschland stehen und damit auch nicht der Datenschutzgrundverordnung (DSGVO) unterliegen müssen.

Anwendungsfelder

Große Sprachmodelle werden für viele unterschiedliche Zwecke eingesetzt. Sie können beim Lernen helfen, z.B. beim Erlernen einer neuen Sprache, und sind damit auch in der Lehre von Nutzen. Selbstverständlich können LLMs auch beim Erstellen von Texten und/oder der dazugehörigen Recherche Anwendung finden. Darüber hinaus sind einige LLMs auch in der Lage beim Programmieren zu unterstützen und Code zu generieren.

Besonders in der Robotik erleichtern LLMs den Einsatz von Robotiklösungen. Sprachmodelle ermöglichen in der Mensch-Roboter-Interaktion einen Austausch in natürlicher Sprache – also mit einem Roboter zu sprechen, wie mit einem Menschen. Zudem erhöhen sie die Zugänglichkeit. Bei der Planung und Ausführung von Aufgaben können große Sprachmodelle Anweisungen, die laut ausgesprochen werden, in die nötige Programmiersprache übersetzen. Somit wird der Einsatz von Robotern auch in kleinen oder mittelständischen Betrieben ohne Expert*innen möglich [2].

Ein Beispiel für die Anwendung von LLMs in der Robotik ist die Kombination des Roboters Spot mit ChatGPT [3].

„We integrated ChatGPT with our robots“. Video von Underfitted, veröffentlicht auf YouTube [4].

Beispiele für ChatBots und Large Language Modelle

ChatGPT (OpenAI)

ChatGPT ist ein Chatbot des US-amerikanischen Unternehmens OpenAI. Dieser basiert auf einem Large Language Model und kommuniziert textbasiert. Seinen Namen verdankt der Chatbot dem zugrundeliegenden Sprachmodell GPT („Generative Pre-trained Transformer“). Seit 2023 ist die neue Version, GPT-4, auf dem Markt, die laut Entwickler über einige Vorteile zum Vorgängermodell verfügt und nun auch multimodal funktioniert. Mit der vierten Version können nun also neben Texten auch Bilder oder Audio genutzt werden [5].

Vorteile:
Erzeugen menschenähnlicher Texte
Kann sowohl technisch argumentieren, als auch Lösungen mathematisch erläutern

Nachteile:
Keine Kontrolle über Daten (US Server vs. DSGVO)
Souveräne Falschaussagen („kann Wissenslücken nicht zugeben“, halluziniert stattdessen)

Das Transformer-Modell, für das das T in GPT steht, versteht mithilfe von neuronalen Netzen menschliche Eingaben und wandelt diese – ja nach dem –  in Texte, Bilder oder Musik um [5].

Gemini (Google)

Gemini, ehemals Bard, ist ein multimodaler Chatbot von Google. Multimodal bedeutet, dass Ein- und Ausgabe in unterschiedlichen Medien erfolgen kann, also neben Text beispielsweise auch Bilder akzeptiert werden. Ursprünglich basierte der Chatbot auf dem Large Language Model LaMDA. Seit einiger Zeit wird jedoch auf PALM 2 zurückgegriffen, das beispielsweise im Test besser mit Fremdsprachen umgehen kann.

Vorteile:
Antworten können aktuelle Ereignisse beinhalten
Seit Umstieg auf PALM 2 besser in Mathe und Logik

Nachteile:
Daten auf US Server, Weiterverwendung durch Google (DSGVO)
Programmierung wird (noch) nicht unterstützt
Laut Google nach Schwächen vorhanden

BERT/RoBERTa (Google)

BERT steht für „Bidirectional Encoder Representations from Transformers“ und ist ein vorprogrammiertes Deep-Learning-Modell von Google. Deep-Learning ist eine Form des maschinellen Lernens, die die Verarbeitung komplexer Datensätze erlaubt. Anders als unidirektionale Sprachmodelle, die Sätze lediglich von links nach rechts oder von rechts nach links lesen können, kann ein bidirektionales Sprachmodell wie BERT Informationen aus beiden Richtungen verwenden. Dadurch können genauere Vorhersagen getroffen werden [6].

Vorteile:
Kann gut komplexe Beziehungen zwischen Wörtern/Sätzen im Text lernen
Verarbeitung natürlicher Sprache
Kann gut komplexe Beziehungen zwischen Wörtern/Sätzen im Text lernen
Verarbeitung natürlicher Sprache

Nachteile:
Neigt zu overfitting, vor allem bei kleinen Datensätzen
Benötigt große Menge hochwertiger Trainingsdaten
Großes Modell mit vielen Parametern, speicher- und rechenintensiv

Overfitting meint das Fehlen von Flexibilität eines Deep-Learning-Modells, weil dieses zu stark auf die verwendete Trainingsdatenmenge fixiert ist. Dadurch kann das Modell auf Informationen außerhalb dieser Datenmenge nicht mehr korrekt reagieren [7].

Koala (Berkeley + LLaMA)

Koala ist ein Chatbot des Entwicklers Berkeley AI der University of California, Berkeley. Er ist ein Abkömmling des Sprachmodells LLaMA von Meta AI, da Koala durch Feinabstimmung LLaMAs auf Dialogdaten aus dem Internet trainiert wurde.

Vorteile:
Konzipiert für wissenschaftliche Recherche & akademische Forschung
Kann Aufgaben lösen, für die keine direkten Trainingsdaten gegeben wurden (Zero-Shot-Learning) – sehr gute Generalisierung

Nachteile:
Halluzinieren: erzeugen nicht-faktischer Antworten (stärker als bei vergleichbaren Modellen)

Lizenzen

Die unterschiedlichen Modelle unterliegen verschiedenen Lizenztypen: Die Online-Demo von Koala ist ausschließlich für die akademische Forschung gedacht. Der Trainings- und Inferenzcode ist unter der Apache Licence 2.0 veröffentlicht und demnach frei nutzbar [8]. Gemini, BERT und LLaMA unterliegen ebenfalls der Apache Licence 2.0. ChatGPT unterliegt keiner Open Source- oder Softwarelizenz, sondern lediglich den allgemeinen Nutzungsbedingungen und Richtlinien des Entwicklers OpenAI.

Mehr zu Lizenztypen hier.

Weiterführende Quellen:

O. Bünte. (2024, Juni 12). MIT lässt Roboter textbasiert mit LLMs navigieren. [Online]. Verfügbar: https://www.heise.de/news/MIT-laesst-Roboter-textbasiert-mit-LLMs-navigieren-9758885.html. [Abruf Oktober 8, 2024].

Referenzen:

[1] P. Kelbert, J. Siebert. (2024, Dezember 12). Was sind Large Language Models? Und was ist bei der Nutzung von KI-Sprachmodellen zu beachten? [Online]. Verfügbar: https://www.iese.fraunhofer.de/blog/large-language-models-ki-sprachmodelle/. [Abruf Oktober 8, 2024].

[2] M. Schebek. Wie KI und LLMs die Robotik für alle zugänglich machen. [Online]. Verfügbar: https://www.aiav.technikum-wien.at/post/wie-ki-und-llms-die-robotik-f%C3%BCr-alle-zug%C3%A4nglich-machen. [Abruf Oktober 8, 2024].

[3] B. Wessling. (2023, Oktober 30). Boston Dynamics turns Spot into a tour guide with ChatGPT. [Online]. Verfügbar: https://www.therobotreport.com/boston-dynamics-turns-spot-into-a-tour-guide-with-chatgpt/. [Abruf Oktober 8, 2024].

[4] Underfitted. (2023, April 25). We integrated ChatGPT with our robots. [Online]. Verfügbar: https://www.youtube.com/watch?v=Y1-s37zrm1M. [Abruf Oktober 8, 2024].

[5] T. Jahn. (2023, Juni 19). ChatGPT. Was Sie über OpenAIs KI wissen sollten. [Online]. Verfügbar: https://www.handelsblatt.com/technik/it-internet/chatgpt-was-sie-ueber-openais-ki-wissen-sollten-/28941524.html. [Abruf Oktober 8, 2024].

[6] DataScientest. (2022, November 17). BERT: Ein innovatives Tool zur Sprachverarbeitung. [Online]. Verfügbar: https://datascientest.com/de/bert. [Abruf Oktober 8, 2024].

[7] ibm. What is overfitting? [Online]. Verfügbar: https://www.ibm.com/topics/overfitting. [Abruf Oktober 8, 2024].

[8] X. Geng et al. (2023, April 3). Koala: A Dialogue Model for Academic Research. [Online]. Verfügbar: https://bair.berkeley.edu/blog/2023/04/03/koala/. [Abruf Oktober 8, 2024].

Assistenzroboter, Interaktion, Open Source Software, OSS, RimA, Robotik im Alltag, Serviceroboter
Hat dieser Beitrag weitergeholfen?
Nichts gefunden? Können wir helfen?

Wie können wir helfen?

Updated on 14. Oktober 2024
OSS Robotik-Framework ROS / ROS 2

Powered by BetterDocs

Transferzentrum RimA: Roboter im Alltag

 

koordiniert von:

FZI Forschungszentrum Informatik
Haid-und-Neu-Str. 10-14
76131 Karlsruhe

 

 

Datenschutz

Impressum

Förderung

gefördert durch das Bundesministerium für Bildung und Forschung

© Copyright - RimA | Roboter im Alltag - Enfold Theme by Kriesi
Praxishilfen für sichere MaschinenServiceroboter auf dem Markt: Haushaltsroboter
Nach oben scrollen

Diese Seite verwendet Cookies. Mit der Weiternutzung der Seite stimmen Sie der Verwendung der notwendigen Cookies zu. Wir verarbeiten die erhobenen Daten auf Basis berechtigten Interesses gemäß Art. 6 Abs. 1 lit f DSGVO. Das Interesse ist die Optimierung unserer Webseite für die Analyse der Navigationspfade bzw. die Häufigkeit von Aufrufen von Beiträgen. Die Daten werden nicht weitergegeben und gelöscht sobald die Analysen abgeschlossen sind. Nähere Infos finden Sie in unserer Datenschutzerklärung.

Einstellungen akzeptierenEinstellungen bearbeiten

Cookie and Datenschutz Einstellungen



Wie wir Cookies verwenden

Wir können Cookies anfordern, die auf Ihrem Gerät eingestellt werden. Wir verwenden Cookies, um zu sehen, wenn Sie unsere Websites besuchen, wie Sie mit uns interagieren, Ihre Nutzererfahrung verbessern und Ihre Beziehung zu unserer Website anpassen.

Wir verwenden zur Optimierung unserer Webseite die Analysefunktionen des BetterDocs-WordPress-Plugins. Hieran haben wir ein berechtigtes Interesse im Sinne des Art.6 Abs 1 lit f DSGVO. BetterDocs liefert eine Analysefunktion für die erstellten Inhalte. Unsere Interesse ist die Optimierung unserer Webseite wofür die Analyse der Navigationspfade bzw. die Häufigkeit von Aufrufen von Beiträgen notwendig ist. Um Nutzerverhalten zuordnen zu können benötigen wir die IP bzw. einen Cookie. Die Daten werden nicht weitergegeben. Die Daten werden gelöscht sobald die Analysen abgeschlossen sind.

Notwendige Website Cookies

Diese Cookies sind unbedingt erforderlich, um Ihnen die auf unserer Webseite verfügbaren Dienste und Funktionen zur Verfügung zu stellen.

Da diese Cookies für die auf unserer Webseite verfügbaren Dienste und Funktionen unbedingt erforderlich sind, hat die Ablehnung Auswirkungen auf die Funktionsweise unserer Webseite. Sie können Cookies jederzeit blockieren oder löschen, indem Sie Ihre Browsereinstellungen ändern und das Blockieren aller Cookies auf dieser Webseite erzwingen.

Wir respektieren es voll und ganz, wenn Sie Cookies ablehnen möchten. Um zu vermeiden, dass Sie immer wieder nach Cookies gefragt werden, erlauben Sie uns bitte, einen Cookie für Ihre Einstellungen zu speichern. Sie können sich jederzeit abmelden oder andere Cookies zulassen, um unsere Dienste vollumfänglich nutzen zu können. Wenn Sie Cookies ablehnen, werden alle gesetzten Cookies auf unserer Domain entfernt.

Datenschutzrichtlinie

Sie können unsere Cookies und Datenschutzeinstellungen im Detail in unseren Datenschutzrichtlinie nachlesen.

Datenschutz
Matomo

Diese Website benutzt den Open Source Webanalysedienst Matomo. Mit Hilfe von Matomo sind wir in der Lage Daten über die Nutzung unserer Website durch die Websitebesucher zu erfassen und zu analysieren. Hierdurch können wir u. a. herausfinden, wann welche Seitenaufrufe getätigt wurden und aus welcher Region sie kommen. Außerdem erfassen wir verschiedene Logdateien (z. B. IP-Adresse, Referrer, verwendete Browser und Betriebssysteme) und können messen, ob unsere Websitebesucher bestimmte Aktionen durchführen (z. B. Klicks, Käufe u. Ä.). Die Nutzung dieses Analyse-Tools erfolgt auf Grundlage von Art. 6 Abs. 1 lit. f DSGVO. Der Websitebetreiber hat ein berechtigtes Interesse an der Analyse des Nutzerverhaltens, um sowohl sein Webangebot als auch seine Werbung zu optimieren. Sofern eine entsprechende Einwilligung abgefragt wurde, erfolgt die Verarbeitung ausschließlich auf Grundlage von Art. 6 Abs. 1 lit. a DSGVO und § 25 Abs. 1 TDDDG, soweit die Einwilligung die Speicherung von Cookies oder den Zugriff auf Informationen im Endgerät des Nutzers (z. B. Device-Fingerprinting) im Sinne des TDDDG umfasst. Die Einwilligung ist jederzeit widerrufbar.

Opt-out complete; your visits to this website will not be recorded by the Web Analytics tool. Note that if you clear your cookies, delete the opt-out cookie, or if you change computers or Web browsers, you will need to perform the opt-out procedure again.

You may choose to prevent this website from aggregating and analyzing the actions you take here. Doing so will protect your privacy, but will also prevent the owner from learning from your actions and creating a better experience for you and other users.

The tracking opt-out feature requires cookies to be enabled.

Einstellungen akzeptieren