ChatGPT ist ein Dialogmodell, das von OpenAI ins Leben gerufen wurde. Die neue Funktion ermöglicht es, Fragen zu beantworten, Fehler anzuerkennen, falsche Aussagen in Frage zu stellen und unpassende Anfragen zurückzuweisen. Es handelt sich hierbei um ein Partnermodell von InstructGPT, welches darauf trainiert wurde, Anweisungen in einer Eingabeaufforderung zu folgen und eine detaillierte Antwort vorzulegen.
Auf der eigenen Website zeigt OpenAI unterschiedliche Beispiele, damit man sich die Funktion der ChatGPT besser vorstellen kann.
Mit der Unterstützung von RLHF (Reinforcement Learning from Human Feedback) wurde ChatGPT trainiert. Zuerst wurde ein erstes Modell programmiert, indem human AI-Trainer auf unterschiedliche Weise Konversation führten. Eine Person spielte den AI Assistenten, die andere den oder die Nutzer:in. Die daraus gewonnenen Fragen und Antworten wurden mit dem bereits vorhandenen Datenset der InstructGPT, die zu einem Dialogformat verändert wurde, vermischt.
Damit ein Belohnungsmodell für das Reinforcement Learning erstellt werden konnte, mussten Vergleichsdaten generiert werden. Diese sollten aus zwei oder mehr Modellantworten bestehen, die nach Qualität geordnet wurden. Damit solche Daten gesammelt werden konnten, wurden Unterhaltungen, die KI-Trainer mit dem Chatbot führten, aufgezeichnet.
Es wurden per Zufall vom Modell verfasste Nachrichten ausgewählt, verschiedene Vervollständigungen ausprobiert und zu guter Letzt liess man die KI-Trainer eine Bewertung abgeben. Mit Hilfe dieser Belohnungsmodelle kann nun das Modell mit der Unterstützung der Proximal Policy Optimization immer genauer abgestimmt werden. Dieser Prozess wurde einige Male durchgeführt.
ChatGPT ist ein weiterer Schritt in der
Nutzung von KI-Systemen. Für uns stellt sich immer wieder die Frage, ob ein solches System schlussendlich wirklich den Menschen ersetzen kann. In bestimmten Bereichen können solche Modelle durchaus unterstützen, doch gibt es unserer Meinung andere Bereich, wo der Mensch durchaus noch authentischer wirken kann.
Quelle: Openai.com
Lisa-Marie hat 2018 Publizistik und Kommunikationswissenschaften abgeschlossen und arbeitet bei netpulse AG als Projektleiterin für Google Ads. Sie informiert über SEO und führt Schulungen durch.
Was wir für Sie tun
Kontakt
© 2025 netpulse AG. Alle Rechte vorbehalten.