AI-Adoption: Leftshiftone

Name: _pk_id Zweck : Wird benutzt um eine eindeutige Benutzer ID des Users&nbsp;zu speichern. Dauer : 13 Monate
Name: &nbsp;_pk_ses, _pk_cvar, _pkhsr Zweck :&nbsp;Kurzlebige Cookies, die&nbsp;temporär&nbsp;während des Besuchs Daten speichern. Dauer :&nbsp;30 Minuten
Name: mtm_consent Zweck : Information über die Zustimmung oder Ablehnung der Cookie Einstellungen werden über einen langen Zeitraum gespeichert. Dauer : 30 Jahre

aws Digitalisierung - AI Adoption | Steiermark | 2024

Entwicklung eines automatischen Testframeworks für LLM Fact-Checking

aws Digitalisierung - AI Adoption | Steiermark | 2024

Das vorliegende Projekt zielt auf die Entwicklung eines automatisierten Testframeworks für Large Language Models (LLMs), das speziell zur Verbesserung der Vertrauenswürdigkeit und Effizienz von KI-Modellen dient. Unter Berücksichtigung der Anforderungen des EU AI Acts wird ein umfassendes Testsystem entwickelt, das eine End-to-End-Überprüfung der LLMs ermöglicht. Dies schließt die Überwachung auf Halluzinationen und die Sicherstellung der Übereinstimmung mit verifizierten Unternehmensdaten ein.
Das Framework erlaubt die automatische und manuelle Definition von Testfällen und ermöglicht eine schnelle Integration in bestehende Software-Pipelines. Durch die Kombination von quantitativen Methoden und fortgeschrittener Statistik wird die Testausführung optimiert, während gleichzeitig der Schutz der Datenschutz- und Sicherheitsanforderungen der EU, einschließlich der GDPR-Vorgaben, gewährleistet ist.
Die Zielsetzung des Projekts ist es, das Vertrauen der Anwender*innen in LLM-basierte Systeme zu erhöhen und die Entwicklung von KI-Modellen zu beschleunigen, indem alle relevanten Parameter, einschließlich Prompts, in einer umfassenden Testpipeline integriert werden. Dies schafft eine solide Grundlage für die Compliance und Transparenz von KI-Systemen und stellt sicher, dass die Ergebnisse den höchsten Standards entsprechen.

Newsletter