Guardrails sind Sicherheits- und Qualitätsmechanismen rund um ein Sprachmodell. Sie filtern Ein- und Ausgaben, verhindern unerwünschte Themen, erkennen Prompt Injection und halten Antworten in einem definierten Format.
Typische Guardrails prüfen Inhalte auf Schimpfwörter, personenbezogene Daten, regulatorische Verstöße oder Halluzinations-Hinweise. Implementiert werden sie als vor- und nachgelagerte Prüfstufen (z.B. mit Llama Guard, NeMo Guardrails oder eigenen Regeln).
Für den compliance-sicheren Einsatz von KI im Unternehmen bauen wir Guardrails mit ein – Teil unserer KI-Leistungen.