Guardrails (Защита)
Валидация AI-генерируемого контента с проверкой JSON, regex-паттернами, обнаружением галлюцинаций и фильтрацией персональных данных.
Guardrails
Блок Guardrails проверяет контент, созданный предыдущими блоками в сценарии. Он поддерживает четыре режима валидации: проверка структуры JSON, сопоставление с regex-паттернами, обнаружение галлюцинаций на основе LLM с использованием базы знаний и обнаружение персональных данных (PII) с опциональным маскированием.
Разместите этот блок после AI-блока или любого блока, генерирующего данные, чтобы контролировать качество выходных данных перед дальнейшими действиями.
Настройка
Для валидации JSON или regex не требуются внешние учетные данные API.
Для обнаружения галлюцинаций необходимо:
- База знаний, созданная в AACFlow (Настройки → Базы знаний).
- Учетные данные LLM-провайдера (любой поддерживаемый провайдер) — блок использует модель для оценки обоснованности.
Для обнаружения PII внешние учетные данные не требуются; обнаружение выполняется локально с помощью встроенного распознавателя сущностей.
Операции
| Операция | Описание |
|---|---|
guardrails_validate | Проверяет входной контент в соответствии с выбранным типом валидации и возвращает passed (логическое значение), а также специфичные для типа результаты, такие как score, reasoning, detectedEntities или maskedText. |
Типы валидации
| Тип | Описание |
|---|---|
json | Проверяет, что входные данные являются корректным JSON. |
regex | Проверяет входные данные на соответствие шаблону регулярного выражения. |
hallucination | Оценивает, насколько входные данные обоснованы в базе знаний (0–10). Оценки ниже порога уверенности считаются неудачными. |
pii | Обнаруживает сущности PII (имена, email, номера телефонов, ID и т.д.) и либо блокирует запрос, либо маскирует сущности. |
Пример сценария
После того как AI-блок сгенерировал ответ клиенту, пропустите его через Guardrails с обнаружением pii в режиме маскирования перед отправкой по электронной почте. Используйте блок Condition с <guardrails.passed>, чтобы остановить сценарий, если валидация не пройдена.
Ссылки
- Исходный код блока: apps/aacflow/blocks/blocks/guardrails.ts

