Vision — это инструмент, который позволяет анализировать изображения с помощью vision-моделей.
С помощью Vision вы можете:
- Анализировать изображения: Анализировать изображения с помощью vision-моделей
- Извлекать текст: Извлекать текст из изображений
- Идентифицировать объекты: Идентифицировать объекты на изображениях
- Описывать изображения: Подробно описывать изображения
- Генерировать изображения: Генерировать изображения из текста
В AACFlow интеграция Vision позволяет вашим агентам анализировать изображения с помощью vision-моделей как часть их рабочих процессов. Это позволяет реализовать мощные сценарии автоматизации, требующие анализа изображений с помощью vision-моделей. Ваши агенты могут анализировать изображения с помощью vision-моделей, извлекать текст из изображений, идентифицировать объекты на изображениях, подробно описывать изображения и генерировать изображения из текста. Эта интеграция устраняет разрыв между вашими AI-рабочими процессами и потребностями в анализе изображений, позволяя реализовать более сложные и ориентированные на изображения автоматизации. Подключая AACFlow к Vision, вы можете создавать агентов, которые остаются в курсе последней информации, предоставляют более точные ответы и приносят больше пользы пользователям — все без необходимости ручного вмешательства или написания пользовательского кода.
Инструкции по использованию
Интегрируйте Vision в рабочий процесс. Может анализировать изображения с помощью vision-моделей.
Инструменты
vision_tool
Входные параметры
| Параметр | Тип | Обязательный | Описание |
|---|---|---|---|
apiKey | string | Да | API-ключ для выбранного провайдера модели |
imageUrl | string | Нет | Публично доступный URL изображения |
imageFile | file | Нет | Файл изображения для анализа |
model | string | Нет | Vision-модель для использования (gpt-4o, claude-3-opus-20240229 и т.д.) |
prompt | string | Нет | Пользовательский промт для анализа изображения |
Выходные данные
Этот инструмент не производит никаких выходных данных.

