Vision

Vision — это инструмент, который позволяет анализировать изображения с помощью vision-моделей.

С помощью Vision вы можете:

Анализировать изображения: Анализировать изображения с помощью vision-моделей
Извлекать текст: Извлекать текст из изображений
Идентифицировать объекты: Идентифицировать объекты на изображениях
Описывать изображения: Подробно описывать изображения
Генерировать изображения: Генерировать изображения из текста

В AACFlow интеграция Vision позволяет вашим агентам анализировать изображения с помощью vision-моделей как часть их рабочих процессов. Это позволяет реализовать мощные сценарии автоматизации, требующие анализа изображений с помощью vision-моделей. Ваши агенты могут анализировать изображения с помощью vision-моделей, извлекать текст из изображений, идентифицировать объекты на изображениях, подробно описывать изображения и генерировать изображения из текста. Эта интеграция устраняет разрыв между вашими AI-рабочими процессами и потребностями в анализе изображений, позволяя реализовать более сложные и ориентированные на изображения автоматизации. Подключая AACFlow к Vision, вы можете создавать агентов, которые остаются в курсе последней информации, предоставляют более точные ответы и приносят больше пользы пользователям — все без необходимости ручного вмешательства или написания пользовательского кода.

Параметр	Тип	Обязательный	Описание
`apiKey`	string	Да	API-ключ для выбранного провайдера модели
`imageUrl`	string	Нет	Публично доступный URL изображения
`imageFile`	file	Нет	Файл изображения для анализа
`model`	string	Нет	Vision-модель для использования (gpt-4o, claude-3-opus-20240229 и т.д.)
`prompt`	string	Нет	Пользовательский промт для анализа изображения

Выходные данные

Этот инструмент не производит никаких выходных данных.

Vision

Инструкции по использованию

Инструменты

`vision_tool`

Входные параметры

Выходные данные

On this page