Pinecone
Использование векторной базы данных Pinecone
Pinecone — это векторная база данных, предназначенная для создания высокопроизводительных приложений векторного поиска. Она обеспечивает эффективное хранение, управление и поиск по сходству высокоразмерных векторных эмбеддингов, что делает ее идеальной для ИИ-приложений, требующих возможностей семантического поиска.
С помощью Pinecone вы можете:
- Хранить векторные эмбеддинги: Эффективно управлять высокоразмерными векторами в масштабе
- Выполнять поиск по сходству: Находить наиболее похожие векторы на запросный вектор за миллисекунды
- Создавать семантический поиск: Создавать поисковые возможности на основе смысла, а не ключевых слов
- Реализовывать системы рекомендаций: Генерировать персонализированные рекомендации на основе сходства контента
- Развертывать модели машинного обучения: Операционализировать ML-модели, которые полагаются на векторное сходство
- Масштабироваться бесшовно: Обрабатывать миллиарды векторов с постоянной производительностью
- Поддерживать индексы в реальном времени: Обновлять вашу векторную базу данных в реальном времени по мере поступления новых данных
В AACFlow интеграция с Pinecone позволяет вашим агентам использовать возможности векторного поиска программно как часть их рабочих процессов. Это позволяет реализовывать сложные сценарии автоматизации, которые сочетают обработку естественного языка с семантическим поиском и извлечением информации. Ваши агенты могут генерировать эмбеддинги из текста, хранить эти векторы в индексах Pinecone и выполнять поиск по сходству для нахождения наиболее релевантной информации. Эта интеграция устраняет разрыв между вашими ИИ-рабочими процессами и инфраструктурой векторного поиска, позволяя осуществлять более интеллектуальное извлечение информации на основе семантического значения, а не точного соответствия ключевым словам. Подключая AACFlow к Pinecone, вы можете создавать агентов, которые понимают контекст, извлекают релевантную информацию из больших наборов данных и предоставляют более точные и персонализированные ответы пользователям — все это без необходимости сложного управления инфраструктурой или специализированных знаний о векторных базах данных.
Интегрируйте Pinecone в рабочий процесс. Может генерировать эмбеддинги, вставлять/обновлять текст, искать по тексту, получать векторы и искать по векторам.
Сгенерировать эмбеддинги из текста с использованием Pinecone
| Параметр | Тип | Обязательный | Описание |
|---|
model | string | Да | Модель для генерации эмбеддингов |
inputs | array | Да | Массив текстовых входных данных для генерации эмбеддингов |
apiKey | string | Да | API-ключ Pinecone |
| Параметр | Тип | Описание |
|---|
data | array | Сгенерированные данные эмбеддингов со значениями и типом вектора |
model | string | Модель, использованная для генерации эмбеддингов |
vector_type | string | Тип сгенерированного вектора (dense/sparse) |
usage | object | Статистика использования для генерации эмбеддингов |
Вставить или обновить текстовые записи в индексе Pinecone
| Параметр | Тип | Обязательный | Описание |
|---|
indexHost | string | Да | Полный URL хоста индекса Pinecone (например, "https://my-index-abc123.svc.pinecone.io") |
namespace | string | Да | Пространство имен для вставки записей (например, "documents", "embeddings") |
records | array | Да | Запись или массив записей для вставки/обновления, каждая содержит _id, text и опциональные метаданные |
apiKey | string | Да | API-ключ Pinecone |
| Параметр | Тип | Описание |
|---|
statusText | string | Статус операции вставки/обновления |
Искать похожий текст в индексе Pinecone
| Параметр | Тип | Обязательный | Описание |
|---|
indexHost | string | Да | Полный URL хоста индекса Pinecone (например, "https://my-index-abc123.svc.pinecone.io") |
namespace | string | Нет | Пространство имен для поиска (например, "documents", "embeddings") |
searchQuery | string | Да | Текст для поиска |
topK | string | Нет | Количество возвращаемых результатов (например, "10", "25") |
fields | array | Нет | Поля для возврата в результатах |
filter | object | Нет | Фильтр для применения к поиску (например, {"category": "tech", "year": {"$gte": 2020}}) |
rerank | object | Нет | Параметры переранжирования |
apiKey | string | Да | API-ключ Pinecone |
| Параметр | Тип | Описание |
|---|
matches | array | Результаты поиска с ID, оценкой и метаданными |
↳ id | string | ID вектора |
↳ score | number | Оценка сходства |
↳ metadata | object | Связанные метаданные |
usage | object | Статистика использования, включая токены, единицы чтения и единицы переранжирования |
↳ total_tokens | number | Всего токенов, использованных для эмбеддинга |
↳ read_units | number | Потребленные единицы чтения |
↳ rerank_units | number | Использованные единицы переранжирования |
Искать похожие векторы в индексе Pinecone
| Параметр | Тип | Обязательный | Описание |
|---|
indexHost | string | Да | Полный URL хоста индекса Pinecone (например, "https://my-index-abc123.svc.pinecone.io") |
namespace | string | Нет | Пространство имен для поиска (например, "documents", "embeddings") |
vector | array | Да | Вектор для поиска |
topK | number | Нет | Количество возвращаемых результатов (например, 10, 25) |
filter | object | Нет | Фильтр для применения к поиску (например, {"category": "tech", "year": {"$gte": 2020}}) |
includeValues | boolean | Нет | Включать значения векторов в ответ |
includeMetadata | boolean | Нет | Включать метаданные в ответ (true/false) |
apiKey | string | Да | API-ключ Pinecone |
| Параметр | Тип | Описание |
|---|
matches | array | Результаты векторного поиска с ID, оценкой, значениями и метаданными |
namespace | string | Пространство имен, в котором выполнялся поиск |
Получить векторы по ID из индекса Pinecone
| Параметр | Тип | Обязательный | Описание |
|---|
indexHost | string | Да | Полный URL хоста индекса Pinecone (например, "https://my-index-abc123.svc.pinecone.io") |
ids | array | Да | Массив ID векторов для получения (например, ["vec-001", "vec-002"]) |
namespace | string | Нет | Пространство имен для получения векторов (например, "documents", "embeddings") |
apiKey | string | Да | API-ключ Pinecone |
| Параметр | Тип | Описание |
|---|
matches | array | Полученные векторы с ID, значениями, метаданными и оценкой |
↳ id | string | ID вектора |
↳ values | array | Значения вектора |
↳ metadata | object | Связанные метаданные |
↳ score | number | Оценка соответствия (1.0 для точных совпадений) |
data | array | Данные вектора со значениями и типом вектора |
↳ values | array | Значения вектора |
↳ vector_type | string | Тип вектора (dense/sparse) |
usage | object | Статистика использования, включая общее количество единиц чтения |
↳ total_tokens | number | Потребленные единицы чтения |