👁️ Mistral OCR
Этот урок - вклад сообщества и не поддерживается командой Open WebUI. Он служит лишь демонстрацией того, как настроить Open WebUI для ваших конкретных нужд. Хотите внести вклад? Ознакомьтесь с руководством по внесению вклада.
👁️ Mistral OCR
Эта документация дает пошаговое руководство по интеграции Mistral OCR с Open WebUI. Mistral OCR - это библиотека оптического распознавания символов, предназначенная для извлечения текста из различных форматов файлов на основе изображений — включая отсканированные PDF-файлы, изображения и рукописные документы — в структурированные данные, такие как JSON или простой текст. С расширенной поддержкой многоязычного распознавания текста, анализа макета и интерпретации рукописного текста, Mistral OCR упрощает процесс оцифровки и обработки документов для приложений ИИ, таких как поиск, суммаризация и извлечение данных, через надежный и настраиваемый интерфейс.
Предварительные требования
- Экземпляр Open WebUI
- Аккаунт Mistral AI
Шаги интеграции
Шаг 1: Зарегистрируйтесь или войдите в консоль Mistral AI
- Перейдите на
https://console.mistral.ai
- Следуйте инструкциям, указанным в процессе
- После успешной авторизации вам будет предложен домашний экран консоли
Шаг 2: Сгенерируйте API-ключ
- Перейдите в
API Keys
илиhttps://console.mistral.ai/api-keys
- Создайте новый ключ и убедитесь, что скопировали его
Шаг 3: Настройте Open WebUI для использования Mistral OCR
- Войдите в вашу Open WebUI-экземпляр.
- Перейдите в меню настроек
Admin Panel
. - Нажмите на
Settings
. - Нажмите на вкладку
Documents
. - Измените выпадющий список
Default
механизма извлечения контента наMistral OCR
. - Вставьте API-ключ в соответствующее поле
- Сохраните настройки Admin Panel.
Проверка Mistral OCR
Чтобы убедиться, что Mistral OCR работает корректно в скрипте, обратитесь к https://docs.mistral.ai/capabilities/document/