Перейти к основному содержимому

👁️ Mistral OCR

warning

Этот урок - вклад сообщества и не поддерживается командой Open WebUI. Он служит лишь демонстрацией того, как настроить Open WebUI для ваших конкретных нужд. Хотите внести вклад? Ознакомьтесь с руководством по внесению вклада.

👁️ Mistral OCR

Эта документация дает пошаговое руководство по интеграции Mistral OCR с Open WebUI. Mistral OCR - это библиотека оптического распознавания символов, предназначенная для извлечения текста из различных форматов файлов на основе изображений — включая отсканированные PDF-файлы, изображения и рукописные документы — в структурированные данные, такие как JSON или простой текст. С расширенной поддержкой многоязычного распознавания текста, анализа макета и интерпретации рукописного текста, Mistral OCR упрощает процесс оцифровки и обработки документов для приложений ИИ, таких как поиск, суммаризация и извлечение данных, через надежный и настраиваемый интерфейс.

Предварительные требования

  • Экземпляр Open WebUI
  • Аккаунт Mistral AI

Шаги интеграции

Шаг 1: Зарегистрируйтесь или войдите в консоль Mistral AI

  • Перейдите на https://console.mistral.ai
  • Следуйте инструкциям, указанным в процессе
  • После успешной авторизации вам будет предложен домашний экран консоли

Шаг 2: Сгенерируйте API-ключ

  • Перейдите в API Keys или https://console.mistral.ai/api-keys
  • Создайте новый ключ и убедитесь, что скопировали его

Шаг 3: Настройте Open WebUI для использования Mistral OCR

  • Войдите в вашу Open WebUI-экземпляр.
  • Перейдите в меню настроек Admin Panel.
  • Нажмите на Settings.
  • Нажмите на вкладку Documents.
  • Измените выпадющий список Default механизма извлечения контента на Mistral OCR.
  • Вставьте API-ключ в соответствующее поле
  • Сохраните настройки Admin Panel.

Проверка Mistral OCR

Чтобы убедиться, что Mistral OCR работает корректно в скрипте, обратитесь к https://docs.mistral.ai/capabilities/document/

Заключение

Интеграция Mistral OCR с Open WebUI - это простой и эффективный способ улучшить возможности обработки документов и извлечения контента. Следуя шагам данного руководства, вы можете настроить Mistral OCR как движок извлечения по умолчанию и использовать его расширенные функции распознавания текста. После настройки Mistral OCR позволяет выполнять мощный, многоязычный разбор документов с поддержкой различных форматов, улучшая возможности анализа документов с использованием ИИ в Open WebUI.