OCR — распознавание текста: полное руководство 2025 (русский и английский)
OCR (Optical Character Recognition, оптическое распознавание символов) превращает картинку с текстом в редактируемый текст. Это технология, которая позволяет «оцифровать» бумажный архив, скопировать цитату из скана учебника или сделать PDF поисковым. Эта статья — практическое руководство, как пользоваться OCR в браузере и как добиться хорошей точности.
Главное про OCR в нашем сервисе
Когда нужен OCR
- Скан учебника или книги → редактируемый текст для конспекта.
- Фотография договора → возможность скопировать конкретный пункт.
- Архив бумажных документов → поиск по содержимому через стандартный Ctrl+F.
- Чек или квитанция → быстрое извлечение цифр для бухгалтерии.
- Старые рукописные записи → сохранение в цифровом виде (с оговоркой про точность).
- PDF-скан без текстового слоя → подготовка к конвертации в Word.
Как использовать OCR на нашем сайте
Шаг 1. Откройте инструмент
Перейдите на страницу OCR — распознавание текста. Никаких регистраций, и важно — все вычисления происходят в вашем браузере.
Шаг 2. Загрузите изображение или PDF
Поддерживаются JPG, PNG, WEBP, а также PDF (распознаётся постранично). Лучшее качество — на оригинальных сканах в 300 DPI. Хорошие фотографии с телефона тоже подходят.
Шаг 3. Выберите язык
Русский — для русского текста. Английский — для английского. Смешанный (rus+eng) — если в тексте чередуются языки (типично для технической документации). Указание правильного языка повышает точность на 5–15 %.
Шаг 4. Дождитесь обработки
Первый запуск может занять 5–10 секунд — браузер загружает языковую модель Tesseract (~10–20 МБ). Дальше распознавание идёт за 2–5 секунд на страницу.
Шаг 5. Скопируйте результат
Распознанный текст появится в окне. Используйте кнопку «Скопировать» или выделите мышкой и Ctrl+C.
Как добиться высокой точности
- Разрешение 300 DPI и выше. Меньше — буквы становятся кашей пикселей.
- Прямой угол съёмки. Любой наклон искажает буквы. Если фотографируете телефоном — снимайте сверху, перпендикулярно странице.
- Хорошее освещение. Дневной свет лучше лампы накаливания. Избегайте бликов и теней.
- Высокий контраст. Чёрный текст на белом — идеал. Серый на сером — почти нераспознаваемо.
- Без шума. Помятая бумага, кофейные пятна, бледные надписи поверх — всё это снижает точность.
- Один язык за раз. Если страница на русском, не выбирайте «английский». Если смешанный — берите rus+eng явно.
Распространённые ошибки
- Загрузка фото из мессенджера (там обычно 80–100 DPI — мало).
- Скан на цветном или текстурном фоне (Tesseract путает фон с текстом).
- Снимок «на бегу» с заметным размытием — буквы сливаются.
- Распознавание сверхмаленького шрифта (мелкие сноски, мелкий шрифт договора).
Что делать с результатом
- Отредактировать в Word — открой Умный редактор и попроси ИИ форматировать текст или составить документ на его основе.
- Сделать PDF поисковым — сохранить распознанный текст и присоединить его как невидимый слой к исходному PDF.
- Конвертировать в DOCX для редактирования в офлайне — через «PDF в Word» после OCR.
- Перевести в Google Translate / DeepL — теперь, когда текст извлечён, это занимает секунды.
Как работает OCR под капотом
- Препроцессинг. Изображение приводится к чёрно-белому, удаляются шум и дефекты, выравнивается наклон.
- Сегментация. Алгоритм находит области, похожие на текст, и отделяет их от изображений.
- Разбиение на строки и слова. Каждая строка делится на отдельные слова по пробелам.
- Классификация символов. Нейросеть (LSTM в Tesseract 4+) сопоставляет картинку каждого символа с буквой алфавита.
- Постобработка. Словарная проверка корректирует ошибки («пр0блема» → «проблема»).
Ограничения OCR
- Сложные шрифты: декоративные, готические — точность падает до 70–80 %.
- Математические формулы: распознаются плохо, нужна спец-OCR (например, Mathpix).
- Нестандартные таблицы: строки/колонки распознаются как линейный текст. Структура теряется.
- Печати и штампы: часто принимаются за «шум» и игнорируются.
- Многоязычные надписи в один проход распознаются хуже, чем моноязычные.
Часто задаваемые вопросы
Какая точность распознавания у современного OCR?
На печатном тексте хорошего качества (300+ DPI, ровно сфотографирован, без наклона) — 95–99 %. На фотографиях с телефона при хорошем освещении — 90–97 %. На рукописном тексте — 60–80 %, и сильно зависит от почерка.
Распознаёт ли OCR рукописный текст?
Tesseract распознаёт каллиграфический рукописный текст с переменным успехом, обычный «беглый» почерк — плохо. Для серьёзной работы с рукописями лучше использовать специализированные платные сервисы (Google Cloud Vision, Microsoft Read API) — у них модели обучены отдельно на рукописи.
Уходят ли мои сканы на сервер при использовании OCR?
В нашем OCR-инструменте — нет. Tesseract.js работает в WebAssembly прямо в браузере, изображение остаётся на вашем устройстве. Это особенно важно для сканов паспортов, договоров и медицинских документов.
Какие языки поддерживаются?
На нашем сервисе — русский, английский и смешанный режим (rus+eng). Tesseract в принципе поддерживает 100+ языков, но мы загружаем только нужные модели для скорости. Если нужен украинский, белорусский, немецкий — напишите, добавим.
OCR не справился — что делать?
Самые частые причины: низкое разрешение (увеличьте до 300 DPI), наклон страницы (выпрямите в любом редакторе), плохой контраст (увеличьте контрастность, можно перевести в чёрно-белый), сложный фон (попробуйте обрезать только текстовую область).
Связанные инструменты и статьи
- OCR — распознавание текста
- PDF в Word
- Умный редактор с ИИ
- Создание PDF из сканов и фото
- Как конвертировать PDF в Word
Распознать текст из вашего скана
Бесплатно, в браузере, без отправки на сервер. Русский, английский и смешанный.
Открыть инструмент