Главная

Распознавание английских текстов или GOCRTranslator

Наверное все знают проект (GOCR http://bebits.com/app/3993), чуть ли не единственно–приемлемую альтернативу «файнридеру» для *nix. К сожалению он поддерживает распознавание только латиницы, но в официальном TODO (jocr.sf.net) листе в ближайшем будущем обещают национальную поддержку. Будем ждать… а пока…

А пока пробуйте самое «наибеосьное» решение проблемы рапознавания текстов — Транслятор из картинки в текст.

Пример использования транслятора можно увидеть на скриншотах:
GOCRTranslator–0.png
GOCRTranslator–1.png
test2.png

Сам транслятор можно скачать тут: GOCRTranslator.zip
Для установки необходимо развернуть архив в /boot/home/config/add–ons/Translators

Жду ваших коментариев…

3dEyes**

Распознавание английских текстов или GOCRTranslator

Маленький совет:
сканировать изображение лучше с разрешением в 300dpi, цветное или серое (двухцетные изображения распознаются плохо).

класс+

эт то, о чем долго говорили большевики…;)
спасиб

Распознавание английских текстов или GOCRTranslator

2 3dEyes**

Скажи, пожалуйста, как этим транслятором пользоваться, что–то не получается ни фига. Из какой программы?

P. S. Спасибо за такой солидный вклад в BeOS (samba рулит! :–)

если открыть люк...

то становится видно… что надо просто открыть отсканированную картинку, и выбрать Save As -> GOCR Text File. Всё.

действительно наибеоснейшее решение. сама распознавалка пока не ахти правда, но …

GOCRTranslator и прогресс бар

Было бы неплохо сделать прогресс бар, чтоб прикинуть время распознавания. А в настройках транслятора сделать возможность его отключения (кому не нужен).

белый-белый текст, на черном-черном фоне :))

совсем не распознаётся, да это не тебе — это скорее гокравцам
но ты тоже можешь в настройках транслятора забацать выбор инвертирования цветов, а потом оный реализовать, как раз перед прогрес–баром :))

Новая версия GOCRTranslator'a

…доступна для скачивания.

http://www.bebits.com/bob/18465/GOCRTranslator.0.0.2.pkg.zip

Из нововведений:
1. Экспорт в следующие форматы: UTF8, TeX, HTML, XML, ASCII, ISO8859–1
2. Ручная/автоматическая настройка уровня фильтрации шума.
3. Ручная/автоматическая настройка уровня серого.
4. Ручная/автоматическая настройка ширины пробела между символами.
5. Распознавание только чисел.
6. Инверсия изображения для текстов написанных белым по черному (по заказу knorr :) )
7. Всплывающее окно с «прогресс баром» (по заказу smedos :) )

Как всё это выглядит в действии можно увидеть на скриншоте: http://hanasoft.ru/images/ss/GOCRTranslator–3.jpg

3dEyes**
Как обычно жду коментариев…

баркоды

а что там насчет баркодов (тобишь штрихкодов)??

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Allowed HTML tags: <a> <em> <i> <img> <strong> <b> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Строки и параграфы переносятся автоматически.

Подробнее о форматировании

CAPTCHA
Введите перечисленные символы, чтобы мы убедились, что вы не робот. Не требуется для зарегистрированных пользователей.
n
2
e
a
8
p
Enter the code without spaces and pay attention to upper/lower case.