Представлена альфа-версия ПО Google для распознавания текстов

29/09/2024

Вебмастеру:
Добавьте разнообразия на страницы Вашего сайта при помощи
легко настраиваемого под Ваш дизайн новостного информера!

лента новостей

идет обновление информации.

ТОП месяца

идет обновление информации.

поиск

меню

интересное в сети

в мире

29/10/2007 10:52

Представлена альфа-версия ПО Google для распознавания текстов

Компания Google официально представила альфа-версию программного пакета OCRopus, предназначенного для оптического распознавания (Optical Character Recognition, OCR) текстовых документов. Утилита построена на базе OCR-алгоритма Tesseract c открытым кодом, работает под операционными системами Linux и распространяется по лицензии Apache License 2.0, сообщает сайт Ars Technica.

Представленная версия OCRopus не лишена ошибок: в частности, очень часто буква "e" распознается как "c", а буква "о" регулярно заменяется цифрой 0. По наблюдениям источника, программа лучше справляется со сканированием текстов, набранных шрифтами без засечек (sans serif); кроме того, на эффективности ее работы положительно сказывается увеличенный размер символов.

Впрочем, по утверждению разработчиков, все это - особенности именно альфа-версии, где приоритет делается на поиске оптимальной функциональности. Улучшением качества и скорости работы OCRopus займутся уже на следующем этапе, этапе бета-тестирования, начало которого пока запланировано на первый квартал 2008 года.

Выход Google на рынок OCR-систем связан с интересом поискового гиганта к оцифровке печатных документов - книг и старинных рукописей, газет и журналов, архивных записей и т.д. При этом модульный подход, применяющийся в OCRopus (и, в частности, поддержка Lua), способен обеспечить интерес к этой программе и со стороны неанглоязычной аудитории.

Оригинал (на 29/10/2007): podrobnosti.ua

В случае обнаружения неточностей или ошибок
просим Вас сообщить об этом по адресу

печатать

отправить по почте

в избранное

Автор песни Wicked Game сыграет в кино отпускника-алкоголика Американский певец и музыкант Крис Айзек сыграет в фильме "Информаторы" (The Informers), основанном на одноименной серии рассказов Брета Истона Эллиса, выпущенной в 1994 году, сообщает Reuters....

Неандертальцы могли разговаривать? Неандертальцы, обычно представляющиеся нам в виде угрюмых, обросших волосами, человекоподобных существ, возможно, обладали развитой речью. Об этом свидетельствует обнаружение у них гена под...

Эквадор признал Голодомор геноцидом украинского народа Национальный Конгресс Эквадора принял резолюцию, которой признал Голодомор 1932-33 годов геноцидом украинского народа. Об этом говорится в сообщении пресс-службы Министерства иностранных дел....

LG представила бюджетную "раскладушку" с FM-радио Компания LG Electronics представила недорогой мобильный телефон начального уровня, выполненный в форм-факторе раскладушки. KG370 предназначен для работы в сетях GSM 900/1800 мегагерц и имеет...

Альберт Гор получил литературную премию Бывший вице-президент США Альберт Гор второй раз подряд удостоен престижной американской литературной премии Quill ("Перо"), сообщает Reuters. Торжественная церемония вручения наград состоялась в...

При столкновении демонстрантов и полиции в Будапеште пострадали пять человек Пять человек получили ранения в результате столкновений демонстрантов и полиции, произошедших в ночь на вторник в Будапеште. Несколько тысяч человек собрались около здания Оперы, где проходило...

:: все новости из этой категории на 29/10/2007 ::

последняя новость

идет обновление информации.

архив

опрос

:: результаты опроса ::