05/09/2006 18:43
Компания Google объявила о выпуске открытого программного движка для систем
оптического распознавания текстов. Стоит отметить, что движок Teseract -
это не полностью разработка Google. Истоки этой разработки восходят к 1985
году и компании HP, которая на протяжении 10 лет создавала этот механизм,
однако в 1995 году руководство компании решило, что OCR - это не то направление,
в котором следует развиваться и эта разработка была заброшена. В 2005 году
HP приняла решение об открытии Tesseract, чем и воспользовалась Google,
которая за полтора года значительно модифицировала и усовершенствовала движок.
Технически большая часть кода Tesseract распространяется под лицензией Apache
open source license, однако есть в нем и небольшие фрагменты коммерческого
кода, принадлежащего компании Uber Tech Lead, помогавшей Google с разработками.
Скачать движок помжно по адресу http://sourceforge.net/projects/tesseract-ocr
Оригинал (на 05/09/2006): cybersecurity.ru
В случае обнаружения неточностей или ошибок просим Вас сообщить об этом по адресу
|