Анонсирован выход Cuneiform Linux 0.3, Linux редакции системы распознавания печатных текстов, построенной на базе открытых компанией Cognitive Technologies исходных текстов. В новой версии появилась поддержка 64-битных систем, вывод результата в HTML формате сохраняя особенности начертания оригинала (выделение жирным, курсивом и т.д.).
Пакет может быть установлен из исходных текстов в любом дистрибутиве соответствующем стандарту LSB, путем выполнения стандартной команды 'make install', что упрощает создание бинарных пакетов (например, пакет для CRUX Linux можно загрузить здесь (//\"http://crux.nu/portdb/?q=cuneiform&a=search\")).
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском языке.
http://groups.google.com/group/tesseract-o...78f5cfa0372258f (//\"http://groups.google.com/group/tesseract-ocr/browse_thread/thread/a78f5cfa0372258f\")