26.12.10

Програма для оптичного розпізнавання тексту CuneiForm

Мені дуже подобається програма для оптичного розпізнавання тексту ABBYY FineReader. Але є у неї один значний недолік вона є дорогою і безкоштовне її використання - це піратство. Існують інші вільні OCR-системи, наприклад, CuneiForm. Це програма з відкритим кодом. Існує версія цієї програми для Windows та у дистрибутив ALT Linux входить графічна оболонка для цієї програми Cuneiform-Qt або YAGF.



Основні можливості OCR CuneiForm



1. ІНТЕРФЕЙС
Інтерфейс програми містить випадачі контекстні меню, панелі швидкого доступу, контекстну допомогу.

2. СКАНУВАННЯ
Автоматичний підбір оптимальних параметрів сканування.
Можливість імпортування відсканованих або отриманих через факс-модем графічних файлів у багатьох форматах.
Обробка зображень: друк образу, інвертування, поворот.

3. ФРАГМЕНТАЦІЯ
Автоматичний і напівавтоматичний режими пошуку блоків тексту, таблиць і графіки, що забезпечує більшу гнучкість при роботі з багатоколоночними текстами і текстами складної структури і з графічними елементами.
Режим ручної фрагментації для роботи з текстами особливо складної структури.

4. РОЗПІЗНАВАННЯ
CuneiForm розпізнає будь-які поліграфічні, машинописні гарнітури всіх накреслень і шрифти, одержувані із принтерів за винятком декоративних і рукописних. У систему убудовані спеціальні алгоритми для розпізнавання тексту з матричного принтера, друкарської машинки, поганих ксерокопій і факсів.
Самонавчальні адаптивні алгоритми розпізнавання підвищують ймовірність розпізнавання низькоякісних документів.

5. МОВНА ПІДТРИМКА
Система розпізнає російську, англійську, змішану російсько-англійську, українську, німецьку, французьку, іспанську, португальську, італійську, голландську, датську, шведську, фінську, сербську, хорватську, польську, казахську, узбецьку і інші мови.

6. СЛОВНИКОВИЙ КОНТРОЛЬ
Словник загальновживаної лексики кожної підтримуваної мови для контекстної перевірки і підвищення якості результатів розпізнавання.
Можливість створення і поповнення словника користувача, а також можливість експорту / імпорту словника в / з текстових файлів.

7. РЕАЛІЗАЦІЯ ПРИНЦИПУ "What You Scan Is What You Get" ("Що Ви скануєте, те й отримуєте").
CuneiForm дозволяє отримати повну копію  документа, включаючи:
Шрифтове оформлення та форматування.
Розташування тексту, ілюстрацій і таблиць.
Колонки, абзаци, відступи, стилі та розміри шрифтів.
Чорно-білі, 256-градаційні сірі і кольорові 24-бітові ілюстрації у вихідному RTF-файлі.

8. РОБОТА З ТАБЛИЦЕЮ
Розпізнавання таблиць різної структури, в тому числі і без ліній розграфки.
Редагування таблиць (зменшення / збільшення, видалення / створення колонок і т.д.)
Збереження результатів у поширених табличних форматах.

9. РЕДАГУВАННЯ
У програму вбудований багатофункціональний редактор, який не поступається за своїми можливостями популярним текстовим процесорам.

Одночасне підсвічування розпізнаного тексту та вихідного зображення, забезпечена функцією "наступний / попередній сумнівно розпізнаний".
Підтримка ілюстрацій, таблиць, колонок, колонтитулів, складного форматування і різних шрифтів.
Можливість редагування текстових документів популярних форматів.

10. ІНТЕГРАЦІЯ З ІНШИМИ ДОДАТКАМИ
Опції командного рядка і підтримка Drag&Drop для виклику із зовнішніх додатків, сканування, розпізнавання і збереження результатів в автоматичному режимі.

Немає коментарів:

Дописати коментар

Related Posts Plugin for WordPress, Blogger...