Оболочка YAGF предоставляет графический интерфейс для консольных программ распознавания тектов cuneiform и tesseract на платформе Linux. Кроме того, YAGF позволяет управлять сканированием изображений, импортом страниц из документов PDF, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц.
Выглядит он вот так:
Как видите распознаёт не доконца верно, но это скорее из-за плохого качества скана изображения.
Для сборки необходимо:
sudo apt-get install cmake aspell aspell-ru libaspell-dev
Ну и Qt которое наверняка у вас уже установлено.
Теперь скачайте с этой страници архив с исходниками программы. Там же можете почитать об особенностях творения.
Распакуйте полученный архив и войдите в полученную папку при помощи консоли.
В ней выполните:
cmake .
make
После чего можете запускать:
./yagf
В архиве есть и desctop файл. Дайте ему право на выполнение и можете пользоваться.
Для распознания откройте изображение и выделите область с текстом после чего нажмите Ctrl + R
В правой части окна появится текст.