Як захоплювати текст із зображень за допомогою програмного забезпечення ocr

Однією з речей, яка мене часто засмучує, є неможливість легко копіювати текст із зображень та певних PDF-файлів (наприклад, тих, які можуть бути створені зі сканованих документів). На щастя, з часом були розроблені програмні рішення для вирішення цього питання, що дозволяє значно заощадити час, який інакше було б витрачено на копіювання та повторне введення тексту. У сьогоднішній підказці я розповім про безкоштовний інструмент програмного забезпечення під назвою Capture2Text, який використовує алгоритм оптичного розпізнавання символів (OCR), який дозволить вам захоплювати текст із зображень та PDF-файлів.

Встановлення та налаштування

Для початку перейдіть на сторінку SourceForge проекту та завантажте останню версію Capture2Text. Програмне забезпечення поставляється у форматі zip-архіву і не включає спеціального інсталятора. Після завантаження розпакуйте архів і запустіть файл Capture2Text.exe. Це запустить програмне забезпечення та поставить значок в системний трей:

По-перше, що ви хочете зробити, це налаштувати налаштування програмного забезпечення, зокрема, які гарячі клавіші (або ярлики) використовувати для запуску та зупинки зйомки:

У моєму випадку я вирішив використовувати клавіші “Windows + q” для початку захоплення та “Enter”, щоб зупинити його. Ви можете налаштувати ці параметри на те, що найкраще підходить для вас. Майте на увазі, що клавіша “Windows + s” часто використовується для зйомки екрана (наприклад, таких програм, як Microsoft One Note).

На наступній вкладці параметри OCR можуть бути налаштовані, включаючи мову введення (зараз підтримується сім мов) та чи використовувати попередню обробку OCR для підвищення точності (настійно рекомендується). Нарешті, на вкладці «Вивід» серед інших варіантів можна вибрати, чи потрібно просто зберегти захоплений текст у буфер обміну чи запустити окреме спливаюче вікно.

Використання програмного забезпечення

Після встановлення та налаштування програмного забезпечення ви можете почати використовувати його за допомогою комбінації гарячих клавіш запуску. За допомогою миші виберіть область зображення, яка містить текст, який ви бажаєте зробити. Щоб зупинити захоплення, просто натисніть гарячу клавішу, яку ви вибрали, щоб зупинити зйомку. Потім текст буде скопійовано або в буфер обміну, у вихідне спливаюче вікно, або в обидва. Приклад можна побачити нижче.

З мого швидкого тестування інструменту із зображеннями я визнав його точність пристойною. Очевидно, існують обмеження щодо таких інструментів, як цей та OCR загалом. Наприклад, сильно модифікований текст (дуже скорописний, курсивний або сучасний) може працювати не дуже добре, а іноді і зовсім. Також в деяких випадках це допоможе трохи відрегулювати розміри поля захоплення або пограти із збільшенням самого зображення, щоб отримати більш точний результат.

Під час зйомки тексту з відсканованих PDF-файлів точність є нормальною, але на фіксованому виході, як правило, необхідні кілька остаточних модифікацій (залежно від якості початкового сканування). Крім того, я помітив, що на обробку програмного забезпечення може знадобитися кілька секунд довше, особливо коли вимагають перетворити велику кількість тексту.

Зважаючи на все, я думаю, що загалом я вважаю, що цей інструмент добре працює, тим більше, що він є у вільному доступі - я закликаю вас спробувати його.

Додаток 16.11.2015:

Як інший варіант, для тих, хто має облікові записи Google, також можна використовувати можливості OCR Google, завантаживши файл на свій Диск Google (докладнішу інформацію можна знайти тут). Крім того, для користувачів Google Chrome доступний плагін OCR під назвою Copyfish, який ви також можете перевірити.