У меня есть несколько сотен изображений из которых необходимо извлечь ОПРЕДЕЛЕННЫЙ текст. Есть какие либо варианты это сделать?
У меня есть несколько сотен изображений из которых необходимо извлечь ОПРЕДЕЛЕННЫЙ текст. Есть какие либо варианты это сделать?
Вот несколько странный метод, который можно попробовать с помощью digikam и его инструмента OCR и чего-то вроде Notepad++. Я не знаю, о каком количестве скриншотов идет речь, но, возможно, стоит попробовать.
В digikam перейдите в tools > OCR Text converter
(Вам может понадобиться установить Tesseract, как описано здесь. В итоге я скачал его отсюда)
Перетащите скриншоты, которые вы хотите отсканировать, в окно OCR-конвертера и выберите "Start OCR".
Отсканированный текст будет выведен в виде отдельных текстовых файлов. Вы можете открыть эти текстовые файлы одновременно в Notepad++ и использовать функцию поиска для поиска нужного текста во всех открытых файлах (поиск > найти > найти все во всех открытых файлах)
Если вы загрузите свои изображения в Google Фото, он проиндексирует любой текст, который найдет внутри изображения.
Загрузите скриншоты с кодом сюда: https://pomodoro.semlab.io, и он преобразует их в текст.
Затем вы можете использовать программу Everything от voidtools для поиска нужных вам файлов по тексту.
Попробуй AlomWare Toolbox. Его функция Screenshot Management позволяет искать по скриншотам с помощью OCR (а также копировать текст скриншота с помощью OCR). В отличие от других приложений, AlomWare также сохраняет URL всех снимков страниц, чтобы можно было посетить их позже (что-то типа визуальных закладок)