OCR en Ubuntu

El otro día leí un artículo referente al reconocimiento óptico de caracteres (OCR) en Ubuntu, y me quedó ahí, grabado en la mente, a la espera de que llegara el fin de semana para probarlo. Así que esta mañana, me he dedicado a investigar un poco en referencia a este tema, y he probado dos alternativas.

La primera de las dos alternativas es la de instalar un paquete creado por Geza Kovacs. Que se puede instalar desde Launchpad, añadiendo al repositorio de las maneras conocidas:

1
sudo -v

2

3
sudo add-apt-repository ppa:gezakovacs/pdfocr

4

5
sudo apt-get update

6

7
sudo apt-get install pdfocr

para hacerlo funcionar simplemente:

`1`	`pdfocr -i inputfile.pdf -o outputfile.pdf`

Ya está. El archivo tiene una capa de texto incrustada, que puedes utilizar para copiar y pegar.

La segunda alternativa es más gráfica y me gusta más. Consiste en instalar desde el repositorio de Ubuntu gscanpdf

`1`	`sudo` `apt-get` `install` `tesseract-ocr-spa gscan2pdf`

Para hacerlo funcionar, corremos gscan2pdf desde un terminal, y obtendremos la siguiente imagen:

importamos las imágenes que queramos someter al OCR

En herramientas seleccionamos OCR, y en la ventana que nos sale seleccionamos el motor de OCR que queramos utilizar:

En la parte inferior, veremos los caracteres detectados por el OCR. En la prueba que he realizado tengo que decir que el resultado fue bastante deficiente. No se si es por utilizar Lorem Ipsum, pero no me resultó nada alentador.

OCR en Ubuntu

Poradmin

Por admin

Entrada relacionada

¡VMWare Workstation Pro y Fusion Pro ahora son gratuitos para uso personal!

Actualizaciones de seguridad septiembre de 2023

Notepad++ 8.57: Nueva actualización con mejoras de seguridad y rendimiento

Deja una respuesta Cancelar la respuesta

You missed

React2Shell: Vulnerabilidad Crítica de RCE en React Server Components (CVE-2025-55182)

Vulnerabilidad Crítica en Sneeit Framework (CVE-2025-6389): Más de 131.000 Intentos de Explotación Bloqueados

Vulnerabilidad Crítica en WPBakery Page Builder Permite Inyección de Scripts Maliciosos

Vulnerabilidades Críticas en WP Travel Engine Comprometen Más de 20,000 Sitios de Viajes en WordPress

Ads Blocker Detected!!!

Ads Blocker Detected!!!

Poradmin

Noticias de informática:

Por admin

Entrada relacionada

Deja una respuesta Cancelar la respuesta

You missed

Ads Blocker Detected!!!

Ads Blocker Detected!!!