Gestionando archivos pdf

Archivos PDF

Como todos sabréis los archivos pdf son documentos que se pueden leer en todas la plataformas pero no se pueden manipular.

Vamos a hacer una breve introducción a  pequeñas manipulaciones de archivos pdf siempre y cuando no estén protegidos por contraseña o no tengan  copyright ©.  Esta explicación está pensada para las personas que solo utilizan la informática como usuarios, no para personas expertas. Mostraremos las herramientas más comunes  de las distribuciones Linux que pueden ayudar en la manipulación básica de archivos pdf.

En cuanto al visionado cada entorno gráfico de Linux tiene su propio visor de archivos pdf. Debemos indicar que hace tiempo que Adobe Reader dejo de dar soporte a Linux, aunque aún es posible instalar la versión 11, pero debe quedar claro que no aporta ningún beneficio, pues está muy desfasada y no es necesaria.

Cada entorno gráfico de Linux tiene su correspondiente visor de documentos pdf, así:
- Entorno Maté, visor Atril
- Entorno KDE, visor Okular
- Entorno Gnome, visor Evince

Pero solo son visores no permiten más que esto, no editan campos vacíos como la ultimas versiones de Adobe Reader.  Con la versión 11 Adobe tampoco es posible  rellenar campos vacíos, como los que se proponen en muchos formularios actuales de las administraciones. Es, pues, una función que seguramente  no tardará mucho en tenerse en las distros Linux, pero actualmente aún no existe.
Veamos diferentes programas para manipular archivos pdf y que funciones básicas pueden hacer.

Pdfarranger, krop o pdfkt

Los tres programas son similares y hacen prácticamente lo mismo.
 
PDF Arranger antes se conocía anteriormente como PDF-Shuffler.

Es un interfaz que permite  reordenar, fusionar, dividir, rotar, recortar o reorganizar páginas; es, por tanto, una herramienta sencilla  pero muy útil para manipular archivos pdf, veamos la siguiente imagen:



En cambio, no está previsto que sea una herramienta que permita el cambio de texto ni dibujos.
 
Existe otros programas parecidos en cuanto a funcionamiento llamados krop y pdfkt.
 
LibreOffice Draw

La serie ofimática LibreOficce reserva su programa "Draw" para la manipulación de los archivos pdf, primero los permite importar y guardar en su formato propio para luego manipularlos con sus propias herramientas.

Pero como LibreOffice Draw permite convertir el documento PDF a su formato para facilitar la edición del mismo, ya se pueden hacer muchas funciones como: insertar fotos, cambiar textos, introducir nuevos párrafos, etc.

Luego se puede exportar a formato pdf, indicando qué páginas queremos exportar. En el caso de no quererlas todas, funciona igual que en la impresión de documentos, donde se pueden indicar las páginas que se quieren imprimir separando el número de la página por comas, etc.

Si lo utilizamos con regularidad veremos que resulta potente y útil para su manipulación.






















Inkscape

También es una potente herramienta que permite modificar documentos pdf tanto texto como imágenes. Permite, también, sustituir imágenes o cambiarlas de medida, etc. Al igual que LobriOffice Draw primero se importan y luego se guardan en su formato para luego manipularlo con todas sus herramientas.

Además, permite cambiar los elementos de texto y imágenes de la propia página, igual como si fueran dibujos, veamos las dos siguientes imágenes:

Para editar el texto solo deben dar doble-click sobre el elemento deseado con lo se activa el modo edición. Si se guarda el archivo como nuevo, permite tener el original que hemos cambiado en su formato propio y también se puede exportar a pdf directamente o cualquier otro formato.

































Por tanto, con la combinación de las tres herramientas anteriores, podemos hacer muchas modificaciones sobre los documentos pdf que seguramente no nos habíamos planteado.

Existen webs libres que cogen nuestro documento en pdf y lo pasan a formato de texto txt, por ejemplo esta web, aunque que no es la única:
 
 
También pueden escanearse y luego con un OCR obtener el texto correspondiente, pero siempre debemos indicar que sólo pueden cogerse textos en documentos autorizados, en ningún caso aquellos sobre los que hay una propiedad intelectual. Precisamente el formato pdf está pensado para que nadie pueda manipular o copiar.