Le format PDF

Cette page traite de la gestion des fichiers de type PDF sous Ubuntu.

PDF, un format partiellement fermé

Le PDF, tel que défini par l'ISO en 2008 est un format ouvert. Néanmoins, les logiciels dominants permettant la création de fichiers PDF sont développées par la société Adobe et sont propriétaires. Les PDF générés par les logiciels de cet éditeur ne respectent pas ce standard ISO 1), ce qui rend de fait aujourd'hui le format partiellement fermé.

Lire un fichier PDF

Du fait du caractère semi-fermé du format PDF, Adobe Reader ©, le visionneur propriétaire (et gratuit) d'Adobe ® (avec plugin pour Firefox), est le seul logiciel sur Ubuntu à ce jour permettant de lire correctement tous les fichiers PDF générés par les logiciels de l'éditeur Adobe, notamment les commentaires, annotations et les formulaires XFA. A noter:

  • les versions d'Acrobat Reader © ne semblent pas lire correctement les annotations générées par autre chose que les logiciels Adobe ®.
  • Adobe ne propose plus officiellement de version linux de Adobe Reader. Un paquet .deb est toutefois encore (01/08/2014) disponible. Voir la page Adobe Reader.
  • On peut en revanche installer Adobe Acrobat Reader DC via PlayOnLinux. Voir la page Adobe Reader, 1.2.

Les autres logiciels ne prennent pas en charge les fichiers PDF de type formulaires CERFA. Ceux-ci comportent des champs et une signature électronique (formulaires CERFA de l'Administration Publique Française notamment, disponibles sur la page de téléchargement des différents documents officiels de l'Administration Publique Française) ;

  • Evince : dispose de l'intégration à Firefox. Il est disponible dans les dépôts; le site officiel d'Evince.
  • Okular : Okular est l'afficheur de documents du projet KDE4 SC. Il remplace les anciens logiciels KPDF, KGhostView, Kfax et KDVI, tout en prenant soin de ne pas se cantonner à la seule fonction de logiciel d'affichage du format PDF.
  • XPDF : visionneuse de PDF très léger. NB: semble performant pour lire des PDF contenant des caractères asiatiques.
  • QPDF View : lecteur PDF avec onglets, permettant d'avoir une interface plus riche dans une seule fenêtre. Lit le PostScript, le format DjVu. CUPS pour le support d'impression (à ne pas confondre avec QPDF Viewer sous Android®).
  • MuPDF : autre visionneuse libre, très légère et très performante, disponible dans les dépôts : lien vers le paquet MuPDF. Licence libre GNU AGPL et disponible dans les dépôts officiels. Peut aussi être distribué sous licence non libre pour une utilisation commerciale.
  • zathura : visionneur de documents PDF. Un logiciel extrêmement léger et pratique dont les raccourcis clavier sont basés sur ceux de VIM. La navigation via la souris est également possible. Il n'existe pas encore de page dédiée à Zathura. Vous pouvez télécharger le logiciel sous forme de sources au bas de la page de présentation (onglet "Home") de l'application de la communauté Programs with a Movie Title (tout un programme… ). Pas de procédure clairement répertoriée concernant la francisation du logiciel.
  • Foxit Reader : le développement de la version linux a repris. une nouvelle version (en anglais) est disponible depuis le 8 octobre 2015.
  • PDF Cube : visualiseur de PDF avec effets 3D disponible dans les dépôts à vérifier. lien vers PDF Cube (site anglophone)

Vous trouverez sur ce site non seulement un tableau fournissant des liens vers quelques visionneuses libres, mais surtout un historique du développement et de l'évolution du format PDF qui synthétise les objectifs et les enjeux d'un format que l'on ne peut que souhaiter voir demeurer libre à l'image du protocole fondateur du Web 1.0: j'ai nommé le code HTTP!.

Modifier les textes, images et mise en page d'un fichier PDF

Attention, l'importation entre logiciels offre des résultats assez aléatoires selon la paire de logiciels utilisée.
Les images ne sont pas toujours bien restituées, les polices ne sont pas restituées à l'identique… De plus, les fonctionnalités propriétaires d'Adobe ne sont pas gérées.
  • LibreOffice Draw LibreOffice intègre directement l'ancienne extension pdf-import. il faut toutefois installer libreoffice-pdfimport Version LibreOffice du module PDF-Import.
    Pour importer le fichier PDF avec LibreOffice Draw il faut sélectionner l'option dans la boite de dialogue mais dans le même temps - ne surtout pas oublier de sélectionner le format "PDF - portable document format (Draw)" dans la liste déroulante présélectionnée sur "tous les fichiers".
  • Openoffice.org-pdfimport (dans les dépôts depuis Ubuntu 9.04) ou libreoffice-pdfimport : extension de LibreOffice permettant de modifier des PDF (en les important dans LibreOffice Draw puis en les ré-enregistrant en PDF).
  • Pdfedit : pour éditer vos PDF (moins intuitif que openoffice.org-pdfimport).
  • Inkscape : permet la modification des pdf. Encore à améliorer mais très efficace; quelques fonctionnalités marquantes : enregistre les fichiers au format icone vectoriel SVG et permet de les retravailler; offre le choix de la taille de police; autorise l'importation d'image dans le fichier etc).
  • Evince : permet le transfert de fichiers PDF vers le format d'image vectorielle SVG avant impression vers un éditeur de type Inkscape.
  • Poppler-utils : permet l'extraction de texte, d'images, l'importation vers le format HTML etc…
  • Scribus à partir de la version 1.5 permet d'importer des fichiers PDF multipages (les textes sont toutefois convertis en polygones) et de les éditer dans tous leurs aspects.
  • GIMP : l'éditeur d'images bien connu permet également d'importer des PDF (et les transforme en images).
ATTENTION à choisir une résolution - en Dot-per-Inch (DPI) comprenez Point-Par-Pouce - qui correspondent au résultat espéré.
  • Master PDF Editor : un éditeur complet pour Linux, Mac et Windows.
    Il s'agit d'un logiciel sous licence commerciale. La version à usage privé est gratuite, mais certaines fonctions avancées sont désactivées.
    Semble être un des rares programmes sous linux gérant les formulaires XFA.
Conseils:

L'importation qui fonctionne assez bien et donne des résultats quasi identiques consiste à ouvrir votre PDF dans Evince, à « l'imprimer dans un fichier » au format "dessin vectoriel" SVG puis à ouvrir le document avec Inkscape.

ATTENTION, une seule page à la fois : Evince regroupe toutes les pages sur une seule page.
Quant à LibreOffice Draw il gère bien le texte et la mise en page est sensiblement respectée mais il "oublie" les images.
Inkscape fait un assez bon travail mais modifie légèrement la police du texte. Gimp ne permet pas de modifier le texte (format image).

Pour obtenir un fichier sauvegardé au format PDF à partir des logiciels ci-dessus, ou de n'importe quel autre, il suffit d'imprimer dans un fichier et de choisir PDF comme format de sortie.

La mise en page finale des éléments graphiques d'un PDF modifié dans GIMP au format JPG se fera - par exemple - à l'aide de la fonction "imprimer dans un fichier PDF" du logiciel Gthumb.

Export ou conversion vers un fichier PDF

  • LibreOffice : permet d'enregistrer vos documents (textes, feuilles de calcul, diaporamas) en PDF.
  • scenari : générer des documents vers plusieurs formats dont le PDF (basé sur OpenOffice.org).
  • imagemagick : permet facilement de convertir une ou plusieurs images dans de nombreux formats dont le PDF
  • Scribus : logiciel de PAO qui permet l'export en PDF de qualité professionnelle (accepté par les grandes imprimeries).
  • Cups-PDF : imprimante virtuelle PDF (pour générer des PDF à partir de n'importe quelle application permettant d'imprimer).
  • HtmlDoc: convertir des pages HTML en un document PDF ou PostScript. (non recommandé car pas très performant)
  • WkHtmlToPdf 2) Convertit les pages HTML au format PDF ou image. Utilise le moteur de rendu WebKit (recommandé)
  • CutyCapt 3) Convertit les pages HTML au format PDF ou image, utilise aussi webkit (recommandé)
  • ps2pdf: convertir des fichiers PostScript en PDF.
  • tiff2pdf : convertir vos images en PDF.

Assembler plusieurs JPG en un PDF

Installez ImageMagick grâce à votre gestionnaire de paquet ou en une ligne de commande :

sudo apt-get install imagemagick

Toujours avec le terminal, rendez-vous dans le dossier contenant les jpg a convertir avec la commande cd. Par exemple :

cd/home/mon_nom_d'utilisateur/mon_dossier

Puis, rentrez la commande suivante :

convert *.jpg foo.pdf

La conversion prend plus ou moins de temps en fonction de la qualité et du nombre de fichiers . jpg à convertir.

Un document s'appelant foo.pdf vous attendra dans votre dossier contenant les jpg.

Export ou conversion depuis un fichier PDF

  • pdftohtml : exporter un fichier PDF en fichier HTML.
  • pdftops : exporter un fichier PDF en fichier PS (PostScript). pdftops utilise la librairie poppler.
  • pdf2ps: exporte aussi de PDF en PS (wrapper de la commande gs). Utilise la librairie ghostscript.
  • pdf2tif : Script pour exporter un fichier PDF en fichier Tiff.
  • Le paquet xpdf-utils contient pdftops (convertisseur PDF vers PostScript), pdfinfo (extracteur d'informations de documents PDF), pdfimages (extracteur d'images PDF), pdftotext (convertisseur PDF vers texte) et pdffonts (analyseur de polices PDF).
  • Le paquet xpdf-reader contient pdftoppm, un utilitaire de conversion de fichier PDF vers les formats PBM, PGM et PPM.
  • k2pdfopt : permet de modifier les PDF afin de les rendre plus lisibles sur smartphones et tablettes numériques.
  • SoPDF : pour rendre vos PDF lisibles par les lecteurs Sony Reader.
    • gestionnaire d'eBook permettant également de convertir des PDF en autres formats et inverse
    • Il existe également une ligne de commande permettant de convertir :
      • ebook-convert "source" "destination" --chapter-mark pagebreak

Réduire la taille d'un fichier PDF

  • Copier votre fichier PDF dans votre Dossier personnel.
  • saisir dans un terminal la commande suivante :
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=fichier_reduit.pdf fichier_a_reduire.pdf

Pour plus d'information, consulter cette discussion.

Il est possible aussi d'utiliser pdfmm («pdf moins moins»), un assistant graphique qui permet d'effectuer la même tâche.

Imprimer un livre en cahiers pour le relier à l'ancienne

Un livre classique (non broché) est constitué de cahiers / livrets qui sont reliés entre eux par du fil de couture.

Pour imprimer de tels cahiers, consulter cette discussion sur debian-fr.org, ou bien celle-ci sur ubuntu-fr.org. Les scripts proposés sur ce dernier post permettent de faire de l'imposition très facilement. Pour des pages à A6 à mettre sur du A4 préférez le script de Serged. Pour créer des livrets à partir d'A4 converti en A5 avec une petite interface graphique livret ou encore bookletimposer sont les applications idéales.

NB : Les livres brochés sont constitués uniquement de feuilles collées sur leur tranche. Le livre qui en résulte est moins solide car les pages peuvent se détacher avec le temps, lorsque la colle durcit et se casse. C'est le cas des livres de poche.

Déocériser un PDF (pour empêcher le copié/collé)

Voir cette discussion sur le forum ubuntu-fr.

Ghostscript permet de générer des fichiers PDF 1.3 protégés :

gs -dBATCH -DNOPAUSE -q -sDEVICE=pdfwrite -dEncryptionR=3 -dKeyLength=40 -dPermissions=65472 -sOwnerPassword=null -sOutputFile=sortie.pdf -f Entree.pdf

L'option -dPermissions permet de sélectionner les actions autorisées : ici ni copier, ni coller, ni imprimer n'est autorisé. Ceci permet de garder un fichier de taille faible et de qualité identique.

Il serait très intéressant d'avoir ici une explication détaillée quant aux différentes valeurs possibles pour l'option -dPermissions.

Découpe, fusion, réorganisation, rotation et autres manipulations...

  • Livret réordonne les pages d'un PDF pour avoir une brochure PDF prête à l'impression.
  • bookletimposer crée un livret à partir d'un PDF, ou le contraire, et peut aussi mettre plusieurs pages d'un document sur une seule, pour limiter les copies par exemple (installer le paquet bookletimposer).
  • LibreOffice Draw permet aussi la réorganisation en brochure, la fonction est disponible dans le panneau d'impression (onglet "Mise en page"). Pour exporter en PDF, c'est aussi possible en demandant l'impression dans un fichier (onglet "Options")
  • PDFmod : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi exporter des images, modifier le titre, le sujet, l'auteur, les mots-clés, la table des matières.
  • PDF Chain : pour réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi rajouter un watermark.
  • PDFshuffler : pour supprimer des pages, tourner, assembler, re-arranger vos PDF, et aussi rogner des pages.
  • PDF Split and Merge (PdfSam) : logiciel permettant de réorganiser et faire pivoter les pages et couper/assembler des PDF.
  • briss : pour rogner des PDF par sélection à la souris (pour rogner des pages, essayez aussi PDFshuffler).
  • Krop Permet le recadrage et le redimensionnement de pdf.
  • PDFTK: concaténation, découpage, rotation, compression, modification des propriétés (auteur, etc..)… en ligne de commande
  • GScan 2 PDF : création, concaténation, compression de PDF depuis scanner ou fichiers.
  • flpsed permet d'annoter les formulaires PDF 4).
  • PDF Jumbler : réorganisation de fichier PDF.
  • PDF Crack : pour gérer les PDF protégés par mot-de-passe (pdfcrack).
  • PDF Poster : assemblage de PDF pour créer un poster (pdfposter).
  • PDF Resurrect : pour gérer l'historique de vos PDF (pdfresurrect).
  • Whyte Board : dessiner et annoter des images sur un PDF. (Whyte Board).
  • Master PDF Editor : pour éditer, modifier, protéger, insérer, surligner etc… (site anglophone)
  • Xournal: Xournal permet d'annoter, de surligner, du contenu dans les fichiers PDF.

Cracker un pdf protégé par un mot de passe

Voir aussi


Contributeurs:eagle08.

1)
Adobe ne documente plus le format depuis 2008, tout en continuant à inclure des technologies propriétaires comme par exemple les formulaires PDF, formulaires CERFA, ou XFA, développés depuis la version 9 d'Adobe Reader ©
  • pdf.txt
  • Dernière modification: Le 28/04/2018, 11:14
  • (modification externe)