Commande de converson PDF -> PNG

Added by Eric Le Gallais over 11 years ago

Toujours dans l'objectif d'utiliser AMC en ligne de commande seulement, j'aimerais connaître la commande qu'AMC utilise pour la conversion des PDFs vers png.
J'utilise pdfseparate pour générer un pdf par page et par la suite convert pour les convertir en PNG, mais l'opération est très longue...


Replies (8)

RE: Commande de converson PDF -> PNG - Added by Eric Le Gallais over 11 years ago

J'ai activé le mode debug pour voir si la commande était dans le DEBUG, mais ce n'est pas le cas.

RE: Commande de converson PDF -> PNG - Added by Alexis Bienvenüe over 11 years ago

En effet cette action est pour l'instant gérée directement par AMC-gui. Il faudra changer ça...
AMC-gui utilise

convert -density 300 scan.pdf +adjoin scan.png
pour cela (à la fois découpage grâce à +adjoin et conversion en PNG), mais ce n'est pas satisfaisant. Dans la plupart des cas, je pense qu'il vaudrait mieux partir de pdfimages.

RE: Commande de converson PDF -> PNG - Added by Eric Le Gallais over 11 years ago

Je viens de faire un test avec pdfimages, c'est beaucoup plus rapide.

pdfimages -j fichier.pdf fichier

Ceci dit, les pages impaires sont tête dessus, tête dessous.
Heureusement, AMC fait une rotation des images, alors tout fonctionne.

RE: Commande de converson PDF -> PNG - Added by Alexis Bienvenüe over 11 years ago

À partir de la révision r1222, la conversion et le découpage initiaux des fichiers de scans est externalisée dans la commande AMC-getimages : vous pouvez essayer quelque chose comme

auto-multiple-choice getimages --list /tmp/liste.txt --orientation portrait --copy-to $PROJET/scans scan.pdf
auto-multiple-choice analyse --liste-fichiers /tmp/liste.txt [...]

Pour les fichiers PDF, cette commande essaye pdfimages en premier lieu, et devrait donc être raisonnablement efficace.

RE: Commande de converson PDF -> PNG - Added by Eric Le Gallais over 11 years ago

Ok, je vais tester ça.

Pour avoir fait certaines conversion de mon côté avec pdfimages dans les dernières semaines, il arrive que pdfimages même avec l'argument "-j" crée des fichiers pbm plutôt que des jpeg.
L'effet pervers malgré la rapidité de traitement est que les fichiers sont souvent en mode paysage et ne sont pas reconnus par AMC-analyse.
J'ai donc également ajouté un script BASH qui vailde l'orientation des fichiers PBM et qui fait une rotation lorsque nécessaire.

Est-ce que getimages fait la même chose?
Dans l'ordre, voici ce que je fais:

1- séparation des pages en images:

pdfimages -j fichiers-scannés ./scans/file

2- identification des pages vides:
for file in ./scans/*; do
    export IMAGE_VIDE=`convert -quiet $file -shave 1%x1% -resize 40% -fuzz 10% -trim -format %wx%h +repage info:`
    if [ "$IMAGE_VIDE" == "1x1" ];then
        mv $file ./scans-blank-images 
    fi
done

3- Validation orientation des pages:
for file in ./scans/* ; do
    export DIMENSION=`identify -format "%w:%h" $file`
    LARGEUR=`echo $DIMENSION | cut -d : -f 1`
    HAUTEUR=`echo $DIMENSION | cut -d : -f 2`
si largeur > hauteur: /usr/bin/convert -rotate "-90" $FICHIER $FICHIER-rotate
done

RE: Commande de converson PDF -> PNG - Added by Alexis Bienvenüe over 11 years ago

J'ai donc également ajouté un script BASH qui vailde l'orientation des fichiers PBM et qui fait une rotation lorsque nécessaire.
Est-ce que getimages fait la même chose?

Oui, c'est le but de l'option --orientation portrait : effectuer une rotation de 90° quand nécessaire pour mettre toutes les pages en portrait.

RE: Commande de converson PDF -> PNG - Added by Eric Le Gallais over 11 years ago

Dans mon cas, je fais une rotation de 90 degrés peu importe si la page est tête dessus, tête dessous.
Est-ce que getimages positionne les marqueurs d'identification de la page dans le haut de la page?

RE: Commande de converson PDF -> PNG - Added by Alexis Bienvenüe over 11 years ago

Est-ce que getimages positionne les marqueurs d'identification de la page dans le haut de la page?

Non, c'est analyse qui se change de cela.

(1-8/8)