Une petite doc

Added by Stéphane Chaudy over 10 years ago

Pour aider mes collègues à démarrer, j'ai écris une petite doc que j'ai mise sur le wiki :
Une documentation par et pour un prof lambda

J'espère bien sûr la faire évoluer à l'avenir. En attendant, n'hésitez pas à me signaler mes erreurs afin que je les corrige le plus rapidement possible.


Replies (20)

RE: Une petite doc - Added by Frédéric Bréal over 10 years ago

Bonjour,

Merci pour la documentation. J'y ai découvert xournal qui me fera économiser de l'encre et du temps.
Pour la numérisation des pages A5 (2 sur 1), j'ai trouvé ce script (testé aujourd'hui uniquement avec mon scanner et 6 feuilles (soit 12 pages).

  1. Créer un dossier appelé ebook, par exemple dans le dossier Documents
  2. Installer pdfposter http://doc.ubuntu-fr.org/pdf (juste au-dessus du paragraphe 3, il y a le lien apt).
  3. Puis dans un document gedit, copier et coller le script en bas du message.
  4. L'enregistrer dans le dossier ebook (ici je l'appelle nomduscript).
  5. Renommer l'extension en sh (je ne sais pas si c'est important).
  6. Lancer un terminal : Ctrl+Alt+T.
  7. Se placer dans le dossier ebook
    cd Documents/ebook 
  8. Taper
      bash nomduscript
    et valider.
  9. Vous obtenez un dossier lien qui contient le pdf original avec l'extension .pdf.old et le fichier découpé avec le même nom que l'original et au format A4.

Mise en garde : cela coupe tous les fichiers pdf présents dans le dossier ebook

#!/bin/bash
#Script fait principalement par sputnick, avec l'aide de spiritus. 2012.
#Utilisation: A mettre dans un répertoire contenant tous vos pdfs

ebookdir=(lien absolu du répertoire contenant vos ebooks)
shopt -s nocaseglob nullglob extglob

rename 'y/ /_/' *.pdf
for f in *.pdf; do
    (
        file="${f}" 
        dirnom="$(sed 's/.\{4\}$//' <<< "$file")" 
        mkdir -p "$ebookdir/$dirnom/" 
        mv "$file" "$ebookdir/$dirnom/" 
        cd "$ebookdir/$dirnom/" 
            pdftk "$file" burst

            for bursted in pg_[0-9][0-9][0-9][0-9].pdf; do
            pdfposter -p 2xa4 "$bursted" "page${bursted#pg}" 
            done

RE: Une petite doc - Added by Frédéric Bréal over 10 years ago

Bonsoir,

Le script est incomplet, je n'ai pas tout correctement copié/collé correctement.
Le lien de la page où se trouve le script http://forum.ubuntu-fr.org/viewtopic.php?id=806571&p=1
Je l'ai mis aussi en pièce jointe.

Pardon pour cette erreur.

a5ena4.sh - Script pour découper des sujets au format A5 en A4 avec la correction des copies (862 Bytes)

RE: Une petite doc - Added by Adèle Sanchez over 10 years ago

Bonjour,

Merci pour ce manuel et ces informations utiles.

Pour ma part, le scanner que j'ai à disposition force une reconnaissance OCR ce qui ne permet pas à AMC d'exploiter directement les PDF produit.

Je procède donc en 3 étapes :
1) Je découpe le fichier PDF pour avoir autant de fichiers PDF que de pages : pdfseparate ~Documents/Cours/Scan_copies.pdf /tmp/PDF/sortie-%d.pdf
2) Ensuite je converti chaque fichier PDF en une image : for i in /tmp/PDF/*; do convert -density 300 $i /tmp/images/$i-e.pjeg; done
3) Enfin, lorsque j'imprime 2 pages en 1, je découpe chaque image en deux pour avoir une seule page par fichier : convert -rotate -90 -crop 50%x100% /tmp/images/*.jpg /tmp/copies_extraites/final.jpg

Cela prends moins de 3 minutes pour traiter 60 feuilles (qui correspondent à 240 pages recto/verso et 2 pages imprimées sur chaque côté).

RE: Une petite doc - Added by Stéphane Chaudy over 10 years ago

Tu peux même supprimer une étape en traitant directement le pdf initial par convert pour obtenir x images jpg :
convert -density 300 QCM_2NDE.pdf copies.jpg

Je retiens le découpage du A4 en deux A5 : merci!

RE: Une petite doc - Added by Frédéric Bréal over 10 years ago

Bonsoir,

J'ai installé xournal pour tester mes sujets mais lors de l'importation du fichier pdf créé par xournal AMC ne reconnaît pas les cases cochées.
J'ai AMC 1.2.1 (svn:1403) et xournal 0.4.7. avec ubuntu 13.10.

Avez-vous ce problème ?

Merci

RE: Une petite doc - Added by Alexis Bienvenüe over 10 years ago

Je pense que cela provient du fait qu'AMC est fait pour traiter des scans. Quand on fait un scan en PDF, c'est en fait une image bitmap (PNG par exemple) empaquetée dans un fichier PDF. Donc AMC utilise la commande pdfimages pour extraire l'image du PDF, sans aucune modification. Si on rajoute des dessins sur un sujet PDF (par exemple avec xournal), il y aura peut-être des images en plus du sujet, qui vont embrouiller AMC.
Si c'est bien cela le problème, il me semble qu'il devrait être résolu en cochant Edition/Préférences/Scan/Conversion des scans/Forcer la conversion : pouvez-vous essayer ?

RE: Une petite doc - Added by Frédéric Bréal over 10 years ago

Bonsoir,

Cela ne fonctionne pas.
Ce n'est pas vraiment très important, je peux test de façon manuelle.

RE: Une petite doc - Added by Alexis Bienvenüe over 10 years ago

Pour essayer de voir ce qui coince, il faudrait un fichier source et un scan modifié avec xournal.

RE: Une petite doc - Added by Adèle Sanchez over 10 years ago

Tu peux envoyer un exemple pour que l'on essaye d'identifier le problème.

Pour ma part, je suis souvent obligée de découper le fichier pdf en plusieurs pages et ensuite de les convertir au format image avec convert comme indiqué précédemment. Peut-être que cela pourra résoudre ton problème aussi.

convert -density 300 fichier.pdf /tmp/images/fichier_destination.jpeg

RE: Une petite doc - Added by Frédéric Bréal over 10 years ago

Bonsoir,

La conversion fonctionne. Il me faudra vérifier si avec l'imprimante du collège, je peux scanner au format jpeg.

Merci

RE: Une petite doc - Added by Adèle Sanchez over 10 years ago

Cela peut résoudre le problème à la source mais certains scans en PDF peuvent directement être intégrés par AMC.

Le JPEG n'est peut-être pas l'idéal non plus. Le notre ne permet que d'envoyer la copie par mail et comme en JPEG il est obligé de faire 1 fichier par page, cela fait autant de mails que de pages... a enregistrer un par un. Autant dire que je savoure le PDF !

RE: Une petite doc - Added by Frédéric Bréal about 10 years ago

Bonsoir,

Mon dernier devoir comportait 4 pages pour 150 élèves. J'ai donc imprimé 2 sur 1 en recto-verso. Après numérisation, j'ai lancé la commande citée et là Ubuntu est resté à tourner pendant 30 minutes.

convert -density 300 QCM_2NDE.pdf copies.jpg

La transformation de A5 à A4 ne s'est jamais faite.

Après recherche, j'ai trouvé cette commande qui transforme le pdf en image pbm :

pdfimages doc-sujet.pdf images

Ce paquet est apparemment inclus dans AMC car je n'ai pas eu à l'installer.

Ensuite, la conversion en A4 et jpg : j'ai dû installer Phatch et faire en deux fois couper et retailler les images avec une rotation pour la page de droite puis coller toutes ces images dans le dossier scan.

RE: Une petite doc - Added by Adèle Sanchez about 10 years ago

Bonsoir Gérard,

Tu as peut-être le même problème que moi. Comme je l'ai indiqué précédemment, il m'est impossible de convertir un fichier PDF directement en images.

Pour ce faire, je réalise les 3 étapes suivantes :

1) Je découpe le fichier PDF pour avoir autant de fichiers PDF que de pages : pdfseparate ~Documents/Cours/Scan_copies.pdf /tmp/PDF/sortie-%d.pdf
2) Ensuite je converti chaque fichier PDF en une image : for i in /tmp/PDF/*; do convert -density 300 $i /tmp/images/$i-e.pjeg; done
3) Découpe de l'image en deux pour avoir une seule page par fichier : convert -rotate -90 -crop 50%x100% /tmp/images/*.jpg /tmp/copies_extraites/final.jpg

Pour traiter 150 copies cela prends un peu moins de 10 minutes le temps de tout réaliser. De mémoire c'est la 1ère étape qui est la plus longue et de très loin puisque les deux autres sont presque instantanées.

Ces 3 étapes fonctionnent pour toi ?

RE: Une petite doc - Added by Frédéric Bréal about 10 years ago

Bonsoir,

Cela fonctionne mais moi qui suis auto-formé à windows et aux interfaces graphiques, j'ai du mal avec la ligne de commande.
Ce soir, j'ai essayé d'adapter le code et je me retrouve avec des erreurs d'entrée de chemins et de sortie, quand il y a plus d'un dossier, que je n'arrive pas à déceler avant. Du coup, je suis obligé de faire cd dossier avant de lancer la commande.
Cela dit mes 150 copies ont été séparées très rapidement, plus vite que pdfimage.

Je vais chercher sur internet comment faire des scripts (avec création des dossier) pour automatiser ces commandes.

RE: Une petite doc - Added by Adèle Sanchez about 10 years ago

Je me suis auto-formé aux lignes de commandes aussi et cela possède certains avantages, notamment en termes de personnalisation et de souplesse.

La commande suivante va chercher le fichier Scan_copies.pdf dans le répertoire Document, lui même dans le répertoire de l'utilisateur. Cela revient donc au même que /home/login/Documents/fichier.pdf

pdfseparate *~*Documents/Cours/Scan_copies.pdf /tmp/PDF/sortie-%d.pdf

Si tu veux découper les fichiers PDF qui sont eux même dans des sous dossiers et les mettre dans un seul dossier de destination tu devrais essayer :

pdfseparate /home/login/Documents/Cours/*.pdf /tmp/PDF/sortie-%d.pdf

S'il ne descend pas dans les sous-répertoires, il faudra utiliser la commande find. Elle permet de trouver des fichiers et ensuite pour chaque résultat d'exécuter une commande. Là je dois partir alors cela ne sera certainement pas correct mais tu devrais essayer quelque chose dans le genre :

find /home/login/Documents/Cours/ -name *.pdf -execdir pdfseparate '{}' /tmp/PDF/sortie-%d.pdf

Si cela ne fonctionne pas, je regarderai ce week end.

Bonne soirée

RE: Une petite doc - Added by Frédéric Bréal about 10 years ago

Bonjour,

Merci pour les commandes.

En général, mes erreurs sont liées à la syntaxe. J'oublie ou je rajoute des espaces, j'oublie le / ou j'inverse avec le \. Il m'a fallu du temps pour aller des les répertoire des disques durs qui son dans /media/login/ et comme en plus mes disques durs sont renommés avec plein de caractères espaces, ça coince (je suis sous dual-boot.

RE: Une petite doc - Added by Frédéric Bréal about 10 years ago

Bonsoir,

Je suis désolé de polluer ce post plus lié à mon incompétence qu'à AMC mais j'ai toujours un problème avec la deuxième ligne.

J'ai crée 3 dossiers dans le dossier ~/Documents :
01-pdf-eclate
02-pdf-en-jpg
03copie-unique-jpg

Mon document pdf se nomme 5_CHIMIE_04_QCM_reponses.pdf et il se trouve dans /Documents.

Je tape le code suivant

pdfseparate ~/Documents/5_CHIMIE_04_QCM_reponses.pdf
 ~/Documents/01-pdf-eclate/5_CHIMIE_04_QCM_reponses-%d.pdf

Pas de problème.

Ensuite je tape le code

 for i in ~/Documents/01-pdf-eclate/*; do convert -density 300 $i ~/Documents/02-pdf-en-jpg/$i-e.jpg; done

Et là j'ai une erreur qui s'affiche et qui se répète et défile en incrémentant le numéro du fichier.

convert.im6: impossible d'ouvrir l'image `/home/moi/Documents/02-pdf-en-jpg/
/home/moi/Documents/01-pdf-eclate/5_CHIMIE_04_QCM_reponses-100.pdf-e.jpg':
 Aucun fichier ou dossier de ce type @ error/blob.c/OpenBlob/2638.

Que dois-je corriger ?

Merci

RE: Une petite doc - Added by Alexis Bienvenüe about 10 years ago

Si vous tapez la commande

echo ~/Documents/01-pdf-eclate/*

dans un terminal, vous voyez que tous les noms de fichiers sont complets : ils commencent par /home/moi/Documents/01-pdf-eclate/.
Ce qui veut dire que la variable $i, dans la boucle for, contient les chemins complets des fichiers. Vous pouvez utiliser basename pour enlever le nom de répertoire et ne garder que le nom de fichier.
for i in ~/Documents/01-pdf-eclate/*; do convert -density 300 $i ~/Documents/02-pdf-en-jpg/`basename $i`-e.jpg ; done

Avec votre code, convert essayer de fabriquer un fichier
/home/moi/Documents/02-pdf-en-jpg//home/moi/Documents/01-pdf-eclate/5_CHIMIE_04_QCM_reponses-100.pdf-e.jpg

mais ne trouvait pas le répertoire
/home/moi/Documents/02-pdf-en-jpg//home/moi/Documents/01-pdf-eclate/

où le mettre...

RE: Une petite doc - Added by Frédéric Bréal about 10 years ago

Bonsoir

merci pour cette formation et votre disponibilité.

RE: Une petite doc - Added by Frédéric Bréal almost 10 years ago

On m'a signalé le logiciel Krop pour transformer des a5 en a4 et les faire pivoter. Pas encore testé.
krop

(1-20/20)