Cases cochées non reconnues

Added by Thibaud Hulin about 3 years ago

Bonjour

j'ai importé un scan des copies (toutes différentes) dans AMC. Les copies semblent bien reconnues, les cases sont au bon endroit, mais aucune case n'est considérée comme validées alors qu'elles sont noircies. La sensibilité est à 10.
J'ai tâché de varier dans les préférences / scan les valeurs du seuil de noirceur par défaut à 0.35, et le seuil maximal est à 1.0, sans succès... ?
Je joins le scan, les options, fichier de debug via ce lien : https://drive.google.com/file/d/1v5fUAmhEeUOvN1RPnVzeCM4oxRqBZApp/view?usp=sharing

Merci,
Thibaud

Ubuntu 20.04.1 LTS
AMC 1.4.0

options.xml (2.6 kB)


Replies (15)

RE: Cases cochées non reconnues - Added by Alexis Bienvenüe about 3 years ago

Votre scanner produit des PDF en superposant plusieurs images, ce qui perturbe AMC. En effet, pour gagner du temps, AMC essaye tout d'abord d'extraire toutes les images du PDF, sans interpréter la façon avec laquelle le PDF dit de les combiner.
Vous pouvez réessayer en cochant la case Préférences/Scan/Conversion des scans/Forcer la conversion, ou, si cela ne marche toujours pas, en convertissant les pages du scan en JPG par exemple, avec

convert scan_copies.pdf scans-%d.jpg

puis en transmettant les pages jpg obtenues à AMC.
La commande utilisée par AMC en premier est la suivante : vous pouvez voir ce que ça donne, et pourquoi cela peut perturber les résultats…

pdfimages scan_copies.pdf scans-par-pdfimages

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

Avez-vous bien sélectionné 300 dpi ?
Le scan n'est pas en N&B mais couleur, cela peut expliquer la non reconnaissance.

Ce que je fais dans ce genre de situation :
  • Convertir le pdf en image
    pdftoppm scans-copies.pdf scans-copies-images
    
  • convertir en N&B et en png (juste pour l'espace occupé sur le disque)
    mogrify -format png -threshold 80% *.ppm
    
  • supprimer les ppm (juste pour l'espace occupé sur le disque)
    rm scans-copies-images*.ppm
    

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

Messages croisés, la commande pdfimages fait la même chose que pdftoppm mais je crois que le format de sortie est automatiquement adapté au pdf si je ne dis pas de bétises.

RE: Cases cochées non reconnues - Added by Thibaud Hulin about 3 years ago

Bonjour,

merci pour vos messages. Malheureusement cela ne change pas le résultat. Lorsque je clique sur le zoom d'une page, je vois bien toutes les cases entassées bien reconnues, cochées ou non (en fait triées par ordre de noirceur), mais elles apparaissent toutes dans le champ des cases non cochées.

J'ai passé le dpi de 200 à 300, coché ou non la case Convertir. J'ai baissé le seuil de noirceur à 0.15 (le max étant 1).
Après la modification des réglages (et validation éventuelle du changement de noirceur au document actuel), je clique sur Saisie/Automatique et je vais sélectionner les images converties (ppm ou png), en choisissant Copier dans le dossier.
J'obtiens une boîte de dialogue qui me dit : "Certaines pages soumises (il y en a déjà 18) ont déjà été traitées précédemment. Les anciennes ont été remplacées.".
J'obtiens ce message même après avoir supprimé les fichiers du dossier data.
Lorsque je produis les images avec la commande pdfimages utilisée par AMC, je n'obtiens pas d'erreur mais les images produites sont en partie en inversion vidéo ou avec uniquement les cases cochées (c'est moins compréhensibles que lorsqu'on utilise convert).

Détail de la sortie des commandes :

PPage : +11/9/20+
Page : +7/9/54+
Page : +3/9/32+
Page : +5/7/14+
VAR+: overwritten
VAR+: overwritten
===<analyse>=+0.0555555555555556
VAR+: overwritten
===<analyse>=+0.0555555555555556
Page : +4/9/22+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +20/9/50+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +9/7/38+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +24/7/18+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +19/9/60+
Page : +6/9/4+
VAR+: overwritten
===<analyse>=+0.0555555555555556
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +1/9/52+
VAR+: overwritten
===<analyse>=+0.0555555555555556
Page : +23/7/26+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +10/7/30+
VAR+: overwritten
===<analyse>=+0.0555555555555556
Page : +25/7/10+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +2/9/42+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +22/7/34+
===<analyse>=+0.0555555555555556
VAR+: overwritten
Page : +8/7/46+
===<analyse>=+0.0555555555555556
Page : +21/7/42+
VAR+: overwritten
VAR+: overwritten
===<analyse>=+0.0555555555555556
VAR+: overwritten
===<analyse>=+0.0555555555555556
===<analyse>=+0.0555555555555556
===<analyse>=+1

RE: Cases cochées non reconnues - Added by Alexis Bienvenüe about 3 years ago

Pouvez-vous joindre votre fichier source afin que nous puissions faire des essais ?

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

En modifiant les valeurs de seuil du projet, ça fonctionne.
Préférences > Projet > seuil de noirceur = 0.5 et seuil de noirceur supérieur =1

J'ai encore la version 1.4.0+git2021-01-05b

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

Le seuil de noirceur supérieur signifie que toute valeur > à ce seuil sera considérée comme une case non cochée.
C'est valable uniquement si les élèves font des croix ainsi ils peuvent "effacer" la case, et donc annuler la réponse, en la coloriant entièrement.
Comme vos élèves colorient, la valeur doit rester à 1 sinon AMC considère que ce n'est pas colorié.

RE: Cases cochées non reconnues - Added by Thibaud Hulin about 3 years ago

Alors cela vient d'ailleurs car ça ne résout pas mon souci...
J'ai mis la valeur noirceur à 0.5
Je clique sur Automatique, je sélectionne mes fichiers images au format png (copier les scans dans le répertoire, est coché).
Je clique sur une plage, bouton Zooms : aucune case cochée...

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

J'ai copié les fichiers png ailleurs puis effacé toutes les copies dans l'interface saisie et recommencé la saisie.

RE: Cases cochées non reconnues - Added by Thibaud Hulin about 3 years ago

Oui, j'ai bien effacé toutes les images dans le dossier ; j'ai essayé aussi avec le bouton Effacer... j'ai réinstallé AMC avec apt et l'option --purge...
Et si j'utilisais votre fichier options.xml ?

RE: Cases cochées non reconnues - Added by Frédéric Bréal about 3 years ago

Je ne pense pas que cela change car le fichier xml est créé au moment de la création du dossier et j'ai pris simplement votre archive.

options.xml (2.9 kB)

RE: Cases cochées non reconnues - Added by Thibaud Hulin about 3 years ago

Effectivement.
SVP, pourriez-vous me renvoyer le dossier une fois la reconnaissance automatique des cases effectuées ? ça m'éviterait de devoir cliquer sur toutes les cases à la main...

RE: Cases cochées non reconnues - Added by Thibaud Hulin about 3 years ago

C'est très curieux. Lorsque je me place dans votre répertoire et que j'efface les scans puis que je les réimporte, la reconnaissance des cases cochées fonctionne. En revanche, lorsque je fais la même opération dans mon répertoire, ça ne fonctionne pas.
A mon avis la fonction d'effacement des scans est incomplète ; il doit rester des éléments corrompus dans la base de données.

Merci beaucoup pour l'aide en tout cas !

(1-15/15)