QuickScan : scanner gratuit avec OCR (reconnaissance de texte)

  • Créateur du sujet Créateur du sujet vomi
  • Date de début Date de début
Top !
Hâte de voir ces évolutions.
Et bravo aussi pour votre autre excellente appli, PDfZone.

Bon, à la vue de mes usages et envies , des possibilités actuelles des frameworks proposés par Apple et futures (avec l'arrivée d'iOS 14/Big Sur, des puces Apple Silicon sur Mac avec leur Neural Engine notamment), j'ai encore plein d'autres idées de fonctionnalités — à base d'ICR pour l'écriture manuscrite, d'OLR avec un soupçon de PDFZone, de ML, de NER, de CLI, d'encore plus d'automatisation, de métadonnées, de formats d'export… :)— mais cela nécessiterait également une version Mac pour plus de confort de travail, une légère complexification de l'app — bref, un souhait d'une version pro payante ou d'un logiciel complémentaire à QuickScan en fait ;) .
 
  • J’adore
Réactions: vomi
Désespoir total ! iOS13 requis…
Bon, j'ai plus qu'à remplacer mon vénérable iPhone 6…

Je reviendrai… et je testerai un jour ton app', promis :up:
 
  • J’aime
Réactions: vomi
aaah oui, désolé ! Il y a beaucoup de changements dans les frameworks Apple pour le moment (avec la fusion des plateformes notamment), et donc par facilité j'ai du me rabattre sur iOS13 minimum :shy:
 
Top !
Hâte de voir ces évolutions.
Et bravo aussi pour votre autre excellente appli, PDfZone.

Bon, à la vue de mes usages et envies , des possibilités actuelles des frameworks proposés par Apple et futures (avec l'arrivée d'iOS 14/Big Sur, des puces Apple Silicon sur Mac avec leur Neural Engine notamment), j'ai encore plein d'autres idées de fonctionnalités — à base d'ICR pour l'écriture manuscrite, d'OLR avec un soupçon de PDFZone, de ML, de NER, de CLI, d'encore plus d'automatisation, de métadonnées, de formats d'export… :)— mais cela nécessiterait également une version Mac pour plus de confort de travail, une légère complexification de l'app — bref, un souhait d'une version pro payante ou d'un logiciel complémentaire à QuickScan en fait ;) .
Bonjour Vincent,

je réponds au petit message en italique : peut-être que l'app Textify que j'ai créée pour Mac serait un point de départ pour vos souhaits ? Il s'agit du moteur OCR de QuickScan traduit pour macOS, avec la facilité d'une interface macOS.

Je reste à l'écoute des suggestions :), encore merci !

PS: Textify a été élu "Product of the day" sur ProductHunt :woot:
 
Il faut exporter en PDF, et Textify te proposera de passer en pro.
Merci beaucoup gwen, c'est super sympa !
 
Ah, OK, j'ai exporté en TXT. C'est la seule différence ? Franchement, tu aurais pu faire quelque chose un peu plus contraignant. Bon, je ne vais pas me plaindre. Je vais faire un export en PDF du coup.

Seul truc, tous les retours à la ligne sont conservés, ce qui n'est pas très pratique en format TXT.
 
  • J’aime
Réactions: vomi
Tu penses que je suis trop gentil avec la version gratuite ? Il faudra que je regarde à ça du coup :woot:.

Pour les retours à la ligne, tu veux dire par là que tu préférerais avoir le texte en continu, non "formatté" ?
 
Tu penses que je suis trop gentil avec la version gratuite ? Il faudra que je regarde à ça du coup .

Trop gentil, je ne sais pas. C'est sur que l'export en format texte gratuit, mais en PDF payant ne me semble pas logique. J'aurais plutôt vu l'inverse.

Peut-être que la version gratuite pourrait être limitée à l'analyse de 10 pages simultanées. Là, j'ai analysé 400 pages d'un coup et exporté en texte sans que rien ne me soit demandé.

Surtout, je trouve que ce n'est pas bien expliqué comment on peut passer à la version payante et pourquoi. Il y a juste un mot "Vous utilisez la version gratuite" je pensais qu'en cliquant dessus, j'aurais une explication sur les différences avec la version payante.


Pour les retours à la ligne, tu veux dire par là que tu préférerais avoir le texte en continu, non "formatté" ?

C'est ça, comme si c'était sorti d'un traitement de texte.
 
Pour les retours à la ligne, tu veux dire par là que tu préférerais avoir le texte en continu, non "formatté" ?
C'est ça, comme si c'était sorti d'un traitement de texte.
Le bon fonctionnement serait d'avoir un retour de chariot (Carriage Return) à la fin de chaque unité sémantique (paragraphe ou alinéa) mais pas un retour à la fin de chaque ligne (problème courant quand on copie-colle à partir d'un PDF).

Je ne sais pas ce que fait ton application, n'ayant pas d'appareil pour la tester…
 
vomi a dit:
Bonjour Vincent,

je réponds au petit message en italique : peut-être que l'app Textify que j'ai créée pour Mac serait un point de départ pour vos souhaits ? Il s'agit du moteur OCR de QuickScan traduit pour macOS, avec la facilité d'une interface macOS.

Je reste à l'écoute des suggestions :), encore merci !

PS: Textify a été élu "Product of the day" sur ProductHunt :woot:

C'est de vous ! J'ai effectivement vu passé cette app sur ProductHunt… :)
Je télécharge, teste tout çà et reviens ici vers un débrief ;)
 
  • J’adore
Réactions: vomi
...
C'est ça, comme si c'était sorti d'un traitement de texte.
Je mélange les deux sujets, mais ça pourrait être une idée de fonctionnalité réservée à la version Pro par exemple. Car il est vrai que c'est une très gentille app où la version gratuite offre beaucoup :-).

PS : j'ai rajouté un bouton dans les préférences pour upgrader, car tu es loin d'être le premier à me faire la réflexion.
PPS : j'ai aussi rajouté la possibilité de coller (cmd+v) une image ou un PDF directement dans l'app, pour accélérer le processus :)
 
J'ai pu tester un peu plus en profondeur Textify hier soir… Premiers retours, envies et souhaits de ma part, en partie basés sur mes usages (et frustrations), en les structurant et les priorisant un peu… ;)
Attention, c'est long, et en deux parties (retours sur la version actuelle en premier lieu, puis deuxième partie sur mes idées, envies/souhaits…) :p

Tests effectués sur la version 1.1

Tout d'abord, bravo, la base et les idées initiales sont bonnes. Quand on voit que l'on migre, même pour de l'océrisation, de plus en plus vers le cloud et des modèles d'abonnements, cela fait plaisir de voir ce genre projet émerger sur macOS, où tout se fait sur la machine, en exploitant les possibilités de l'OS — et j'espère, du hardware avec l'arrivée des Macs Apple Silicon .

- Comme Gwen, je trouve que la version gratuite offre beaucoup, et qu'il y a pour l'instant un déséquilibre avec la version pro.
Perso, je verrais bien également une limite à 5/10 pages analysées et océrisées en simultanées (et cela contenterait déjà pas mal d'usagers), avec export vers le format "PDF OCR". Il pourrait éventuellement y avoir une limite plus haute (avec alors un filigrane sur le PDF généré comme actuellement). Les exports direct dans des formats textes seraient réservés à la version pro.
- Le parcours et les explications/fonctionnalités du passage de la version gratuite vers la version (avec ses avantages) pourrait être également plus clair et explicite.

Mes retours sur la version testée :

Le moteur :

Le même que pour QuickScan donc. Il est très rapide.
  • S'il est très efficace et de bonne qualité, même en français, sur du contenu peu mis en page (type rapports multipages avec peu de raffinements typographiques), il a plus de mal avec une maquette un peu plus élaborée, avec des marginalia (notes en marges) ou des textes sur plusieurs colonnes. Je subodore une lecture par ligne du moteur ou une absence/difficulté à reconnaitre les blocs composants la page à océriser.
  • De même, quelques difficultés sur des fontes ou des puces un peu plus ésotériques (mots ou éléments non reconnus ou mal), que le passage en noir et blanc ou niveau de gris du document pour la reconnaissance a en partie amélioré (un classique en océrisation). J'ai des exemples de fichiers JPEG et de PDF si vous souhaitez analyser ce qui pose problème.
  • Comme Gwen et Baron, je pense que le texte reconnu devrait mieux gérer les retours à la ligne. Si comme cela se présente actuellement, c'est très bien et logique pour un PDF OCR, cela l'est beaucoup moins pour un affichage et un export pur texte. Il devrait effecttivement y avoir, dans l'idéal, un retour chariot à la fin de chaque unité sémantique (paragraphe ou alinéa) comme dit par Baron.
  • De même, dans l'idéal, il devrait pouvoir tenter de reconnaitre et d'afficher les formatages, tels les types gras et italiques. Ce qui faciliterait par la suite des exports vers différents types de formats textes comme le RTF, le txt, doc, odt ou md par exemple.
  • Sinon le poids en sortie des PDF OCR est vraiment bon (je connais des apps qui produisent des PDF OCR bien plus lourds).

Le workflow :

  • Il manque, je trouve à cette première version, des raccourcis claviers de base (ouvrir, océriser, enregistrer, etc.)
  • Également absence de possibilité de réorganiser l'ordre des images/PDF dans textify
  • Comme avancé pour QuickScan, le support d'autres formats d'images en entrée (TIFF, …).

L'interface :

  • Si l'interface est simple, elle s'éloigne un peu des canons de macOS (et encore plus avec Big Sur). Avant de penser à une interface plus élaborée, si l'on pouvait déjà faire varier la largeur de la prévisualisation par rapport au fichier d'origine, ce serait un plus.
  • De même, si l'on pouvait éditer la fenêtre de prévisualisation pour pouvoir corriger une coquille, un problème de reconnaissance de mot, de mauvais retour chariot, etc., ce serait un plus avant d'exporter le résultat.

(à suivre…)
 
Dernière édition:
  • J’aime
Réactions: vomi
(seconde partie)

Les envies… :angelic:

Comme nous sommes sur une application macOS, avec une version pro, on peut souhaiter un peu plus de fonctionnalités que QuickScan sur iPhone, en exploitant les spécificités et facilités de macOS, et les attentes plus avancées des utilisateurs par rapport à l'app mobile.
Alors attention, il y a des idées réalisables et utiles pour la majorité des usagers potentiels de votre application, d'autres qui sont plus de l'ordre des envies voire fantasmes par rapport à mes usages, même si certains pourraient aussi s'en servir ou détourner ces fonctionnalités… ;)
Bref, buffet à volonté, mais vous pouvez picorer ce que vous souhaitez… :D

Le moteur :
  • Attente de dictionnaires pour d'autres langues que l'anglais.
  • Souhait de la reconnaissance basique du gras, de l'italique, …
  • Rêve d'une fonction formidable, que l'on retrouve très peu dans les logiciels d'OCR, et qui serait la reconnaissance et le formatage des tableaux présents dans les documents, quelque chose de proche mais complémentaire de PDFZone. L'objectif ici ne serait pas de parasiter votre autre application et ses fonctionnalités avancées, mais outre de classiquement rechercher les données dans un PDF OCR, de pouvoir exporter l'intégralité de ces tableaux et les données présentes (textes, dates, nombres) dans un(des) fichier(s) xls, csv, ou pouvoir les afficher simplement et correctement si le document océrisé est exporté dans des formats textes capable de les gérer.
  • Possibilité de la correction de la perspective des documents sources, comme dans QuickScan, ce qui permettrait d'améliorer la reconnaissance des caractères.
  • Meilleure gestion des maquettes élaborées, (via des blocs ?), des textes sur plusieurs colonnes, des données dans les marges…
  • Edition améliorée et rapide du texte océrisé avant export (corrections manuelles, usage du correcteur orthographique de macOS, formatage de base possible (Gras, italique…)) en utilisant les fonctions de base proposées par l'OS.
  • À moyenne échéance, suivant les possibilités offertes par Apple aux développeurs, le support de la reconnaissance de l'écriture manuscrite (ILR).
  • En vœu pieu, à échéance plus lointaine, des capacités d'OLR (et des formats standards d'exports afférents ALTO, METS…) ce qui pemettrait de faciliter certaines choses, d'en automatiser et d'en faire d'autres formidables… :p
En résumé, l'OLR permet de décrire la structure de la page, le positionnement des différents éléments sur cette dernière, et les catégoriser, très utilisé notamment dans la numérisation de la presse par exemple mais qui pourrait être détourné pour d'autres usages. Bref, une sorte de reconnaissance et une exploitation de super blocs.

Outre l'exemple de la presse (journaux ou magazines) pour chercher dans les textes ou types (manchette, édito, brèves, chroniques, etc.) et leur placement dans les numéros (physiquement et dans le temps), ce genre de chose et fonctionnalité peut par exemple servir pour des historiens et des documents historiques, en littérature avec les marginalia, etc. ou dans des professions avec des éléments normés dans les documents utilisés.

Le workflow :

En entrée :
  • Outre l'import classique des fichiers sources (PDF, JPEG, HEIC, TIFF…) présents sur le Mac via la fonction idoine ou par glisser-déposer, intégration de la fonctionnalité "continuité photo" pour pouvoir directement utiliser son iPhone comme source.
  • Fonction Handoff avec QuickScan.
  • Possibilité d'import via la bibliothèque multimédia de l'app Photos.
  • Intégration de la gestion des scanners.
  • iCloud voire autres clouds.
En sortie :
  • Ajout d'autres formats d'exports en texte des documents océrisés : RTF, doc, odt, Pages, markdown… voir même ePub.
  • Fonction de partage du texte océrisé (via mail, messages, notes, cloud, autres apps…).
Autres :
  • Possibilité de réorganisation des documents multipages (ordre des pages, suppressions de certaines, etc.)
  • Fonction de traitement en série (batch) avec préréglages. Par exemple on glisse tous les documents dans une fenêtre, on choisit le format de sortie, le dossier d'enregistrement et on laisse faire ;)
  • Automatisation possible via Applescript/Automator…
  • Actions/extensions du Finder et/ou Services
  • Contrôle en ligne de commande possible.
  • Édition des métadonnées de base (optionnelle) avant export du document de sortie.
  • Une extension Safari (ou autres navigateurs), pour pouvoir lancer une océrisation d'une image sur une page web directement du navigateur vers Textify.
L'interface :
  • Une interface claire et simple, en trois panneaux par exemple (qui permettrait de faciliter/résoudre la réorganisation des fichiers, la gestion du traitement par lots, etc. ), proche des canons de Catalina et de Big Sur, avec une également une logique de parcours à la PDFZone par exemple, logique que je trouve pas mal et très facile à maîtriser.
 
Dernière édition:
  • J’aime
Réactions: Gwen
Wow ! Merci vincent encore une fois pour ce retour très détaillé.
Je n'ai pas encore tout analysé en détails, mais je peux déjà dire qu'au programme il y a :
  • ajout du dictionnaire français pour un meilleur OCR dans notre langue
  • définition de zones pour limiter l'OCR à une partie de l'image (utile pour les paragraphes par exemple)
  • quelques options de formatage du texte à l'export
  • gestion de l'ordre des images
  • traduction de l'app en français
  • ajout de raccourcis clavier

Je mettrai à jour ce post au fur et à mesure pour informer des mises à jour. Il faut dire que c'est très intéressant d'échanger les idées !
Encore merci
 
Textify est aujourd'hui disponible en version 1.2 :
  • Ajout de raccourcis clavier pour les différentes actions disponibles
  • Correction d'un bug avec les filtres sur des PDFs importés
 
  • J’aime
Réactions: Gwen
C'est au tour de QuickScan de passer en version 2 . Au programme :
  • Prévisualisation du résultat de l'OCR
  • Ajout de l'export vers TXT (sans formattage ;))
  • Amélioration du design des settings
  • Ajout d'un "tip jar" pour les pourboires qui me sont régulièrement demandés (l'app étant gratuite ...) :woot:
  • Ajout d'un raccourci depuis l'écran d'accueil de l'iPhone pour démarrer un scan rapidement
J'espère que ça vous plaira :) . Si vous avez le temps, dites-moi ce que vous en pensez !
(le dictionnaire français va arriver, c'est promis, encore un peu de patience !)

➡️ QuickScan sur l'App Store