J'ai pu tester un peu plus en profondeur Textify hier soir… Premiers retours, envies et souhaits de ma part, en partie basés sur mes usages (et frustrations), en les structurant et les priorisant un peu…
Attention, c'est long, et en deux parties (retours sur la version actuelle en premier lieu, puis deuxième partie sur mes idées, envies/souhaits…)
Tests effectués sur la version 1.1
Tout d'abord, bravo, la base et les idées initiales sont bonnes. Quand on voit que l'on migre, même pour de l'océrisation, de plus en plus vers le cloud et des modèles d'abonnements, cela fait plaisir de voir ce genre projet émerger sur macOS, où tout se fait sur la machine, en exploitant les possibilités de l'OS — et j'espère, du hardware avec l'arrivée des Macs Apple Silicon .
- Comme Gwen, je trouve que la version gratuite offre beaucoup, et qu'il y a pour l'instant un déséquilibre avec la version pro.
Perso, je verrais bien également une limite à 5/10 pages analysées et océrisées en simultanées (et cela contenterait déjà pas mal d'usagers), avec export vers le format "PDF OCR". Il pourrait éventuellement y avoir une limite plus haute (avec alors un filigrane sur le PDF généré comme actuellement). Les exports direct dans des formats textes seraient réservés à la version pro.
- Le parcours et les explications/fonctionnalités du passage de la version gratuite vers la version (avec ses avantages) pourrait être également plus clair et explicite.
Mes retours sur la version testée :
Le moteur :
Le même que pour QuickScan donc. Il est très rapide.
- S'il est très efficace et de bonne qualité, même en français, sur du contenu peu mis en page (type rapports multipages avec peu de raffinements typographiques), il a plus de mal avec une maquette un peu plus élaborée, avec des marginalia (notes en marges) ou des textes sur plusieurs colonnes. Je subodore une lecture par ligne du moteur ou une absence/difficulté à reconnaitre les blocs composants la page à océriser.
- De même, quelques difficultés sur des fontes ou des puces un peu plus ésotériques (mots ou éléments non reconnus ou mal), que le passage en noir et blanc ou niveau de gris du document pour la reconnaissance a en partie amélioré (un classique en océrisation). J'ai des exemples de fichiers JPEG et de PDF si vous souhaitez analyser ce qui pose problème.
- Comme Gwen et Baron, je pense que le texte reconnu devrait mieux gérer les retours à la ligne. Si comme cela se présente actuellement, c'est très bien et logique pour un PDF OCR, cela l'est beaucoup moins pour un affichage et un export pur texte. Il devrait effecttivement y avoir, dans l'idéal, un retour chariot à la fin de chaque unité sémantique (paragraphe ou alinéa) comme dit par Baron.
- De même, dans l'idéal, il devrait pouvoir tenter de reconnaitre et d'afficher les formatages, tels les types gras et italiques. Ce qui faciliterait par la suite des exports vers différents types de formats textes comme le RTF, le txt, doc, odt ou md par exemple.
- Sinon le poids en sortie des PDF OCR est vraiment bon (je connais des apps qui produisent des PDF OCR bien plus lourds).
Le workflow :
- Il manque, je trouve à cette première version, des raccourcis claviers de base (ouvrir, océriser, enregistrer, etc.)
- Également absence de possibilité de réorganiser l'ordre des images/PDF dans textify
- Comme avancé pour QuickScan, le support d'autres formats d'images en entrée (TIFF, …).
L'interface :
- Si l'interface est simple, elle s'éloigne un peu des canons de macOS (et encore plus avec Big Sur). Avant de penser à une interface plus élaborée, si l'on pouvait déjà faire varier la largeur de la prévisualisation par rapport au fichier d'origine, ce serait un plus.
- De même, si l'on pouvait éditer la fenêtre de prévisualisation pour pouvoir corriger une coquille, un problème de reconnaissance de mot, de mauvais retour chariot, etc., ce serait un plus avant d'exporter le résultat.
(à suivre…)