guide utilisateur readiris pro 12

88
Readiris TM Pro 12 Guide Utilisateur

Upload: claudedubois

Post on 05-Jul-2015

377 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 Guide Utilisateur

Page 2: Guide Utilisateur ReadIris Pro 12
Page 3: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

iii

Table des matières

Copyright ............................................................................................ 1 

Chapitre 1 Présentation de Readiris ........................................ 3 

Gain de temps et élimination du travail de réencodage ..... 3 

Famille de produits Readiris ............................................. 6 

Chapitre 2 Installation de Readiris .......................................... 9 

Configuration requise ........................................................ 9 

Installation du logiciel ....................................................... 9 

Désinstallation du logiciel ............................................... 10 

Enregistrement du logiciel .............................................. 11 

Assistance produits ......................................................... 11 

Chapitre 3 Mise en route ........................................................ 13 

Exécution de Readiris ..................................................... 13 

Interface utilisateur ......................................................... 14 

Modification de la langue de l'interface utilisateur ......... 16 

Configuration du scanner dans Readiris .......................... 16 

Chapitre 4 Utilisation de Drop2Read .................................... 19 

Chapitre 5 Numérisation et ouverture de documents .......... 21 

Sélection des options....................................................... 21 

Ouverture de fichiers image ............................................ 22 

Numérisation de documents papier ................................. 24 

Page 4: Guide Utilisateur ReadIris Pro 12

Table des matières

iv

Chapitre 6 Optimisation des documents numérisés ............. 29 

Chapitre 7 Zonage des documents ......................................... 35 

Zonage automatique des documents ............................... 35 

Zonage manuel des documents ....................................... 37 

Utilisation des modèles de zonage .................................. 43 

Chapitre 8 Reconnaissance des documents ........................... 47 

Introduction ..................................................................... 47 

Sélection de la langue du document ................................ 48 

Définition des caractéristiques du document ................... 51 

Utilisation de l'apprentissage interactif ........................... 53 

Utilisation des dictionnaires de polices ........................... 56 

Chapitre 9 Formatage et enregistrement de documents ...... 59 

Formatage de documents ................................................ 59 

Sélection des options de mise en page ............................ 62 

Sélection des options d'image ......................................... 65 

Enregistrement des documents en tant que fichiers image ................................................................................ 67 

Création de documents PDF ........................................... 68 

Sélection des options PDF .............................................. 70 

Adaptation des documents PDF ...................................... 72 

Sélection de la taille de page ........................................... 73 

Page 5: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

v

Chapitre 10 Enregistrement et chargement des paramètres 75 

Chapitre 11 Reconnaissance de texte manuscrit ................... 77 

Index .................................................................................... 79 

Page 6: Guide Utilisateur ReadIris Pro 12
Page 7: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

1

Copyright

ReadirisPro12-dgi-290609-01

Copyright ©1987-2009 I.R.I.S. Tous droits réservés.

I.R.I.S. détient les droits d'auteur couvrant le logiciel Readiris, le système d'aide en ligne et la présente publication.

Les informations figurant dans ce document sont la propriété d'I.R.I.S. Elles sont sujettes à modification sans préavis et ne représentent pas un engagement de la part d'I.R.I.S. Le logiciel décrit dans le présent document est fourni sous accord de licence stipulant les conditions d'utilisation de ce produit. Le logiciel peut être utilisé ou copié uniquement conformément aux conditions de cet accord. Aucune partie de la présente publication ne peut être reproduite, transmise, stockée dans un système de récupération ou traduite dans une autre langue sans l'autorisation écrite préalable d'I.R.I.S.

Ce guide utilisateur utilise des noms fictifs à des fins de démonstration. Les références à des personnes, sociétés ou organisations réelles sont strictement fortuites.

Marques commerciales

Le logo Readiris, Readiris et Drop2Read sont des marques commerciales d'Image Recognition Integrated Systems S.A. Technologies d'OCR, d'ICR et de codes à barres par I.R.I.S. Technologies AutoFormat et Linguistic par I.R.I.S. Technologies de BCR et d'analyse de champs par I.R.I.S. Technologie de compression iHQC par I.R.I.S. Le segmenteur XML a été développé par Apache. Ce produit comprend le logiciel développé par Apache Software Foundation.

Tous les autres produits mentionnés dans le présent guide utilisateur sont des marques commerciales ou déposées de leurs propriétaires respectifs.

Page 8: Guide Utilisateur ReadIris Pro 12
Page 9: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

3

CHAPITRE 1 PRÉSENTATION DE READIRIS

GAIN DE TEMPS ET ÉLIMINATION DU TRAVAIL DE

RÉENCODAGE

Introduction

Merci d'avoir acheté Readiris. Ce logiciel vous apportera sans nul doute une aide précieuse dans le réencodage de vos textes, tableaux, graphismes, codes à barres et textes manuscrits.

Quelle que soit l'efficacité des ordinateurs, le travail préalable de saisie des informations reste une étape incontournable. Si vous avez déjà retapé un rapport de 15 pages ou un grand tableau de chiffres, vous savez combien cette tâche peut être longue et fastidieuse. Utilisez ce logiciel d'OCR à la pointe du progrès pour convertir automatiquement des documents papier ou des fichiers image numérisés en documents modifiables et entièrement indexés qu'il est possible d'archiver et de partager.

Numérisez un document imprimé ou dactylographié, indiquez les zones auxquelles Readiris doit appliquer la reconnaissance (ou laissez au système le soin de le faire pour vous), exécutez la reconnaissance des caractères et exportez le document dans votre programme de traitement de texte. Les documents comptant de nombreuses pages sont traités d'une seule traite. Quelques clics de souris vous permettent d'éviter de longues heures de travail tandis que Readiris convertit vos documents papier en fichiers

Page 10: Guide Utilisateur ReadIris Pro 12

Chapitre 1 – Présentation de Readiris

4

électroniques modifiables : il offre des performances 40 fois supérieures à la frappe manuelle.

Pour accélérer encore davantage le processus, vous pouvez recourir à l'utilitaire Drop2Read. Il vous suffit de préciser les paramètres de base (langue de reconnaissance, format de sortie, dossier de destination et application cible) et de faire glisser vos documents numérisés vers l'icône du Dock. Vos documents seront traités à la volée.

Informations générales

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation.

Readiris assure également la reconnaissance des données tabulaires et les recrée sous la forme de feuilles de calcul dans votre tableur ou en tant qu'objets tableau dans votre application de traitement de texte. Les données numériques sont directement prêtes à être traitées.

Readiris prend en charge jusqu'à 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris en capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel. Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc., sont écrits à l'aide des symboles occidentaux.

Page 11: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

5

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance et non après. En conséquence, il exécute la reconnaissance de tous les types de documents avec une précision optimale, y compris les documents de piètre qualité, les télécopies et les impressions matricielles. Il n'a aucune difficulté à traiter les documents mal copiés ou numérisés contenant des caractères trop clairs ou trop foncés. Il est en mesure de résoudre des caractères liés et de reconstituer les caractères incomplets ou fragmentés, tels que les symboles matriciels.

En outre, Readiris offre une fonction de vérification utilisateur. Lorsqu'elle est activée, la fonction de vérification utilisateur (apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées.

Pour accroître encore votre productivité, Readiris, non content d'effectuer la reconnaissance des textes, peut également les formater pour vous. Plusieurs niveaux de formatage sont disponibles. Lorsque vous utilisez le ”formatage automatique”, Readiris recrée une copie fidèle du document numérisé : le formatage des mots, des paragraphes et des pages du document d'origine est préservé. Le système utilise des types de caractères, des tailles et des styles similaires à ceux utilisés dans le document source pendant la reconnaissance. L'emplacement des colonnes, des blocs de texte et des images respecte également les documents d'origine. Readiris peut même inclure la photo en arrière-plan de la page numérisée dans le document de sortie de la reconnaissance. En outre, puisqu'il prend en charge la numérisation couleur et à niveaux de gris, vous

Page 12: Guide Utilisateur ReadIris Pro 12

Chapitre 1 – Présentation de Readiris

6

pouvez reproduire n'importe quelle image, dessin au trait, photos en noir et blanc et illustrations en couleur. Lorsqu'un document contient des tableaux, Readiris les réorganise dans de véritables cellules et recrée les bordures de cellule des tableaux d'origine.

En d'autres termes, Readiris vous offre la possibilité d'archiver une copie fidèle de vos documents et de les convertir en fichiers texte compacts et modifiables au lieu de simples images numérisées.

Readiris est compatible avec Twain et Image Capture et prend en charge un large éventail de scanners à plat et à feuilles, de périphériques tout-en-un et multifonctions mais aussi d'appareils photo numériques.

FAMILLE DE PRODUITS READIRIS

La famille de produits Readiris se décline en plusieurs versions :

Readiris Pro 12

Readiris Corporate 12

Readiris Pro 12 Asian

Readiris Corporate 12 Asian

Le tableau ci-dessous présente les caractéristiques des différentes versions :

Readiris Pro 12 Readiris Corporate 12

Fonctionnalités de base Fonctionnalités de base

125 langues reconnues 125 langues reconnues

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument

Page 13: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

7

Text, DOCX, XLSX, HTML, RTF et Unicode.

Text, DOCX, XLSX, HTML, RTF et Unicode.

Génération de sorties PDF/A

Reconnaissance d'importants volumes

Traitement automatisé

Reconnaissance des codes à barres

Reconnaissance des cartes de visite

Readiris Pro 12 Asian Readiris Corporate 12 Asian

Fonctionnalités de base Fonctionnalités de base

130 langues reconnues, y compris : 130 langues reconnues, y compris :

Japonais

Chinois simplifié et chinois traditionnel

Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Japonais

Chinois simplifié et chinois traditionnel

Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Génération de sorties PDF/A

Reconnaissance d'importants volumes

Traitement automatisé

Reconnaissance des codes à barres

Reconnaissance des cartes de visite

Page 14: Guide Utilisateur ReadIris Pro 12

Chapitre 1 – Présentation de Readiris

8

Chinois simplifié et chinois traditionnel

Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Chinois simplifié et chinois traditionnel

Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Génération de sorties PDF/A

Reconnaissance d'importants volumes

Traitement automatisé

Reconnaissance des codes à barres

Reconnaissance des cartes de visite

Page 15: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

9

CHAPITRE 2 INSTALLATION DE READIRIS

CONFIGURATION REQUISE

La configuration minimale suivante est nécessaire pour exécuter Readiris :

Ordinateur Mac OS avec processeur Intel ou G3.

Système d'exploitation Mac OS X 10.4 ou version ultérieure. Les versions antérieures du système d'exploitation Mac OS ne sont pas prises en charge.

220 Mo d'espace libre sur le disque.

INSTALLATION DU LOGICIEL

Procédure d'installation de Readiris :

Ouvrez une session dans le logiciel d'exploitation de votre Mac en tant qu'utilisateur de niveau administrateur. Assurez-vous de disposer des droits d'administrateur requis pour installer le logiciel.

Branchez votre scanner à votre Mac et installez le logiciel qui l'accompagne. Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner.

Page 16: Guide Utilisateur ReadIris Pro 12

Chapitre 2 – Installation de Readiris

10

Insérez le CD-ROM de Readiris et double-cliquez sur l'icône du CD-ROM.

Double-cliquez sur le programme d'installation de Readiris et suivez les instructions s'affichant à l'écran.

Acceptez les conditions du contrat de licence.

Le type d'installation standard est proposé. Cette option installe Readiris, Drop2Read et les échantillons d'images.

Pour changer de type d'installation, cliquez sur Personnaliser.

Cliquez sur Installer pour lancer l'installation.

Une fois l'installation terminée, cliquez sur Terminer. Le dossier Readiris est créé automatiquement dans le dossier Applications par le programme d'installation. Les icônes Readiris et Drop2Read sont automatiquement ajoutées dans le Dock.

DÉSINSTALLATION DU LOGICIEL

Pour désinstaller Readiris :

Cliquez sur Finder et ouvrez le dossier Applications.

Faites glisser le dossier Readiris vers la Corbeille.

Readiris est supprimé de votre ordinateur.

Remarque : les préférences Readiris ne sont pas supprimées lorsque vous faites glisser le dossier Readiris vers la Corbeille, afin que vous

Page 17: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

11

puissiez réinstaller le logiciel par la suite si vous le souhaitez. Pour supprimer les préférences, faites glisser le dossier Readiris Prefs vers la Corbeille. Ce dossier se trouve dans le chemin Utilisateurs - xxx (votre nom d'utilisateur) - Bibliothèque - Préférences.

ENREGISTREMENT DU LOGICIEL

N'oubliez pas d'enregistrer votre licence Readiris. Cet enregistrement vous procurera divers avantages :

Vous serez tenu informé du développement de nouveaux produits et des produits I.R.I.S. associés.

Vous aurez droit à l'assistance produits.

Vous bénéficierez d'offres spéciales sur les produits I.R.I.S.

Pour enregistrer le logiciel :

Cliquez sur Enregistrer Readiris dans le menu Aide. Vous serez redirigé sur la page Web d'enregistrement. Suivez simplement les instructions affichées à l'écran.

ASSISTANCE PRODUITS

Dès que vous avez enregistré votre produit, vous bénéficiez de l'assistance I.R.I.S. pour toutes les fonctionnalités de base du logiciel. Pour contacter I.R.I.S. :

Europe : www.irislink.com/support Tél. :+32 10 45 13 64

Page 18: Guide Utilisateur ReadIris Pro 12

Chapitre 2 – Installation de Readiris

12

Etats-Unis : www.irislink.com/support Tél. :+1 800 447 4744

Asie-Pacifique : www.irislink.com/support Tél. : +852 22646133

Page 19: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

13

CHAPITRE 3 MISE EN ROUTE

EXÉCUTION DE READIRIS

Pour exécuter Readiris :

Cliquez sur l'icône Readiris dans le Dock.

Vous pouvez également double-cliquer sur l'icône de l'application Readiris dans le dossier Readiris sous Applications.

Si vous avez acheté la version Readiris Corporate, le système vous invite à enregistrer le logiciel. Cliquez sur S'enregistrer par Internet et effectuez la procédure d'enregistrement pour acquérir votre clé logicielle.

Saisissez ensuite la clé logicielle reçue par e-mail dans le champ requis.

L'interface Readiris s'affiche.

Page 20: Guide Utilisateur ReadIris Pro 12

Chapitre 3 – Mise en route

14

INTERFACE UTILISATEUR

L'interface de Readiris se compose des éléments suivants :

Barre d'outils principale (barre d'outils de gauche)

Utilisez les commandes de la barre d'outils principale pour la numérisation et la reconnaissance manuelle des documents.

Barre d'outils Image (barre d'outils de droite)

Utilisez les boutons de la barre d'outils Image pour modifier des documents dans l'interface de Readiris.

Pointez sur les différents boutons pour afficher leur infobulle.

Barre de menus Readiris (haut de l'écran) La barre de menus Readiris contient toutes les commandes et options également présentes dans les barres d'outils principale et Image. La barre de menus Readiris vous permet en outre de définir plusieurs paramètres avancés.

Page 21: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

15

Lorsque vous ouvrez ou numérisez un document dans Readiris, vous pouvez voir ses miniatures de page dans le tiroir à images. Cliquez sur l'icône du tiroir pour l'ouvrir.

Le tiroir peut s'ouvrir tant à droite qu'à gauche de l'interface Readiris, en fonction de sa position à l'écran.

Le tiroir vous permet de déplacer les pages à l'intérieur d'un document : il suffit de cliquer sur les pages à déplacer et de les faire glisser à l'endroit voulu. Il permet de marquer les pages en tant que couvertures et de modifier la langue de reconnaissance par page en appuyant sur la touche Ctrl et en cliquant sur la langue voulue.

Page 22: Guide Utilisateur ReadIris Pro 12

Chapitre 3 – Mise en route

16

Le tiroir vous permet de supprimer des pages en les faisant glisser vers la Corbeille dans le Dock.

MODIFICATION DE LA LANGUE DE L'INTERFACE

UTILISATEUR

Lorsque Readiris s'ouvre, l'interface utilisateur s'affiche dans la langue actuellement sélectionnée dans vos préférences système.

Pour modifier la langue de l'interface utilisateur de Readiris :

Cliquez sur l'icône Préférences Système dans le Dock.

Ouvrez ensuite la section International.

Faites glisser la langue de votre choix en haut de la liste et fermez la fenêtre International.

L'interface utilisateur de Readiris est disponible dans plusieurs langues.

Redémarrez Readiris pour appliquer les nouveaux paramètres de langue.

CONFIGURATION DU SCANNER DANS READIRIS

Readiris prend en charge les scanners compatibles Twain 1.9 et Image Capture.

Page 23: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

17

Cependant, pour pouvoir utiliser un scanner, ses pilotes doivent être installés sur votre Mac.

Procédure :

Branchez votre scanner à votre Mac et installez le logiciel et/ou les pilotes qui l'accompagnent. Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner.

Exécutez Readiris.

Dans le menu Readiris, cliquez sur Préférences.

Une fois les pilotes du scanner installés correctement, une liste des scanners pris en charge s'affiche. Sélectionnez votre modèle de scanner dans cette liste.

Assurez-vous de sélectionner l'option Activer les scanners Image Capture lorsque vous utilisez un scanner Image Capture.

Différentes options de scanner et de prétraitement sont disponibles.

Reportez-vous à la section Numérisation des documents papier pour plus d'informations.

Page 24: Guide Utilisateur ReadIris Pro 12
Page 25: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

19

CHAPITRE 4 UTILISATION DE DROP2READ

Drop2Read est un utilitaire simple mais néanmoins efficace qui permet la reconnaissance instantanée des documents, sans que vous n'ayez à afficher Readiris. L'utilitaire Drop2Read est installé dans le cadre de l'installation par défaut de Readiris.

Pour traiter des documents :

Il suffit de faire glisser vos documents vers l'icône Drop2Read dans le Dock.

La fenêtre Drop2Read s'ouvre et Drop2Read traite vos documents en appliquant les paramètres par défaut.

Par défaut, Drop2Read traite les documents comme des documents en anglais, les formate comme des fichiers RTF et les enregistre dans le dossier source des fichiers d'origine.

Page 26: Guide Utilisateur ReadIris Pro 12

Chapitre 4 – Utilisation de Drop2Read

20

Cliquez sur la liste pour modifier les paramètres. Tous les paramètres modifiés sont enregistrés lorsque vous fermez la fenêtre Drop2Read. La prochaine fois que vous voudrez traiter des documents au moyen des mêmes paramètres, il suffira de les faire glisser vers l'icône Drop2Read dans le Dock.

Notez que Drop2Read utilise des paramètres de base. Utilisez Readiris si vous souhaitez appliquer des paramètres avancés lors du traitement de documents.

Conseil : pour plus d'informations sur les formats de sortie disponibles, consultez la section Formatage de documents. Pour rappel, toutes les options ne s'appliquent pas à Drop2Read.

Page 27: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

21

CHAPITRE 5 NUMÉRISATION ET OUVERTURE DE

DOCUMENTS

SÉLECTION DES OPTIONS

Avant de numériser des documents papier ou d'ouvrir des fichiers image, vous pouvez sélectionner plusieurs options d'optimisation d'images. Lorsqu'elles sont sélectionnées, ces options sont appliquées lors de l'ouverture et de la numérisation des documents.

Procédure

Cliquez sur le bouton Options dans la barre d'outils principale pour sélectionner diverses options d'optimisation d'images.

o Cliquez sur Redressement des pages pour corriger l'angle éventuel des pages numérisées.

Si vous avez oublié d'activer cette option, cliquez sur l'icône Redresser la page de la barre d'outils Image ou cliquez sur la commande correspondante du menu Action. L'image sera redressée et l'analyse de page sera executée à nouveau.

Page 28: Guide Utilisateur ReadIris Pro 12

Chapitre 5 – Numérisation et ouverture de documents

22

o Cliquez sur Détection de l’orientation des pages pour faire pivoter les pages automatiquement afin qu'elles soient orientées correctement.

Notez que ces deux options ralentissent quelque peu la numérisation. Ne les sélectionnez qu'en cas de nécessité.

o Cliquez sur Elimination du bruit et déplacez le curseur pour indiquer la taille des points que vous désirez supprimer des images binarisées.

Les options précitées sont également disponibles dans le menu Configuration.

o L'option Analyse de page est activée par défaut.

De cette façon, les images numérisées ou ouvertes sont automatiquement découpées en zones.

Vous pouvez également utiliser les outils de zonage de la barre d'outils Image pour modifier les résultats de l'analyse de page ou pour appliquer un zonage manuel aux documents. Pour plus d'informations, consultez la section Zonage manuel des documents.

Lorsque vous avez terminé de sélectionner les options voulues, cliquez sur le bouton Numériser ou Ouvrir pour numériser les documents ou ouvrir les fichiers image.

OUVERTURE DE FICHIERS IMAGE

Readiris vous permet de traiter des documents papier numérisés avec votre scanner ou de traiter des fichiers image existants de différents formats.

Page 29: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

23

Pour ouvrir des fichiers image existants :

Cliquez sur le bouton Ouvrir pour rechercher des fichiers image.

Conseil : vous pouvez également faire glisser les fichiers image vers l'icône Readiris dans le Dock pour les ouvrir.

Conseil : tout en maintenant la touche Ctrl enfoncée, cliquez sur le fichier image à ouvrir, pointez ensuite sur Ouvrir avec et cliquez sur Readiris. Le logiciel Readiris s'ouvre et affiche l'image.

Conseil : lorsque vous chargez des documents PDF et des fichiers image de plusieurs pages (images TIFF), vous pouvez définir l'étendue de pages (dans le cas où vous avez uniquement besoin d'un chapitre spécifique d'un document, par exemple).

Readiris prend en charge les formats d'image suivants : GIF, JPEG, JPEG 2000, MacPaint, Photoshop, PICT, PNG, QuickDraw GX, QuickTime, Silicon Graphics, Targa, TIFF (non compressés ou compressés de type PackBits et Group 3), TIFF multipages, Windows Bitmap (BMP), et images de document PDF.

Sélectionnez le fichier image de votre choix et cliquez sur Ouvrir.

Pour effectuer un zoom avant sur l'image ouverte, utilisez la loupe de la barre d'outils Image ou appuyez sur la touche Commande et cliquez à l'intérieur de l'image.

Vous pouvez également ouvrir plusieurs fichiers image simultanément :

o Sélectionnez le premier fichier image puis, tout en maintenant la touche Commande enfoncée, sélectionnez les autres images.

Page 30: Guide Utilisateur ReadIris Pro 12

Chapitre 5 – Numérisation et ouverture de documents

24

o Vous pouvez également sélectionner une plage de fichiers image contigus en sélectionnant la première image et la dernière tout en maintenant la touche Maj enfoncée.

Si vous voulez mettre fin au processus de chargement, appuyez sur la touche Echap.

Lorsque vous ouvrez plusieurs fichiers image simultanément, le tiroir s'ouvre et affiche les miniatures de page.

Notez que vous pouvez également faire glisser-déposer les fichiers image du Bureau vers l'icône Readiris dans le Dock pour les ouvrir.

Remarque : lorsque vous cliquez sur le bouton Ouvrir de la barre d'outils principale après avoir enregistré le document actif, vous êtes invité à indiquer si vous voulez supprimer ce document. Cliquez sur Non pour ajouter les fichiers image au document généré suite à la reconnaissance ou sur Oui pour créer un nouveau document.

NUMÉRISATION DE DOCUMENTS PAPIER

Readiris vous permet de traiter des documents papier que vous pouvez numériser avec votre scanner ou de traiter des fichiers image existants de différents formats.

Pour numériser des documents :

Sélectionnez les paramètres du scanner. Pour y accéder, dans le menu Readiris, cliquez sur Préférences.

Page 31: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

25

Assurez-vous que votre scanner est connecté à votre Mac et configuré correctement. Si ce n'est pas le cas, les paramètres du scanner s'affichent.

Numériseur

Sélectionnez votre modèle de scanner dans la liste. Readiris prend en charge les scanners compatibles Twain et Image Capture.

Remarque : certains scanners prenant en charge à la fois les pilotes Twain et Image Capture peuvent apparaître deux fois dans la liste.

Calibrer

Cliquez sur le bouton Calibrer si vous devez effectuer un calibrage de votre scanner.

Format

Vous pouvez sélectionner le format de numérisation automatique ou un format personnalisé, pour lequel vous pouvez indiquer la hauteur et la largeur de page.

Profondeur

Readiris prend en charge les images noir et blanc, couleur et en niveaux de gris.

Page 32: Guide Utilisateur ReadIris Pro 12

Chapitre 5 – Numérisation et ouverture de documents

26

Résolution

Sélectionnez une résolution de numérisation de 300 ppp.

Inverser l'image

Dans certains cas, les scanners Twain affichent du texte blanc sur fond noir lors de la numérisation en noir et blanc. Pour inverser les résultats, sélectionnez l'option Inverser l'image.

Remarque : cette option est disponible uniquement avec les scanners Twain.

La fenêtre Préférences propose également plusieurs options de prétraitement :

o Vous pouvez choisir de lisser les images en niveaux de gris et en couleurs.

Cette fonction agit pendant la numérisation en lissant les différences d'intensité, de sorte que les images couleur et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration). Le lissage représente parfois la seule solution pour distinguer le texte d'un arrière-plan coloré.

Remarque : cette fonction n'agit pas de la même façon que celle figurant dans les options Ajuster l'image accessible via le menu Action.

o Sélectionnez Traiter comme 300 ppp lorsque vous traitez des images dont la résolution n'est pas correcte ou connue. Les images seront traitées comme si elles possédaient une résolution de 300 ppp.

La plupart du temps, la résolution des photos numériques est inconnue.

o Sélectionnez Appareil photo numérique lorsque vous utilisez un appareil photo numérique comme source de

Page 33: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

27

numérisation. Readiris fait appel à des routines de reconnaissance spéciales pour traiter les images obtenues au moyen d'un appareil photo numérique.

Readiris prend en charge les appareils photo Sony, HP, Canon, Casio et Fuji comme sources de numérisation. Notez toutefois que vous pouvez charger des photos TIFF et JPEG existantes provenant de tous types d'appareils photo.

Conseils en cas d'utilisation d'un appareil photo numérique comme source de numérisation :

Calibrez l'appareil en prenant une photo d'un document de couleur blanche.

Sélectionnez toujours la résolution d'image la plus élevée.

Activez le mode macro de l'appareil afin de faire un gros plan.

Utilisez uniquement le zoom optique et non numérique.

Placez l'appareil photo directement au-dessus du document. Evitez de photographier ce dernier sous un angle quelconque.

Prenez des photos stables. Le cas échéant, utilisez un pied.

Désactivez le flash si vous photographiez un papier brillant.

Evitez d'ouvrir les photos compressées.

Adaptez les paramètres de contraste et de luminosité de Readiris à l'environnement (lumière du jour, artificielle, néon).

Sélectionnez couleur ou niveaux de gris comme mode couleur.

Une fois les paramètres définis, cliquez sur OK.

Cliquez ensuite sur le bouton Numériser pour numériser les documents.

Page 34: Guide Utilisateur ReadIris Pro 12

Chapitre 5 – Numérisation et ouverture de documents

28

Remarque : faites attention au désalignement. Un désalignement supérieur à 0,5 augmente le risque d'erreurs de reconnaissance OCR.

Page 35: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

29

CHAPITRE 6 OPTIMISATION DES DOCUMENTS

NUMÉRISÉS

Pendant la reconnaissance, Readiris convertit les images en couleurs et en niveaux de gris en images en noir et blanc binarisées, puis leur applique la reconnaissance OCR. Lorsque vous ouvrez ou numérisez des images en couleurs ou en niveaux de gris très claires ou très foncées, il est parfois nécessaire d'optimiser leurs équivalents binarisés avant de procéder à leur reconnaissance afin d'obtenir des résultats OCR satisfaisants.

Pour optimiser les images :

Ouvrez ou numérisez un document couleur ou en niveaux de gris.

Vérifiez que les paramètres du scanner sont corrects.

Dans le menu Action, cliquez sur Ajuster l'image. Vous pouvez également cliquer sur l'icône correspondante dans la barre d'outils Image.

Readiris utilise des routines de binarisation intelligentes pour convertir les images couleur ou en niveaux de gris en images en noir et blanc, utilisées pour la reconnaissance OCR.

o Sélectionnez Lisser les images en niveaux de gris et en couleurs pour obtenir une image plus homogène.

Page 36: Guide Utilisateur ReadIris Pro 12

Chapitre 6 – Optimisation des documents numérisés

30

Grâce à cette option, qui lisse les différences d'intensité, les images en couleurs et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration).

Remarque : cette option semble équivalente à celle du menu Préférences mais elle est appliquée au cours d'une phase différente du processus de reconnaissance.

Remarque : le lissage représente parfois la seule manière de distinguer le texte d'un arrière-plan coloré.

(Image d'origine)

(Image en noir et blanc binarisée)

(Image lissée)

o Utilisez le curseur pour augmenter ou diminuer la valeur de luminosité.

Les paramètres de luminosité déterminent la luminosité globale de l'image. Utilisez-les pour foncer ou éclaircir l'image lorsque le texte est illisible.

Exemple 1 : éclaircir une image sombre afin d'éliminer l'arrière-plan de la page.

Page 37: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

31

(Image couleur)

(Image numérisée. Les paramètres de binarisation par défaut génèrent une image noire.)

(L'image éclaircie donne des résultats de reconnaissance satisfaisants.)

Exemple 2 : foncer une image lorsque le texte est tellement clair qu'il n'apparaît pas dans l'image binarisée.

(Image couleur)

(Image numérisée. Les paramètres de binarisation par défaut génèrent des caractères fragmentés.)

Page 38: Guide Utilisateur ReadIris Pro 12

Chapitre 6 – Optimisation des documents numérisés

32

(L'image plus foncée donne des résultats de reconnaissance satisfaisants.)

o Utilisez le curseur pour augmenter ou diminuer la valeur de contraste.

Les paramètres de contraste déterminent le contraste entre les zones plus claires et plus foncées d'une image. Utilisez-les pour faire ressortir les formes des caractères dans un arrière-plan coloré.

(Image couleur)

(Les paramètres de contraste par défaut génèrent des caractères fragmentés.)

(Des paramètres de contraste plus élevés donnent des résultats de reconnaissance satisfaisants.)

o Utilisez le curseur pour augmenter ou diminuer les valeurs des options Eliminer le bruit.

L'élimination du bruit permet d'enlever des petites taches dans les images en noir et blanc.

Page 39: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

33

Remarque : cette fonction d'élimination du bruit n'est pas la même que celles du menu Configuration et de la barre d'outils principale (sous Options) ; elle s'applique aux images binarisées tandis que les deux autres sont appliquées pendant la numérisation.

Cliquez sur Appliquer pour afficher un aperçu des résultats.

Si les résultats sont satisfaisants, cliquez sur OK pour enregistrer les paramètres et quitter. Dans le cas contraire, cliquez sur Annuler et modifiez à nouveau les paramètres.

Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance du document.

Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier.

Il est également possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier.

Page 40: Guide Utilisateur ReadIris Pro 12
Page 41: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

35

CHAPITRE 7 ZONAGE DES DOCUMENTS

ZONAGE AUTOMATIQUE DES DOCUMENTS

Lorsque vous numérisez ou ouvrez des documents, Readiris exécute automatiquement la fonction Analyse de page pour fractionner les documents en plusieurs zones.

L'option Analyse de page est activée par défaut. Cliquez sur le bouton Options et désactivez Analyse de page si vous souhaitez éviter l'analyse de page automatique.

Les résultats de l'analyse de page peuvent être modifiés manuellement après l'analyse de page automatique. Pour plus d'informations, consultez la section Zonage manuel des documents.

Les résultats de l'analyse de page peuvent également être enregistrés dans un fichier de zonage, que vous pouvez réutiliser en tant que modèle de zonage chaque fois que vous numériser des documents présentant une mise en page similaire. Pour plus d'informations, consultez la section Utilisation des modèles de zonage.

Page 42: Guide Utilisateur ReadIris Pro 12

Chapitre 7 – Zonage des documents

36

Types de zones

Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit.

L'analyse de page détecte automatiquement les zones de texte, d'image, de tableau et de code à barres. Les zones de texte manuscrit doivent être tracées manuellement.

Pour plus d'informations, consultez la section Zonage manuel des documents.

Chaque type de zone possède sa propre icône :

Les zones sont triées de haut en bas et de gauche à droite. Des numéros indiquent l'ordre de tri des zones. Il est toutefois possible de modifier l'ordre de tri et les types de zones. Pour plus d'informations, consultez la section Zonage manuel des documents.

Ne pas détecter les zones sur les bords

Lorsque votre scanner génère des bordures noires autour de l'image, l'analyse de page a tendance à détecter des zones là où il n'y a que du bruit.

Pour empêcher ce type de détection, cliquez sur Ne pas détecter les zones sur les bords dans le menu Zones et renumérisez le document.

Encadrer une région à analyser

En guise d'alternative au zonage automatique des documents, il est possible d'utiliser la fonction Encadrer une région à analyser. Cette fonction est utile lorsque la reconnaissance OCR ne doit

Page 43: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

37

s'appliquer qu'à une seule zone spécifique dans les pages du document.

Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image.

Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance. Cliquez ensuite sur Reconnaître + Enregistrer.

Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif.

ZONAGE MANUEL DES DOCUMENTS

En plus du zonage automatique des documents réalisé à l'aide de l'analyse de page, Readiris permet d'appliquer un zonage manuel aux documents.

Le zonage manuel est pratique lorsque vous devez modifier les résultats de l'analyse de page automatique. Il permet également de créer des modèles de zonage.

Pour plus d'informations sur les modèles, consultez la section Utilisation des modèles de zonage.

Notez que les zones de texte manuscrit doivent toujours faire l'objet d'un zonage manuel.

Procédure

Pour appliquer un zonage manuel à un document, commencez par cliquer sur le bouton Options puis désactivez Analyse de page.

Page 44: Guide Utilisateur ReadIris Pro 12

Chapitre 7 – Zonage des documents

38

Ouvrez ou numérisez le document en cliquant sur le bouton Numériser ou Ouvrir.

Sélectionnez le type des zones que vous souhaitez définir : cliquez sur l'icône représentant un pointeur dans la barre d'outils de droite et sélectionnez le type de zone voulu.

Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit.

Dessinez un cadre autour des zones à analyser.

Pour plus d'informations sur la reconnaissance des codes à barres et du texte manuscrit, consultez les sections Reconnaissance des codes à barres et Reconnaissance de texte manuscrit.

Pour sélectionner d'autres types de zones, cliquez sur l'icône du type de zone actuellement sélectionné, puis choisissez le type de zone voulu.

Vous pouvez également cliquer sur le menu Zones, puis pointer sur Mode interactif et sélectionner la zone à définir.

Page 45: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

39

Lorsque la définition des zones de reconnaissance est terminée, cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance OCR.

Tri des zones

Pour modifier l'ordre de tri des zones, cliquez sur le bouton Trier dans la barre d'outils Image et cliquez successivement sur les différentes zones dans l'ordre voulu.

Vous pouvez également cliquer sur le menu Zones puis sur Trier les zones.

Pour terminer le tri, cliquez à l'extérieur d'une zone.

Une fois terminé, cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance.

Les zones non sélectionnées sont exclues de la reconnaissance.

Dessin de polygones

Le zonage manuel de documents n'est pas limité à des formes rectangulaires. Vous pouvez créer des zones polygonales en fusionnant des zones rectangulaires. Chaque fois que deux zones du même type se touchent, elles forment automatiquement un polygone.

Page 46: Guide Utilisateur ReadIris Pro 12

Chapitre 7 – Zonage des documents

40

Analyse de page automatique

Si la page active est trop complexe pour un zonage manuel, cliquez sur le bouton Analyser la page dans la barre d'outils Image afin de réaliser un zonage automatique de la page.

Notez que les zones de texte manuscrit et de code à barres doivent toujours être délimitées manuellement.

Modification du type de zone

Pour modifier le type de zone, appuyez sur la touche Ctrl et cliquez sur la zone puis sélectionnez le type de zone requis.

Vous pouvez également changer simultanément le type de plusieurs zones :

Page 47: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

41

Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image, puis cliquez sur Sélectionner des zones.

Conseil : si l'icône représentant un pointeur n'est pas visible dans la barre d'outils Image, cela signifie que l'un des cinq types de zones est actuellement sélectionné. Cliquez sur les icônes correspondantes dans la barre d'outils, puis cliquez sur Sélectionner des zones.

Tout en maintenant la touche Maj enfoncée, sélectionnez plusieurs zones.

Dans le menu Zones, pointez sur Type de zone et cliquez sur le type de zone souhaité.

Modification de la taille d'une zone

Cliquez dans la zone à modifier.

Placez le pointeur de la souris sur un marqueur (sur les côtés et dans les angles de la zone).

Cliquez sur le marqueur et faites glisser le pointeur de la souris afin de modifier la taille de la zone.

Déplacement de zones

Sélectionnez la zone à déplacer.

Page 48: Guide Utilisateur ReadIris Pro 12

Chapitre 7 – Zonage des documents

42

Cliquez à l'intérieur de la zone et faites glisser le pointeur de la souris afin de modifier la position de la zone.

Reconnaissance d'une zone spécifique

Appuyez sur la touche Ctrl et cliquez sur la zone auxquelles appliquer la reconnaissance, puis sélectionnez Copier le texte.

Les résultats sont envoyés au Presse-papiers en tant que texte continu. Cette commande fonctionne également pour le texte manuscrit.

Il est également possible de copier les zones d'image et les zones de code à barres dans le Presse-papiers.

Reconnaissance de toutes les zones de texte

Pour soumettre toutes les zones de texte d'une page à la reconnaissance, cliquez sur la commande Copier les zones de texte dans le menu Zones. Ces zones sont copiées dans le Presse-papiers.

Reconnaissance de toutes les zones d'image

Pour soumettre tre toutes les zones d'image d'une page à la reconnaissance, cliquez sur la commande Copier les zones d'image dans le menu Zones. Ces zones sont copiées dans le Presse-papiers.

Suppression de zones

Sélectionnez la ou les zones à supprimer ou cliquez sur la commande Supprimer toutes les zones dans le menu Zones.

Sélectionnez les commandes Couper ou Effacer dans le menu Edition pour couper ou supprimer les zones.

Page 49: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

43

Suppression de petites zones

Certains documents, les télécopies par exemple, comportent des points « dispersés » sur les pages, ce qui conduit Readiris à créer des zones inutiles qui ne contiennent pas de texte.

Pour effacer toutes ces zones de petite taille, cliquez sur Supprimer les petites zones dans le menu Zones.

Cette option efface toutes les zones de taille inférieure à 0,5" et retrie les zones restantes.

UTILISATION DES MODÈLES DE ZONAGE

Lorsque vous effectuez une reconnaissance d'un grand nombre de documents présentant une mise en page similaire, il peut être utile d'avoir recours aux modèles de zonage plutôt qu'à l'analyse de page. De cette façon, la même structure de zones est appliquée à tous les documents numérisés ou ouverts, ce qui permet d'accélérer le processus.

Procédure

Cliquez sur Options dans la barre d'outils principale et désactivez Analyse de page.

Ouvrez votre document et procédez au zonage manuel de la première page du document à l'aide des boutons de la barre d'outils Image.

Pour plus d'informations, consultez la section Zonage manuel des documents.

Dans le menu Zones, cliquez sur la commande Enregistrer.

Page 50: Guide Utilisateur ReadIris Pro 12

Chapitre 7 – Zonage des documents

44

Ouvrez ou numérisez les autres pages du document en cliquant sur le bouton Numériser ou Ouvrir dans la barre d'outils principale.

Les zones sont appliquées aux documents ouverts ou numérisés.

Si vous souhaitez appliquer le même modèle de zonage la prochaine fois que vous utilisez Readiris, cliquez sur la commande Ouvrir dans le menu Zones.

Encadrer une région à analyser

En guise d'alternative aux modèles de zonage, il est possible d'utiliser la fonction Encadrer une région à analyser. Celle-ci vous permet de définir la zone spécifique de la page devant faire l'objet de la reconnaissance. Toutes les données à l'extérieur de la zone d'OCR sont exclues de la reconnaissance.

Procédure

Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image.

Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance.

Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif.

Pour annuler cette fonction, réexécutez l'analyse de page en cliquant sur le bouton Analyser la page dans la barre d'outils Image.

Cliquez sur Reconnaître + Enregistrer pour exécuter l'OCR.

Page 51: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

45

Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier.

Il est possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier.

Page 52: Guide Utilisateur ReadIris Pro 12
Page 53: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

47

CHAPITRE 8 RECONNAISSANCE DES

DOCUMENTS

INTRODUCTION

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance. Cette méthode lui permet d'effectuer la reconnaissance du texte, des tableaux, des images, des codes à barres et du texte manuscrit dans tous les types de documents. Readiris traite même les documents disposés en colonnes complexes ou de piètre qualité, les télécopies, les impressions matricielles, les documents mal numérisés ou copiés contenant des caractères trop clairs ou trop foncés, etc.

Readiris prend en charge 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris est capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel. Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc. sont écrits à l'aide des symboles occidentaux.

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est

Page 54: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

47

CHAPITRE 8 RECONNAISSANCE DES

DOCUMENTS

INTRODUCTION

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance. Cette méthode lui permet d'effectuer la reconnaissance du texte, des tableaux, des images, des codes à barres et du texte manuscrit dans tous les types de documents. Readiris traite même les documents disposés en colonnes complexes ou de piètre qualité, les télécopies, les impressions matricielles, les documents mal numérisés ou copiés contenant des caractères trop clairs ou trop foncés, etc.

Readiris prend en charge 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris en capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel. Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc. sont écrits à l'aide des symboles occidentaux.

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est

Page 55: Guide Utilisateur ReadIris Pro 12

Chapitre 8 – Reconnaissance des documents

48

complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation.

En outre, Readiris offre une fonction de vérification utilisateur. Lorsqu'elle est activée, la fonction de vérification utilisateur (apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées.

Les résultats de l'apprentissage interactif peuvent être enregistrés de façon permanente dans des dictionnaires de polices pour utilisation ultérieure.

SÉLECTION DE LA LANGUE DU DOCUMENT

Readiris offre des fonctionnalités d'OCR dans 125 langues. Il prend en charge toutes les langues d’Amérique et d’Europe, y compris les langues d’Europe centrale, les langues baltes, le grec, le turc et le cyrillique.

Readiris Pro Asian et Readiris Corporate Asian permettent en outre la reconnaissance des documents en japonais, en chinois simplifié et traditionnel ainsi qu'en coréen.

Pour que Readiris puisse exécuter la reconnaissance d'un document, vous devez préciser sa langue.

Page 56: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

49

Pour ce faire, procédez comme suit :

Cliquez sur l'icône représentant un globe dans la barre d'outils principale et sélectionnez la langue de votre choix dans la liste déroulante.

Important : sélectionnez la langue du document avant d'exécuter l'analyse de page lorsqu'il s'agit de documents asiatiques, hébreux ou arabes. Des routines d'analyse de page spécifiques sont utilisées pour ces documents.

Conseil : au cas où vous voudriez effectuer la reconnaissance de documents multilingues, veillez à sélectionner la langue comportant le jeu de caractères le plus étendu. Par exemple, pour la reconnaissance d'un document contenant du texte en anglais et en français, sélectionnez le français comme langue du document. De cette façon, les accents seront reconnus correctement.

La reconnaissance peut également être limitée à un jeu de caractères numérique pour optimiser la reconnaissance des tableaux et des chiffres. Readiris reconnaît alors uniquement les chiffres entre 0 et 9 ainsi que les symboles suivants :

+ signe plus

* astérisque

/ barre

% pourcentage

, virgule

Page 57: Guide Utilisateur ReadIris Pro 12

Chapitre 8 – Reconnaissance des documents

50

oblique

. point

( parenthèse d'ouverture

) parenthèse

de fermeture

- tiret

= signe égal

$ dollar

£ livre sterling

€ euro

¥ yen

Pour activer le mode numérique, sélectionnez Numérique dans la boîte de dialogue Langue.

Reconnaissance de documents multilingues

Readiris permet également d'activer la reconnaissance de jeux de caractères mixtes. De cette façon, Readiris change automatiquement de langue en milieu de phrase et reconnaît les mots anglais (noms propres, etc.) conservés dans des langues dites "exotiques".

Cliquez sur le bouton représentant un globe dans la barre d'outils principale et sélectionnez la combinaison de langues de votre choix dans la liste déroulante.

Remarque : lors du traitement de documents en arabe ou en hébreu, les jeux de caractères mixtes sont automatiquement utilisés.

Sélection de la langue par page

Si certaines pages utilisent une autre langue que la totalité du document, il n'est pas nécessaire de définir une langue secondaire. Il est possible d'appliquer une langue différente à ces pages.

Sélectionnez la ou les pages en question dans le tiroir, cliquez dessus tout en maintenant la touche Ctrl enfoncée, puis utilisez la commande Langue pour leur affecter une autre langue que la langue du document.

Page 58: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

51

Les pages dont la langue est différente de celle de la langue du document sont marquées en rouge dans le tiroir.

Remarque : une infobulle accompagne chaque page dans le tiroir pour indiquer la langue qui lui est appliquée.

DÉFINITION DES CARACTÉRISTIQUES DU

DOCUMENT

Outre la langue du document, d'autres caractéristiques de document, le type de police et l'espacement des caractères, jouent notamment un rôle important dans le processus de reconnaissance.

Page 59: Guide Utilisateur ReadIris Pro 12

Chapitre 8 – Reconnaissance des documents

52

Type de police

Readiris distingue les documents dits « normaux » et les documents d'impression matricielle. Les symboles matriciels (du type 9 aiguilles) sont composés de points distincts.

Des techniques de segmentation et de reconnaissance spéciales sont nécessaires pour la reconnaissance des documents d'impression matricielle et doivent être activées.

Pour sélectionner le type de police :

Dans le menu Configuration, pointez sur Type de police.

Par défaut, le type de police a la valeur Automatique.

De cette façon, Readiris reconnaît les impressions matricielles « 25 aiguilles » ou « NLQ » (qualité quasi-courrier) ou d'autres types d'impression « normale ».

Pour que la reconnaissance s'applique uniquement aux documents d'impression matricielle, cliquez sur Matricielle.

Readiris appliquera la reconnaissance aux documents d'impression matricielle de qualité « brouillon » ou à « 9 aiguilles ».

Espacement des caractères

L'espacement des caractères est le nombre de caractères par pouce dans un type de caractère. L'espacement des caractères peut être fixe, auquel cas tous les caractères ont la même largeur, ou proportionnel, auquel cas leur largeur est différente.

Pour sélectionner l'espacement des caractères :

Dans le menu Configuration, pointez sur Espacement des caractères.

Page 60: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

53

Par défaut, l'espacement a la valeur Automatique.

Cliquez sur Fixe si tous les caractères ont la même largeur. C'est souvent le cas dans les documents dactylographiés avec d'anciennes machines à écrire.

Cliquez sur Proportionnel si les caractères ont une largeur différente. La vaste majorité des polices utilisées dans les journaux, magazines et livres est proportionnelle.

Important : ces caractéristiques de document ne s'appliquent pas aux documents en langue asiatique, arabe ou hébreu.

UTILISATION DE L'APPRENTISSAGE INTERACTIF

Readiris propose une fonction d'apprentissage interactif. Grâce à l'apprentissage interactif, vous pouvez « former » le système à la reconnaissance des polices et des formes des caractères et, le cas échéant, corriger les résultats de l'OCR. Lors de cette phase d'apprentissage interactif, tous les caractères non formellement reconnus par le système sont affichés dans une fenêtre d'aperçu, accompagnés de leur mot parent et de la solution proposée.

Cet apprentissage peut sensiblement améliorer la précision du système de reconnaissance et est particulièrement utile pour la reconnaissance des caractères dégradés et déformés. Il permet également d'apprendre à Readiris à reconnaître les symboles spéciaux qu'il n'arrive pas à identifier de prime abord, notamment les symboles mathématiques et scientifiques ainsi que les signes typographiques.

Page 61: Guide Utilisateur ReadIris Pro 12

Chapitre 8 – Reconnaissance des documents

54

Pour activer l'apprentissage interactif :

Dans le menu Apprentissage, cliquez sur Apprentissage interactif.

Cliquez sur le bouton Reconnaître + Enregistrer pour effectuer la reconnaissance du document. Readiris passe en phase d'apprentissage interactif.

Les caractères jugés douteux par le système de reconnaissance sont affichés.

Si les résultats sont corrects :

o Cliquez sur le bouton Apprendre pour enregistrer les résultats confirmés.

Les résultats de l'apprentissage sont stockés temporairement dans la mémoire de l'ordinateur pour la durée de la reconnaissance. Readiris n'affiche plus les caractères préalablement « appris » lorsqu'il effectue la reconnaissance du reste du document.

Lorsqu'un nouveau document fait l'objet d'une reconnaissance, les résultats de l'apprentissage sont effacés.

Page 62: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

55

Pour enregistrer définitivement les résultats de l'apprentissage, utilisez un dictionnaire de polices. Pour plus d'informations, consultez la rubrique Utilisation des dictionnaires de polices.

o Cliquez sur Finir pour enregistrer toutes les solutions proposées par le logiciel.

Si les résultats ne sont pas corrects :

o Entrez les caractères corrects et cliquez sur le bouton Apprendre.

Remarque : lorsque vos documents contiennent des caractères spéciaux, veillez à cliquer sur la commande Caractères spéciaux du menu Edition. Double-cliquez sur le caractère à insérer.

ou

o Cliquez sur le bouton Ne pas apprendre pour enregistrer les résultats comme étant douteux.

Utilisez cette commande pour les caractères endommagés qui pourraient être confondus avec d'autres caractères s'ils étaient enregistrés comme

Page 63: Guide Utilisateur ReadIris Pro 12

Chapitre 8 – Reconnaissance des documents

56

étant confirmés, par exemple, le nombre 1 et la lettre I, qui présentent une forme identique dans de nombreuses polices.

o Cliquez sur Supprimer pour supprimer les caractères de la sortie.

Utilisez ce bouton pour éviter que des caractères parasites (bruit) n'apparaissent dans le fichier de sortie.

o Cliquez sur Annuler pour corriger des erreurs.

Readiris peut assurer le suivi des 32 dernières opérations.

o Cliquez sur Interrompre pour interrompre l'apprentissage interactif.

Tous les résultats de l'apprentissage seront supprimés. La prochaine fois que vous cliquez sur Reconnaître + Enregistrer, l'apprentissage interactif est réexécuté.

UTILISATION DES DICTIONNAIRES DE POLICES

Lorsque vous numérisez de nombreux documents de mêmes type, qualité de police et qualité d'impression, vous souhaitez parfois éviter de répéter le processus d'apprentissage. Dans un tel cas, l'emploi de dictionnaires de polices s'avère utile. Les dictionnaires de polices contiennent des informations sur les polices assimilées par le programme lors de l'apprentissage interactif et peuvent améliorer sensiblement les résultats de la reconnaissance.

Notez que les dictionnaires de polices sont limités à 500 formes. Il est recommandé de créer des dictionnaires distincts pour des applications spécifiques.

Pour créer un nouveau dictionnaire de polices :

Page 64: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

57

Dans le menu Apprentissage, cliquez sur la commande Nouveau dictionnaire.

Cliquez sur Apprentissage interactif dans le menu Apprentissage pour l'activer.

Cliquez sur Reconnaître + Enregistrer pour effectuer la reconnaissance du document.

Readiris passe en phase d'apprentissage interactif. Utilisez les boutons de la boîte de dialogue pour enregistrer les caractères dans le dictionnaire de polices.

Une fois la reconnaissance terminée, cliquez sur Enregistrer pour enregistrer le document.

Revenez au menu Apprentissage et cliquez sur Enregistrer le dictionnaire.

Saisissez le nom du dictionnaire et cliquez sur Enregistrer.

Pour utiliser un dictionnaire de polices existant :

Dans le menu Apprentissage, cliquez sur Ouvrir un dictionnaire.

Sélectionnez le dictionnaire de votre choix et cliquez sur Ouvrir.

Cliquez sur Reconnaître + Enregistrer pour effectuer la reconnaissance du document.

Page 65: Guide Utilisateur ReadIris Pro 12
Page 66: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

59

CHAPITRE 9 FORMATAGE ET ENREGISTREMENT

DE DOCUMENTS

FORMATAGE DE DOCUMENTS

Readiris permet, une fois la reconnaissance effectuée, d'enregistrer vos documents dans de nombreux formats de sortie :

Readiris vous permet de générer plusieurs types de documents texte, à savoir OpenDocument Text, Open XML (docx), RTF et Unicode.

Il convient de noter que la dernière version de Microsoft Word (2008) est indispensable pour ouvrir les fichiers .docx. L'ouverture des fichiers .docx dans Microsoft Word 2004 nécessite le téléchargement d'un convertisseur docx. Ce dernier peut être téléchargé à partir du site Web de Microsoft. Les versions antérieures de Microsoft Word ne prennent pas en charge les fichiers .docx.

Vous pouvez générer des données tabulaires au format de programmes tableur (Open XML de type .xlsx), applications de traitement de texte (RTF) et navigateurs web (HTML) : les tableaux sont reconstitués cellule par cellule dans des feuilles de calcul et insérés en tant qu'objets tableau dans des fichiers de traitement de texte. Readiris reconnaît les tableaux avec et sans grille.

Notez en outre que la dernière version de Microsoft Excel (2007) est nécessaire pour ouvrir les fichiers .xlsx. L'ouverture des fichiers .xlsx dans Microsoft Excel 2004 nécessite le téléchargement d'un

Page 67: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

60

convertisseur xlsx. Ce dernier peut être téléchargé à partir du site Web de Microsoft. Les versions antérieures de Microsoft Excel ne prennent pas en charge les fichiers .xlsx.

(avec grille) (sans grille)

Readiris propose quatre types de sorties PDF.

Pour plus d'informations, consultez la section Création de documents PDF.

Readiris vous permet d'enregistrer vos documents sous la forme de fichiers image sans leur appliquer la reconnaissance. Readiris offre la possibilité d'enregistrer les documents en tant qu'images JPEG, JPEG 2000, Photoshop, PICT, PNG, TIFF et bitmap Windows.

Procédure

Cliquez sur l'icône Format de sortie de la barre d'outils principale.

Sélectionnez le format de sortie souhaité dans la liste Format.

En fonction du format sélectionné, différentes options de mise en page et d'image sont disponibles.

Les options de mise en page et d'image sont traitées dans les sections Sélection des options de mise en page et Sélection des options d'image.

Page 68: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

61

Les options indisponibles pour le format de sortie sélectionné sont affichées en grisé.

Il est également possible d'envoyer les documents de sortie de la reconnaissance directement vers une application cible, laquelle s'ouvrira automatiquement.

Readiris permet d'envoyer les sorties vers les principales suites bureautiques, les principaux tableurs et applications de traitement de texte, tels que Microsoft Word et Excel (Mac Office), AppleWorks et Apple Pages, les navigateurs Web les plus répandus, comme Apple Safari, vers Adobe Acrobat et Adobe Reader, Aperçu et des éditeurs de texte simple tel TextEdit.

Selon le format de sortie sélectionné dans la liste Format, Readiris propose l'application par défaut utilisée dans votre système pour l'ouverture du type de fichier en question.

Pour choisir une autre application, cliquez sur le bouton Choisir en regard de la liste Envoyer vers et recherchez l'application voulue.

Si vous voulez simplement enregistrer vos documents sans les ouvrir, sélectionnez Aucun dans la liste Envoyer vers.

Conseil : vous pouvez sélectionner votre application de messagerie par défaut en tant qu'application cible. De cette façon, Readiris ouvrira un nouvel e-mail lorsque vous cliquerez sur Reconnaître + Enregistrer et ajoutera le document généré suite à la reconnaissance sous la forme de pièce jointe.

Cliquez ensuite sur OK pour enregistrer les paramètres puis sur Reconnaître + Enregistrer dans la barre d'outils principale.

Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier.

Il est également possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier.

Les résultats de l'OCR peuvent être exportés à plusieurs reprises sans devoir répéter la procédure de reconnaissance. Cliquez de nouveau sur

Page 69: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

62

le bouton Format de sortie et modifiez le format du texte ainsi que les options de formatage. Après quoi, cliquez à nouveau sur Reconnaître + Enregistrer ou sur Enregistrer le document.

SÉLECTION DES OPTIONS DE MISE EN PAGE

Selon le format de sortie sélectionné, plusieurs options de mise en page sont disponibles.

Pour accéder aux options de mise en page :

Cliquez sur l'icône Format de sortie de la barre d'outils principale.

Sélectionnez le format de sortie souhaité dans la liste Format. Les options de mise en page disponibles pour le format sélectionné s'affichent :

Les options non disponibles s'affichent en grisé.

o L'option Créer du texte continu empêche Readiris d'appliquer un formatage au texte.

Readiris génère un texte continu.

o L'option Retenir le formatage des mots et des paragraphes représente une solution intermédiaire entre la génération d'un texte continu et le formatage automatique.

Le type de police, la taille et le type de caractère sont préservés lors de la reconnaissance.

Les tabulations et l'alignement de chaque bloc sont recréés.

Page 70: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

63

Les colonnes et les blocs de texte ne sont pas recréés, les paragraphes se suivent simplement.

Les tableaux sont reproduits correctement.

o L'option Recréer le document d'origine permet de générer un facsimilé du document d'origine.

Readiris génère une copie fidèle du document d'origine qui n'est plus une image numérisée.

Il recrée également les liens hypertexte vers les sites web ou les adresses e-mail.

L'option Utiliser des colonnes et non des cadres crée des documents en colonnes.

Le texte disposé en colonnes est plus facile à modifier que les documents contenant plusieurs cadres : le texte s'enchaîne d'une colonne à l'autre.

Remarque : lorsque le système n'est pas en mesure de détecter les colonnes dans le document d'origine, ce mode de formatage utilise des cadres comme solution alternative.

L'option Insérer des sauts de colonne ajoute un saut de colonne forcé à la fin de chaque colonne.

Tout texte que vous modifiez, ajoutez ou supprimez reste à l'intérieur de sa colonne. Il ne passe jamais automatiquement à la colonne suivante.

Conseil : désactivez cette option lorsque vous avez du texte continu en colonne. Vous garantirez ainsi l'enchaînement continu du texte d'une colonne à l'autre.

L'option Inclure l'image en arrière-plan du texte place l'image numérisée en arrière-plan de la page derrière le texte reconnu.

Notez toutefois que cette option augmente sensiblement la taille des fichiers de sortie.

Page 71: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

64

Le format PDF Texte-Image offre un résultat identique pour les fichiers PDF.

L'option Sauvegarder la couleur de l'arrière-plan de l'onglet Options offre une alternative plus compacte.

o L'option Reconstituer les paragraphes permet d'activer la détection automatique des paragraphes.

Readiris insère des retours à la ligne automatiques dans le texte reconnu jusqu'au début d'un nouveau paragraphe et « recolle » les mots coupés en fin de ligne.

o L'option Inclure les images inclut les images dans les fichiers formatés automatiquement.

Ceci est indispensable pour créer une copie fidèle d'un document.

Utilisez les options d'image de l'onglet Images afin de déterminer la résolution et le mode couleur des images figurant dans les fichiers de sortie.

o L'option Sauvegarder les couleurs du texte préserve les couleurs d'origine du texte lors de la reconnaissance.

o Quant à l'option Sauvegarder la couleur de l'arrière-plan, elle préserve les couleurs d'accompagnement de l'arrière-plan de la page lors de la reconnaissance.

Remarque : cette option recrée la couleur de l'arrière-plan de chaque cellule lors de la reconnaissance des tableaux.

Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document.

Page 72: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

65

SÉLECTION DES OPTIONS D'IMAGE

Selon le format de sortie sélectionné, vous pouvez accéder à certaines options d'image avancées. Les options d'image peuvent servir à modifier la qualité et la résolution de l'image.

Pour accéder aux options d'image :

Cliquez sur l'icône Format de sortie de la barre d'outils principale.

Sélectionnez le format de sortie souhaité dans la liste Format.

Cliquez sur l'onglet Images pour afficher les options d'image :

Les options non disponibles s'affichent en grisé.

Profondeur

Par défaut, Readiris enregistre les images avec leur profondeur d'origine.

Readiris peut également enregistrer les images couleur, en noir et blanc et en niveaux de gris.

Page 73: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

66

Qualité

Vous avez le choix entre la qualité d'image Inférieure, Normale et Supérieure.

Résolution

Par défaut, Readiris conserve la résolution d'origine.

Toutefois, vous pouvez décider de diminuer la résolution en choisissant une valeur (en ppp) inférieure.

Notez toutefois qu'il n'est pas possible d'augmenter la résolution.

Conseil : lors de l'enregistrement de documents au format HTML en vue de leur publication sur un site Web, réduisez la résolution à 70 ppp (résolution d'écran).

Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document.

Page 74: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

67

ENREGISTREMENT DES DOCUMENTS EN TANT

QUE FICHIERS IMAGE

Bien que Readiris soit une application d'OCR, il permet également d'enregistrer vos documents sous la forme de fichiers image sans leur appliquer la reconnaissance.

Readiris offre la possibilité d'enregistrer les documents en tant qu'images JPEG, JPEG 2000, Photoshop, PICT, PNG, TIFF et bitmap Windows.

Procédure

Cliquez sur l'icône Format de sortie de la barre d'outils principale.

Sélectionnez le format d'image souhaité dans la liste Format.

Remarque : les options de l'onglet Images NE s'appliquent PAS lorsque vous enregistrez des documents sous la forme de fichiers image. En revanche, elles s'appliquent aux images figurant dans les documents générés par le processus de reconnaissance. Pour plus d'informations, consultez la section Sélection des options d'image.

Vous pouvez ouvrir les images enregistrées immédiatement après l'exportation dans l'application de votre choix. Cliquez sur le bouton Choisir en regard de la liste Envoyer à pour sélectionner une application.

Page 75: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

68

Si vous voulez simplement enregistrer vos images sans les ouvrir, sélectionnez Aucun dans la liste Envoyer à.

Ensuite, cliquez sur Reconnaître + Enregistrer dans la barre d'outils principale pour enregistrer votre document sous la forme d'un fichier image. Vous pouvez également cliquer sur Enregistrer le document dans le menu Fichier.

Remarques :

Vous pouvez également utiliser la commande Copier les zones d'image du menu Zones pour envoyer toutes les images d'une page vers le Presse-papiers.

Vous pouvez également faire glisser les miniatures d'image du tiroir vers le Bureau pour les enregistrer au format JPEG.

CRÉATION DE DOCUMENTS PDF

Readiris génère quatre types de sorties PDF : texte, texte-image, image-texte et image.

Pour générer des fichiers de sortie au format PDF :

Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF dans la liste Format.

Ensuite, sélectionnez le type PDF que Readiris doit générer :

Page 76: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

69

PDF Texte

Lorsque vous sélectionnez l'option PDF Texte, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés.

L’image de la page n'est pas contenue dans ces fichiers PDF monocouches .

PDF Texte-Image

Lorsque vous sélectionnez l'option PDF Texte-Image, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés qui contiennent l'image de la page ainsi que le texte généré suite à la reconnaissance.

L'image de la page est placée derrière le texte.

PDF Image

Lorsque vous sélectionnez l'option PDF Image, Readiris génère des documents PDF comportant uniquement une image, il n'exécute pas la reconnaissance OCR.

PDF Image-Texte

Lorsque vous sélectionnez l'option PDF Image-Texte, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés qui contiennent l'image de la page ainsi que le texte généré suite à la reconnaissance.

L'image de la page est placée au-dessus du texte.

Avec ce format, vous pouvez toujours voir le document d'origine (tel qu'il a été numérisé) tout en ayant la possibilité d'effectuer des recherches et des copier-coller dans le texte issu de la reconnaissance. Le texte est masqué par l'image. Ce format est donc utile à des fins d'archivage.

Page 77: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

70

Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document.

SÉLECTION DES OPTIONS PDF

Pour sélectionner les options PDF :

Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF.

Selon le type de PDF sélectionné, plusieurs options sont disponibles : Cliquez sur l'onglet Options PDF pour y accéder :

Versions

Sélectionnez la version du format PDF à générer.

Remarque :

Page 78: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

71

Adobe Acrobat 5.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.4.

Adobe Acrobat 6.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.5.

Adobe Acrobat 7.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.6.

Adobe Acrobat 8.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.7.

Inclure les polices

Sélectionnez l'option Inclure les polices pour incorporer les polices dans les fichiers PDF.

L'inclusion des polices permet d'empêcher toute substitution des polices et garantit que les lecteurs, indépendamment de la configuration de leur ordinateur, voient le texte avec ses polices d'origine.

Notez toutefois que cette option augmente quelque peu la taille de fichier des documents de sortie de la reconnaissance.

Créer des signets

L'option Créer des signets permet de créer des signets pour chaque bloc de texte, image et tableau dans les fichiers PDF.

iHQC - technologie intelligente de compression haute qualité

Outre les quatre types de sortie PDF « normale », Readiris propose une sortie PDF compressée avec iHQC : les documents PDF de type image-texte et image peuvent être hypercompressés au moyen d'iHQC sans perte de qualité d'image. iHQC (intelligent High-Quality Compression) est la technologie d'hypercompression

Page 79: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

72

exclusive d'I.R.I.S. iHQC est aux images ce que MP3 est à la musique et ce que DivX est à la vidéo.

Sélectionnez soit Petite taille pour réduire le plus possible la taille des documents, soit Bonne qualité pour obtenir des documents de taille légèrement supérieure mais de meilleure qualité.

Vous pouvez aussi sélectionner Personnalisé et déplacer le curseur vers la droite pour obtenir un juste équilibre entre la taille minimale et une qualité optimale.

Remarque : Adobe Reader est nécessaire pour ouvrir les fichiers PDF compressés au moyen d'iHQC. Ceux-ci ne s'ouvrent pas correctement dans l'application Aperçu par défaut.

ADAPTATION DES DOCUMENTS PDF

En plus de générer des documents PDF, Readiris peut également adapter les fichiers PDF : Readiris convertit des PDF image en PDF texte ou tout autre format texte pris en charge et déverrouille le contenu PDF en lecture seule.

Avertissement : Readiris n'ouvre pas les documents PDF protégés par mot de passe.

Procédure

Cliquez sur le bouton Ouvrir dans la barre d'outils principale et sélectionnez le fichier PDF que Readiris doit adapter.

Si nécessaire, indiquez les pages à ouvrir.

Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF dans la liste Format.

Page 80: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

73

Ensuite, sélectionnez le type PDF de votre choix et cliquez sur OK pour quitter la définition des paramètres.

Pour plus d'informations sur les types de fichier PDF, consultez la section Création de documents PDF.

Cliquez sur le bouton Reconnaître + Enregistrer pour adapter le document.

SÉLECTION DE LA TAILLE DE PAGE

Dans Readiris, la taille de page des documents que vous numérisez et ouvrez ne doit pas nécessairement être la même que celle des documents de sortie.

Lorsque vous générez des documents OpenDocument Text, Open XML (.docx et .xlsx) ou RTF, vous pouvez sélectionner ou exclure les tailles de page de votre choix.

Pour ce faire, procédez comme suit :

Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez les formats de sortie mentionnés ci-dessus dans la liste Format.

Cliquez ensuite sur l'onglet Tailles de page pour accéder à ces options.

Cochez les tailles de page que vous souhaitez inclure et décochez celles que vous voulez exclure.

Readiris parcourt les tailles de page actives dans l'ordre indiqué et utilise la première taille suffisamment grande pour contenir le document numérisé. Si vous voulez modifier l'ordre de tri, il vous suffit de faire glisser les tailles de page pour les réorganiser comme bon vous semble dans la liste.

Page 81: Guide Utilisateur ReadIris Pro 12

Chapitre 9 – Formatage et enregistrement de documents

74

Cliquez sur Par défaut pour rétablir les paramètres par défaut.

Une fois terminé, cliquez sur OK pour enregistrer les paramètres et quitter.

Page 82: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

75

CHAPITRE 10 ENREGISTREMENT ET

CHARGEMENT DES PARAMÈTRES

Lorsque vous quittez Readiris, vous êtes invité à confirmer si vous voulez enregistrer les paramètres que vous avez spécifiés et les utiliser en tant que configuration par défaut. Si vous acceptez, la prochaine fois que vous exécuterez Readiris, le programme s'ouvrira en utilisant cette nouvelle configuration par défaut. Pour rétablir la configuration d'usine, cliquez sur la commande Rétablir la configuration d'usine dans le menu Configuration.

Lorsque vous numérisez plusieurs groupes de documents qui exigent une configuration différente, il est utile d'enregistrer un fichier de configuration distinct pour chaque groupe.

Procédure

Sélectionnez les paramètres à utiliser pour un groupe de documents donné.

Dans le menu Configuration, cliquez sur la commande Enregistrer. Vous pouvez également cliquer sur Enregistrer par défaut si vous voulez utiliser ces paramètres comme configuration par défaut.

Les paramètres suivants seront enregistrés :langues principale, Favoriser la précision de reconnaissance sur la vitesse, type de police, espacement des caractères, format de sortie et toutes les options relatives au format de sortie sélectionnées, l'application cible, les tailles de page ainsi que les options d'analyse de page, d'élimination du bruit et de redressement des pages et d'apprentissage interactif.

Page 83: Guide Utilisateur ReadIris Pro 12

Chapitre 10 – Enregistrement et chargement des paramètres

76

Lorsque vous numérisez ou ouvrez par la suite un document du même groupe, cliquez sur la commande Ouvrir du menu Configuration.

Sélectionnez le fichier de configuration approprié et cliquez sur Ouvrir.

Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance du document en appliquant les paramètres adéquats.

Page 84: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

77

CHAPITRE 11 RECONNAISSANCE DE TEXTE

MANUSCRIT

En plus du texte dactylographié, des tableaux, des images et des codes à barres, Readiris assure la reconnaissance du texte manuscrit. Par texte manuscrit, l'on entend les lettres capitales distinctes.

Pour effectuer la reconnaissance du texte manuscrit :

Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image.

Sélectionnez Tracer des zones de texte manuscrit.

Dessinez un cadre autour du texte manuscrit devant faire l'objet de la reconnaissance.

Cliquez sur Reconnaître + Enregistrer dans la barre d'outils principale.

La reconnaissance sera appliquée à l'ensemble du document, y compris au texte manuscrit.

Important : le texte manuscrit doit être rédigé clairement. Conseil : si vous n'obtenez pas de bons résultats, utilisez le formulaire d'écriture d'I.R.I.S. afin d'adapter votre style d'écriture. Le formulaire d'écriture vide d'I.R.I.S. sert de modèle page pleine sur lequel vous pouvez écrire en lettres capitales en respectant la taille et l'espacement

Page 85: Guide Utilisateur ReadIris Pro 12

Chapitre 11 – Reconnaissance de texte manuscrit

78

corrects. Ce formulaire figure sur le CD-ROM de Readiris et dans le dossier d'installation de Readiris.

Remarque : tout en maintenant la touche Ctrl enfoncée, cliquez sur une zone de texte manuscrit, puis cliquez sur Copier le texte pour que la reconnaissance porte uniquement sur la zone de texte manuscrit et pour envoyer le résultat vers le Presse-papiers.

Symboles reconnus :

La reconnaissance de l'écriture manuscrite est limitée à l'alphabet latin et prend en charge les chiffres (0 – 9), les lettres majuscules (A – Z) et certains signes de ponctuation (virgule, point, signe plus et tiret).

Les accents, les trémas et autres caractères spéciaux ne sont pas pris en charge.

Remarques

Readiris prend en charge l'écriture manuscrite en lettres capitales, pas l'écriture manuscrite liée.

Les caractères en majuscules sont remplacés par des minuscules après la reconnaissance, à moins qu'ils ne soient placés en début de phrase.

Les caractéristiques du document tel que la langue, le type de police et l'espacement des caractères ne s'appliquent pas au texte manuscrit.

L'apprentissage interactif ne s'applique pas non plus à cette fonction. La technologie ICR a été développée à partir de plus d'un million d'échantillons d'écriture.

Page 86: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

79

INDEX

adaptation des documents PDF ............................................. 72

analyse de page .................... 22

appareil photo numérique .... 27

apprentissage interactif ........ 53

assistance produits ............... 11

barre d'outils de droite .......... 14

barre d'outils Image .............. 14

barre d'outils principale ........ 14

caractéristiques du document 51

chargement des paramètres .. 75

configuration du scanner ...... 24

Configuration du scanner ..... 16

configuration d'usine ............ 75

configuration requise ............. 9

contraste ............................... 32

couleur d'arrière-plan ............ 63

couleur d'arrière-plan des cellules de tableau ................ 59

désalignement ....................... 28

désinstallation de Readiris .... 10

dictionnaires de polices ........ 56

documents avec données tabulaires .............................. 59

documents de plusieurs pages ........................................ 22, 24

documents en hébreu .... 4, 7, 47

documents en langue asiatique ...................................... 4, 7, 47

documents PDF .................... 68

documents texte .................... 59

Drop2Read ........................... 19

élimination du bruit ........ 22, 32

Page 87: Guide Utilisateur ReadIris Pro 12

Index

80

enregistrement ...................... 11

enregistrement de paramètres75

enregistrement en tant que fichier image ........................ 67

espacement des caractères .... 52

Exécution de Readiris .......... 13

fichiers de zones .................. 43

fichiers image....................... 22

formats de sortie .................. 59

formats d'image pris en charge ............................................. 22

I.R.I.S. .................................. 11

Image Capture ...................... 16

image couleur................. 25, 29

image en niveaux de gris 25, 29

image en noir et blanc .... 25, 29

images inversées .................. 26

installation ............................. 9

interface utilisateur .............. 14

langue .................................. 48

langue de l'interface utilisateur .............................................. 16

langue du document .............. 48

langue principale .................. 48

Langues asiatiques .............. 4, 7

lissage des images couleur ... 26, 29

luminosité ............................. 30

matriciel ................................ 52

mode couleur ........................ 25

modèles de zonage ................ 43

multilingues .......................... 50

numérique ............................. 49

numérisation de documents .. 24

optimisation des documents numérisés .............................. 29

options .................................. 21

options de mise en page ........ 62

options d'image ..................... 65

pages ..................................... 15

Page 88: Guide Utilisateur ReadIris Pro 12

ReadirisTM Pro 12 – Guide Utilisateur

81

déplacement ..................... 15

suppression ....................... 15

précision ou vitesse .............. 48

recréation du document d'origine ............................... 63

redressement ........................ 21

redressement de la page ....... 21

résolution ............................. 26

rétablissement de la configuration d'usine ............ 75

rotation ................................. 22

sortie Excel .......................... 59

sortie HTML ........................ 59

sortie OpenDocument .......... 59

sortie RTF ............................. 59

sortie Unicode ...................... 59

tableaux ................................ 59

tailles de page ....................... 73

texte manuscrit ..................... 77

tiroir ...................................... 15

tiroir à images ....................... 15

Twain ................................... 16

type de police ....................... 52

vitesse ou précision .............. 48

zonage automatique .............. 35

zonage manuel ...................... 37