Préparation d'un document PDF pour l’indexation

Commencez par créer un dossier contenant les fichiers PDF à indexer. Tous les fichiers PDF doivent être complets au niveau du contenu comme des fonctions électroniques telles que les liens, les signets et les champs de formulaire. Si les fichiers à indexer comprennent des documents numérisés, assurez-vous que le texte est disponible pour la recherche. Fractionnez les documents volumineux en fichiers plus petits, par chapitres, pour optimiser les performances de recherche. Vous pouvez également ajouter des informations aux propriétés du document d'un fichier afin d'améliorer les possibilités de recherche dans le fichier.

Avant d'indexer une série de documents, il est essentiel que vous configuriez la structure des documents sur le lecteur de disque ou sur le volume du serveur réseau et que vous vérifiiez les noms de fichiers multiplates-formes. Les noms de fichiers risquent d'être tronqués et difficilement récupérables lors d'une recherche multiplate-forme. Pour éviter ce problème, tenez compte des recommandations suivantes :

  • Renommez les fichiers, les dossiers et les index conformément à la convention de dénomination de fichiers MS-DOS (huit caractères ou moins suivis d'une extension de trois caractères) et ce, tout particulièrement si vous projetez de diffuser la série de documents et l'index sur un disque CD-ROM formaté ISO 9660.

  • Supprimez des noms de fichiers et de dossiers les caractères étendus, tels que les caractères accentués et non anglais. (La police utilisée par la fonction Catalog ne prend pas en charge les codes de caractères compris entre 133 et 159.)

  • Abstenez-vous d'imbriquer trop profondément les dossiers ou d'utiliser des noms de chemins dépassant 256 caractères pour les index qui seront utilisés sous Mac OS.

  • Si vous utilisez Mac OS avec un serveur de réseau local (LAN) OS/2, configurez LAN Server Macintosh (LSM) de manière à appliquer les conventions de dénomination de fichiers MS-DOS ou indexez seulement les volumes FAT. (Les volumes HPFS peuvent contenir des noms de fichiers longs irrécupérables.)

    Si la structure du document comprend des sous-dossiers à ne pas indexer, vous pouvez exclure ces derniers au cours de l'indexation.