Suite de l'épisode 1
Et donc j'ai choisi Nuxeo. Dans les grandes lignes, voici quelques raisons objectives :
- accès au support
- facilité de tester l'application
- choix du moteur de bases de données
- interface et fonctionnalités
Nuxeo est livrée clé en main, sous la forme d'une archive à décompresser. L'archive utilisable sur FreeBSD est celle qui est destinée à Linux, mais elle nécessite quelques modifications. Notamment les scripts de lancement de l'application devront être révisés (chemin du shell, entre autre).
Quoi qu'il en soit, il y a beaucoup de travail entre le moment où l'application est fonctionnelle et le moment où elle est vraiment utilisable (sécurisée, servie dans les règles de l'art).
Rien n'est précisé par exemple en terme de bonnes pratiques. L'utilisateur béotien risque de se retrouver avec une application fonctionnelle mais peu sécurisée. Avant même de lancer l'application pour s'y connecter, il est souhaitable d'utiliser un compte utilisateur non privilégié pour faire tourner ce serveur. Il est aussi fortement recommandé de mettre un serveur web en frontal qui redirigera les requêtes du port standard vers le port 8080. De même, il ne faut pas lancer l'application sur toutes les IP, mais la restreindre à 127.0.0.1.
L'utilisation d'un serveur web comme Apache se fait très simplement si on se contente du protocole HTTP, mais configurer un frontal HTTPS (donc avec chiffrement des transactions) est une autre paire de manches. Ici, même la documentation officielle n'est pas suffisante, et j'ai du utiliser tcpdump pour venir à bout des problèmes de configuration.
Et ça, c'était la partie drôle. Ça se gâte vraiment quand on souhaite mettre à jour l'application. Tout d'abord, il faut enregistrer l'instance de Nuxeo chez l'éditeur, une fois que c'est fait, le système de mise à jour interne devient accessible. Ce système de mise à jour est une énorme calamité. Une bouse monumentale. C'est un concentré des sept plaies de l'Égypte.
Après installation, j'avais une bonne quinzaine de mises à jour à installer. Mes 5 ou 6 premières tentatives se sont soldées par des échecs, nécessitant une réinstallation complète de l'application (ou une restauration à partir d'un snapshot, dans mon cas). En fait, la clé du succès est sur le site de support de Nuxeo. Il y a bien sûr un ordre pour appliquer les mises à jour, mais il faut surtout redémarrer l'application après chaque patch et suivre les recommandations spécifiques à la lettre.
Finalement, cette application si simple à installer au premier abord m'aura fait perdre de longues heures avant même que j'ai l'occasion de m'en servir pour archiver mes documents.











La gestion électronique de documents, épisode 3
Une fois qu'on a choisi un système de GED, et qu'on a passé avec un succès relatif les épreuves de l'installation, il reste le plus important : l'utilisation quotidienne.
L'ajout de documents déjà électroniques est assez trivial. Dans Nuxeo en prime on peut le faire par glisser-déposer, c'est super cool™. La difficulté finalement à ce niveau, c'est le classement. Avec le papier c'est simple : on n'a pas vraiment le choix. Soit le classeur rouge, soit le chasseur vert, mais pas les deux. Le classement électronique permet quant à lui de créer autant de dossiers qu'on le souhaite, et de surcharger ce classement par des étiquettes (tags). Une facture d'examen médical pourrait être classée dans "Santé" ou "Factures", ou dans "Santé/Factures", ou dans "Factures/Santé", ou ne pas être classée du tout mais porter les étiquettes "Santé" et "Facture", ou d'autres combinaisons de ces éléments.
Plus j'y réfléchi, et plus je me dis que le classement en dossiers/sous dossiers est archaïque. J'ai d'ailleurs toutes les peines à choisir une structure figée dans la quelle je puisse ranger à la fois l'existant, mais aussi les futurs documents. Le classement par tags a un bel avenir, sous réserve que l'application de GED choisie sache gérer ces étiquettes de manière ergonomique pour la recherche et la navigation.
J'ai un (autre) regret au sujet de Nuxeo : quand j'importe un PDF contenant des méta-données, ces dernières ne sont pas indexées par l'application. Je m'étais naïvement attendu à ce qu'un PDF dont le champs "Author" est renseigné puisse être retrouvé par une recherche sur le nom de l'auteur. Ce n'est pas le cas.
Globalement, j'ai l'impression que les outils de GED ne font pas vraiment la part belle aux méta-données contenues dans les documents. Nuxeo en tout cas considère que les méta-données importantes sont celles qui entourent la vie de votre document dans l'application. Certaines de ces informations sont gérées automatiquement (qui l'a mis en ligne, qui l'a modifié la dernière fois…), mais la majorité sont gérées manuellement par les utilisateurs : date d'expiration, sujets, source, nature, langue, flux de travail, relations entre documents, commentaires...
L'ajout de documents papier passe quant à lui par une étape de numérisation. On sort un peu du périmètre de l'application, mais il est intéressant de se pencher sur la question. Numériser en masse une foule de documents différents nécessite du temps et de la méthode. Ceux qui ont de la chance ont quelque part à porté de main un copieur numérique connecté. Ce genre de grosse machine d'entreprise permet de traiter les documents exactement comme le fait une photocopieuse classique : par lot, recto-verso, avec réduction ou agrandissement, avec optimisation du contraste, etc. Le résultat de la numérisation est en général un fichier PDF envoyé par email, ou déposé sur un serveur. Si vous avez un de ces copieurs à disposition, prenez le temps d'en assimiler les réglages et l'interface. Certains permettent de créer des programmes personnalisés. Ainsi, en pressant une seule touche, je suis capable de numériser recto-verso une pile de documents, avec un réglage spécial de résolution, de contraste, et de destination. Le PDF est déposé sur un serveur WebDAV où je peux le récupérer sans limite de taille. Ensuite, j'utilise un logiciel de reconnaissance de caractères qui me permet de transformer mon PDF "image" en "image+texte". Ainsi, le contenu de chaque document ajouté à Nuxeo est indexé, et peut être retrouvé par le moteur de recherche de l'application. En effet, je ne conçois pas la GED sans la possibilité de rechercher mes documents par leur contenu.
Maintenant au boulot. Il me reste deux cartons d'archives et deux gros classeurs de papiers à numériser.