Dépôt légal de l’Internet

Logo de la BNF, (c) bnf.fr Le dépôt légal, institué bien avant notre naissance par François Ier, vise de nos jours à assurer la collecte et la conservation du patrimoine culturel national. Jusqu'à présent, seules les œuvres distribuées sur support physique étaient concernées par ce travail de collecte pharaonique. Récemment, la Bibliothèque Nationale de France (BNF) a vu le champ d'action du dépôt légal s'élargir considérablement. En effet, il lui incombe, depuis la loi du 1er août 2006, de collecter aussi les productions numériques disponibles sur Internet. Ainsi toute personne en lien avec le territoire français doit autoriser le robot d'indexation de la BNF à aspirer sa production numérique (pages web, newsletter par email, galerie photo publique...).
Skyblogueurs, réjouissez-vous (kikoo-lol cé cher bien), votre prose inimitable va être archivée dans le temple du savoir français. Enfin peut être. De l'aveu même de la BNF, la tâche est monumentale, et ils ne peuvent garantir que votre site, ou que toutes les pages de votre site seront archivées. Il semble en tout cas qu'en ce qui me concerne, c'est plutôt bien parti :
Le 10 novembre, j'ai posté un article sur l'exposition 70′ La photographie américaine, en faisant plusieurs liens vers le site de la Bibliothèque Nationale de France. Depuis le 11 novembre, le petit robot de la BNF (Heritrix) passe plusieurs fois par jour pour aspirer mes pages. C'est trop énorme pour être seulement le fruit du hasard. Le robot de la BNF n'était passé qu'une fois en octobre 2005, et n'avait aspiré que mon CV. Je soupçonne donc que les skyblogueurs sus-mentionnés devront parler un peu de la BNF sur leur blog (la béhénef cé cher bien) pour que leur prose rejoigne rapidement le corpus de la grande bibliothèque.
En tout cas, le moins que l'on puisse dire, c'est que son efficacité en terme d'aspiration n'est pas très bonne. Mes logs apache montrent qu'il a souvent du mal à suivre les liens, à trouver les images, bref à faire son boulot. Mais c'est un bon début (hum).

Si vous ne souhaitez pas que votre site internet soit aspiré pour le dépôt légal, vous pouvez toujours bloquer le robot. Sachez juste que c'est illégal. Vous êtes obligé de laisser Heritrix aspirer votre prose, vos images, etc. De la même manière, si vous mettez un mot de passe pour protéger l'accès à certaines pages, sachez que les responsables du dépôt légal peuvent vous contacter pour établir des modalités d'accès libre pour leur robot.

Un peu de lecture sur le sujet :

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.