Wordle est un petit gadget fascinant. Vous lui donnez n'importe quel texte, et il crée un nuage de mots plus ou moins colorés et plus ou moins gros suivant leur fréquence dans le texte.
Comme j'aime les tests grandeur nature, j'ai extrait, nettoyé et formaté le texte des 7466 emails personnels que j'ai écrits entre septembre 2002 et début 2010. Puis j'ai donné le résultat à Wordle, qui se charge lui-même, si on le souhaite, de supprimer automatiquement les mots les plus courants et les moins significatifs (il, je, de, la, ...). Voici donc 7466 messages résumés en un peu plus de cent mots :
Les images créées par Wordle sont régies par la licence creative commons attribution 3.0.
Pour être complet, il faut bien sûr mentionner un script équivalent pour Indesign CS4, disponible chez indiscripts.com. Donc si vous avez la CS4, foncez essayer cette petite merveille. Si comme moi vous avez la CS3, passez votre chemin :(
Le très sympatique urbanbike.com en fait d'ailleurs une revue élogieuse.









Finalement, 




Sauvegarde de bases MySQL via SVN
Il existe de nombreuses possibilités pour sauvegarder et archiver des bases de données, MySQL ou autres. En général, le protocole de sauvegarde dépend largement de l'objectif que l'on s'impose et des moyens dont on dispose.
La rétention des données sur le long terme pose bien sûr des problèmes de format et de support : vais-je pouvoir relire mes sauvegardes dans dix ans ? Elle pose aussi des problèmes de volume : puis-je me permettre d'archiver l'intégralité de mes bases une fois par jour pendant des années ?
Personne n'a de réponses absolues à toutes ces questions, car finalement tout est affaire de compromis. Dans la plupart des cas, j'utilise des scripts qui font un dump de mes bases de données, et qui archivent le résultat avec une rétention, en général, d'une semaine.
Le dump a cela de fantastique que c'est un format texte, il est donc lisible et modifiable par l'homme. Pas besoin de retrouver une version de MySQL compatible pour récupérer le contenu des bases archivées. Néanmoins il peut être assez volumineux suivant les options choisies, et le stockage à long terme peut vite devenir problématique. Dans le cadre de mon travail par exemple, le volume d'un dump pour un jour donné atteint 2,2 Go. Par contre, dans la plupart des bases de données, assez peu de données sont modifiées d'un jour sur l'autre. On pourrait économiser un maximum de place en n'enregistrant que la différence avec la veille. C'est là qu'intervient Subversion (SVN). Cet outil de versioning permet de ne stocker que la différence entre la version originale d'un fichier enregistrée initialement, et les versions ultérieures. Subversion est fourni de base avec Mac OS X, et il est disponible sur de très nombreux systèmes.
Lire le reste de cet article »