Interview : Stéphane Coillet-Matillon, CEO de Kiwix. Archives, miroirs et approche de la sécurité
- 6 minsAvec Hack₂O nous avons commencé à Faire un miroir de sauvegarde locale d’un site web tiers avec wget et faire une bibliothèque utilisable hors d’internet. Ce qui était au départ une petite pratique qui nous dépannait est devenue une manière de faire plus largement partagée et utilisée. Cela rend alors incontournable les risques liés à cette pratique et nous oblige à poser franchement les questions de sûreté et de sécurité.
J’ai alors démarré des discussions avec des personnes expérimentées. Rysiek a répondu favorablement à ma sollicitation avec une approche généraliste sur la sécurité de l’information en cas de mise en miroir de sites web : Confidentiality, Integrity, Availability. Il travaille chez Quad9 et développe en parallèle LibResilient, un « réseau de diffusion de contenu décentralisé basé sur un navigateur », qui est lié aux questions d’accès à l’information et à l’espace des droits humains numériques.
Afin d’avancer un peu plus sur les enjeux auxquels nous faisons face avec cette pratique collective de mise en miroir, et d’aborder les questions de sécurité, voici une interview avec Stéphane Coillet-Matillon. Nous avions tous deux discuté auparavant sur Kiwix on access to vital information anywhere, including places of confinement and isolated communities.
Kiwix est une organisation à but non lucratif et un projet de logiciel libre dédié à l’accès hors ligne à des contenus éducatifs gratuits. Wikipedia, Emergency and Military Medicine, agriculture, traitement de l’eau, ressources pour les réparations, etc. le tout mis dans un boîtier pour y accéder hors Internet ou prêt à être téléchargé sur ordinateur ou smartphone, ou installé sur des microserveurs de type Raspberry Pi, dans les endroits dont les circonstances forcent le besoin. Par exemple, camps de réfugié⋅es, prisons, haute montagne, etc.
Stéphane Coillet-Matillon: Il y a en gros deux types d’accord avec des éditeurs de contenus : soit leur site est par défaut sous une licence libre, et l’accord est tacite (on les prévient quand même, par politesse et parce que finalement ça fait plaisir d’apprendre que l’on a fait le bon choix pour aider à la diffusion de son contenu). Soit on leur écrit directement pour demander la permission, et on garde la réponse sous forme de ticket. L’idée est de faire au plus simple: nous sommes dans la diffusion du savoir, pas dans le commerce de celui-ci, ça réduit les ambiguïtés et les calculs.
Stéphane: Nous ne partageons que des contenus éducatifs, donc le désagrément potentiel de voir un site d’histoires pour enfants ou d’apprentissage de la programmation circuler à travers le monde est assez limité. Mais oui, il y a des parfois des contraintes locales: pour Wikipedia par exemple certains pays ou institutions refusent la diffusion d’articles à caractère sexuel ou politiques. Mais la demande est alors du côté des déploiements et suivant le scenario on essaie de s’adapter.
Seule exception à ce jour: un site de philosophie financé par une université américaine et qui pensait que permettre à des gens sans accès à internet d’accéder quand même à leur contenu hors-ligne allait diminuer leur trafic et donc la possibilité de trouver des financements… Il n’y a pas grand-chose à répondre à cela, pour être honnête (et poli).
Stéphane: [NDLR : Stéphane demande aux personnes qui font le développement de Kiwix] Réponse pertinente des devs: on ne gère pas nous même les déploiements. Le software est libre, les gens font comme ils veulent niveau prévention et sécurité.
Cela étant dit, le logiciel ne collecte aucune donnée, et son code est complètement open-source: c’est un peu le minimum syndical en termes de sécurité, et pourtant ce n’est pas une évidence pour tout le monde.
Stéphane: Avec ce projet particulier non, pour autant que je me souvienne, mais d’autres prisons ont eu des requêtes qui nous ont un peu pris par surprise: on nous a par exemple plusieurs fois demandé de retirer de Wikipédia des articles sur des personnes qui pourraient être emprisonnées, de manière à ce que les détenus ne découvrent pas « par hasard » ce pour quoi leurs compagnons les ont rejoints (e me souviens en particulier de quelqu’un ayant commis une série de meurtres particulièrement violents et qu’il aurait fallu ainsi “effacer”). Nous avons eu également à produire une version de StackOverflow où les noms d’utilisateurs et même les avatars étaient censurés. La raison invoquée n’avait pas beaucoup de sens, mais c’est le genre de situation « enlevez tout ce qu’on vous dit ou les gens n’auront rien » où il faut faire des choix.
Stéphane: A ce stade c’est un blocage purement technique. Une mise à jour incrémentielle, c’est la possibilité de ne télécharger que la partie du fichier ZIM qui a changé depuis le dernier téléchargement (par exemple uniquement les nouveaux articles créés ou modifiés sur Wikipédia).
Dans l’absolu on a un petit Proof-of-concept, mais il faut bien comprendre deux choses:
- la « magie » de Kiwix, c’est en grande partie le taux de compression des fichiers ZIM. La compression, c’est du calcul: il faut 6 à 10 jours (selon les machines) pour créer un ZIM de Wikipédia, sur des serveurs fournis par la Fondation Wikimedia elle-même.
- 99.9% de nos utilisateurs ont un ordinateur de bureau ou smartphone de bas ou milieu de gamme.
Imaginons qu’un fichier ZIM soit un chromosome humain. Et que la mise à jour incrémentielle, ce soit non pas remplacer un seul gène, mais modifier plusieurs gènes simultanément, puis replier le chromosome qui les contient. Et qu’on demande en plus à des gens n’ayant pas fait médecine de le faire avec le couteau qu’ils ont dans la poche. Voilà ce qu’on vise. Après, j’ai assez foi en l’avenir et je pense qu’on y arrivera. Juste pas tout de suite.
Stéphane: Il n’y a pas de certification à proprement parler. Par contre (1) il y a un checksum dans chaque fichier, et donc il est possible de prouver qu’un contenu a été altéré; et (2) l’infrastructure BitTorrent qui de facto va générer des erreurs si un de nos miroirs altère des contenus.
Stéphane: Vers mon co-fondateur Emmanuel, c’est lui qui m’a dicté la plupart des réponses et il bosse dans la sécurité :-D.
Merci beaucoup Stéphane !
Cette interview sera traduite en anglais puis ajoutée au forum Hack₂O ici.
Merci à toutes les personnes qui soutiennent les efforts par leurs dons
Xavier Coadic
Human Collider