Les logiciels ont leur « bibliothèque d’Alexandrie »

Baptisée Software Heritage, elle a pour vocation d’archiver l’intégralité des codes source de la planète et de les rendre accessibles à tous.

Une immense bibliothèque virtuelle vient d’ouvrir ses portes. Il y a quelques jours, l’Institut national de recherche en informatique et en automatique (Inria) a mis en ligne Software Heritage, une archive universelle des codes source de logiciels.

Plus de 4 milliards de codes en ligne

Les codes source sont des lignes de textes qui fournissent aux machines des instructions à suivre. Ils nous permettent d’écrire par messagerie instantanée, naviguer en ligne, ou encore lancer une machine à laver. « Les codes source sont omniprésents dans notre quotidien, assure Roberto Di Cosmo, le directeur de Software Heritage. C’est un langage conçu par les développeurs pour être accessible à l’être humain. » Les logiciels ont gagné une telle importance dans nos vies qu’ils font partie de notre patrimoine numérique, que l’Unesco définit comme « notre héritage du passé, ce avec quoi nous vivons aujourd’hui, et ce que nous transmettons aux générations futures ». L’organisation s’est d’ailleurs associée à l’institut de recherche français qui est à l’origine du projet.

L’objectif de l’Inria est ambitieux : récolter, conserver et partager les codes source des logiciels du monde entier. Cela représente des milliards de lignes de texte : à titre d’exemple, Android contient à lui seul plus d’une centaine de milliers de lignes de codes, comme le représente

cette infographie. Moins de trois ans après le lancement de l’initiative, plus de 4 milliards de codes source sont déjà accessibles en ligne. On peut trouver les instructions du logiciel de navigation d’Apollo 11, qui a amené Neil Armstrong à poser son pas sur la Lune, mais aussi des jeux et des navigateurs web.

Conserver dans la durée

Les bibliothécaires numériques fouillent notamment dans les plateformes de développement et de distribution de logiciels pour alimenter leur archive. En effet, elles donnent déjà accès à des milliers de logiciels, mais n’ont pas vocation à les conserver dans la durée. « Il n’y aucune garantie qu’un code trouvé aujourd’hui sur une plateforme y sera encore dans deux mois, observe Roberto Di Cosmo. Lorsque [la plate-forme de développement open source] GitHub a été racheté par Microsoft, certains développeurs ont fermé leur compte et emmené leurs codes avec eux. » Le professeur d’informatique s’intéresse aussi à l’archivage de logiciels propriétaires (comme Microsoft Office et Adobe Photoshop). La plateforme Software Heritage les conserverait sous embargo puis, après expiration du copyright, les révélerait en ligne à la portée de tous.

Tout en récoltant les logiciels, l’équipe les testera afin d’alerter sur d’éventuelles erreurs et ainsi contribuer à améliorer la qualité des codes source. Au-delà de son caractère patrimonial, cette bibliothèque devrait donc également être utile aux développeurs. Face à cette tâche colossale, la dizaine de personnes à l’œuvre semble bien modeste. Mais elle est épaulée par des partenaires comme Crossminder et Qwant, et compte sur l’appui de sponsors – dont la Société Générale et Microsoft – pour renforcer les financements engagés par l’Inria. Le directeur du projet aspire déjà à la création d’une fondation à but non lucratif pour pérenniser l’initiative. « Il est tout à fait jouable de stocker, un jour, tous les codes sources de tous les logiciels de la planète. Petit à petit, on va y arriver. »

Source : www.sciencesetavenir.fr

%d blogueurs aiment cette page :