Le code QR sous forme de poudre: des chercheurs belges mettent au point une nouvelle façon de stocker des données

© UGent
Pieter Van Nuffel Journalist DataNews

Des informaticiens et des chimistes de l’UGent ont conjointement mis au point un processus chimique de stockage de l’information sous la forme d’une poudre.

Qu’il s’agisse de comptes bancaires, de vidéos YouTube ou de codes QR, tout est stocké sous forme de 1 et de 0. Aujourd’hui déjà, on stocke tellement de données qu’on peut craindre que l’équipement de stockage actuel ne soit plus capable de conserver toutes ces informations. De plus, ce stockage de données à grande échelle a aussi un impact écologique: non seulement à cause des métaux lourds nécessaires pour produire les clés USB ou les disques durs, mais aussi à cause des centres de données très énergivores. “Des entreprises telles Google ont quasiment besoin d’une centrale nucléaire à côté de leurs serveurs pour faire tourner tous leurs ordinateurs”, déclare le professeur Filip Du Prez du Vakgroep Organische en Macromoleculaire Chemie (UGent, Faculteit Wetenschappen). “Voilà pourquoi nous avons recherché une manière économe en énergie de stocker les données.”

Le groupe de recherche de Du Prez a uni ses forces avec des collègues informaticiens et biochimistes de la même faculté. Conjointement, ils ont réussi à stocker un fragment de texte et un code QR dans des macromolécules. Le résultat de ce travail interdisciplinaire a été publié vendredi dernier dans la revue scientifique Nature Communications.

Inspirés par la nature

Le stockage de données numériques dans des molécules n’est en soi pas nouveau. Le côté innovant réside avant tout dans le support de stockage: les chercheurs gantois n’ont dans ce cas pas utilisé l’ADN, mais bien des macromolécules synthétiques.

Jusqu’à présent, les chercheurs s’inspiraient surtout de la nature: pour ses possibilités de stockage, l’ADN représente un inégalable transmetteur d’information. Celle-ci est déterminée par l’ordre dans lequel se trouvent les quatre lettres de l’alphabet ADN (les paires de base A, C, G et T). C’est comme pour un livre: l’ordre des lettres détermine l’information du livre et non le papier sur lequel le texte est écrit.

Il y a six ans, George Church, généticien à l’université d’Harvard, avait réussi à stocker 53.400 mots, 11 illustrations au format JPG et un programme JavaScript dans de l’ADN synthétique. L’année dernière, ses collègues d’Harvard ont réalisé pareille prouesse dans de l’ADN naturel au moyen de la technique CRISPR. Ils parvinrent à stocker une animation gif d’un cheval au galop dans le génome de bactéries, après quoi ils purent reconstruire cette vidéo avec une précision de 90 pour cent. Et au début de cette année, un étudiant doctorant belge remporta un concours qui avait débuté il y a des années parce qu’il réussit à déchiffrer un message qu’un chercheur britannique avait intégré à de l’ADN synthétique.

Ce genre d’archivage de données sur base de l’ADN présente des avantages. Alors que nous ne pouvons plus lire nos disquettes datant d’une vingtaine d’années, l’information stockée dans l’ADN dans les conditions requises peut tenir le coup des milliers d’années. C’est ainsi que l’ADN de la momie des glaces Ötzi était encore suffisamment intacte que pour en puiser de l’information utile.

“Mais l’ADN a aussi ses limites sur le plan de la stabilité”, souligne Du Prez. “C’est une molécule soluble dans l’eau et sensible à l’hydrolyse.” A la lumière du soleil, l’ADN peut en outre être rompu à cause des UV. On pourrait certes congeler l’ADN, mais il faudrait alors soit le transférer dans la calotte glaciaire, soit le refroidir en consommant de l’énergie.

Les chercheurs gantois voulaient donc trouver une façon non seulement stable, mais aussi économe en énergie de stocker des données. Ils recherchèrent un support alternatif et aboutirent ainsi à des matières synthétiques résistant à la température et hydrophobes. “Au cours du siècle précédent, les plastiques ont suffisamment démontré leur utilité pour la société”, explique Du Prez.

Davantage d’éléments pour un prix inférieur

De plus, il est possible avec ces molécules synthétiques d’ajouter nettement plus d’éléments à votre ‘alphabet’. “Les quatre lettres de l’alphabet ADN correspondent à 2 bits. On a donc besoin de grandes molécules pour pouvoir stocker des données. Si vous voulez toutefois passer à du stockage de téraoctets, ces quatre paires de base ne suffisent pas”, ajoute Du Prez.

Grâce au support utilisé par les chercheurs gantois, cette limite n’existe plus. “A un moment donné, on arrive à vingt éléments. Avec des macromolécules nettement plus petites qu’une molécule ADN typique, il est possible de stocker beaucoup plus d’informations.” Et le prix représente aussi un avantage: “Les éléments chimiques sont bien plus économiques que dans le cas de l’ADN synthétique.”

Ode au découvreur de l’anneau de benzène

Les chercheurs ont démontré leur idée en intégrant un code QR dans une macromolécule synthétique. Il renvoyait à la page Wikipedia d’August Kekulé, ce chimiste allemand qui s’est fait connaître, après avoir découvert la structure de l’anneau de benzène, alors qu’il était professeur à l’université de Gand. “Notre résultat final est une poudre contenant un code QR, qui peut être lu au moyen d’un équipement spécialisé”, explique Du Prez.

Le processus de traduction du code QR-code vers les molécules et inversement.
Le processus de traduction du code QR-code vers les molécules et inversement. © UGent

Les chercheurs ont créé dans ce but deux programmes qui ont permis le traitement de l’information de manière à la fois rapide et automatique. Le premier programme s’assure que l’analyse des données sur les molécules ne dure que quelques secondes, alors que le second automatise le processus de traduction du code QR vers les molécules et inversement.

Il est possible qu’à longue échéance, ce processus remplace la clé USB par une poudre, dont les molécules soient directement liées à un site web ou à une appli. Mais Du Prez tempère quand même les attentes: “Il s’agit là encore d’une preuve de concept d’un très faible stockage de données. Nous sommes loin encore de connaître les possibilités de l’ADN synthétique.”

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire