{"id":11832,"date":"2019-02-05T18:43:18","date_gmt":"2019-02-05T18:43:18","guid":{"rendered":"http:\/\/dev.yogaesoteric.net\/spiritualite-universelle-fr\/la-science-confirme-les-traditions-spirituelles-1603-fr\/des-chercheurs-franchissent-un-cap-dans-le-stockage-de-donnees-dans-de-ladn\/"},"modified":"2019-02-05T18:43:18","modified_gmt":"2019-02-05T18:43:18","slug":"des-chercheurs-franchissent-un-cap-dans-le-stockage-de-donnees-dans-de-ladn","status":"publish","type":"post","link":"https:\/\/yogaesoteric.net\/fr\/des-chercheurs-franchissent-un-cap-dans-le-stockage-de-donnees-dans-de-ladn\/","title":{"rendered":"Des chercheurs franchissent un cap dans le stockage de donn\u00e9es dans de l\u2019ADN"},"content":{"rendered":"<p align=\"justify\">&#160;<\/p>\n<p align=\"justify\">Un groupe de chercheurs a r&#233;ussi &#224; stocker une grande quantit&#233; d&#8217;informations dans des brins d&#8217;ADN, en atteignant une densit&#233; th&#233;orique record de 215 p&#233;taoctets par gramme. Une technique qui ouvre de vraies pistes sur le stockage p&#233;renne d&#8217;informations, avec de s&#233;rieuses limitations toutefois sur le co&#251;t et le temps.<\/p>\n<p align=\"justify\">\n<p>    <img loading=\"lazy\" decoding=\"async\" border=\"0\" hspace=\"5\" alt=\"\" vspace=\"5\" src=\"\/all_uploads\/uploads-dec17\/martie\/06.03.2018\/15040\/15040_1.jpg\" width=\"500\" height=\"287\" \/><\/p>\n<p align=\"justify\">L&#8217;id&#233;e d&#8217;utiliser de l&#8217;ADN pour stocker des donn&#233;es initialement &#233;lectroniques n&#8217;est pas nouvelle. Des travaux sont men&#233;s en ce sens depuis des ann&#233;es, puisque l&#8217;acide d&#233;soxyribonucl&#233;ique &#8211; de son vrai nom &#8211; est une mol&#233;cule con&#231;ue justement pour transporter de l&#8217;information. Le concept est-il applicable &#224; l&#8217;informatique ? Techniquement, oui. De mani&#232;re p&#233;renne ? Aussi. Est-ce facilement exploitable ? Pas encore.\n<\/p>\n<p align=\"justify\">\n    <strong>Une id&#233;e qui n&#8217;est pas neuve&#8230;<\/strong>\n  <\/p>\n<p align=\"justify\">Dans la revue Science, les chercheurs Yaniv Erlich et Dina Zielinksi et leur &#233;quipe ont mis au point une nouvelle technique. Les r&#233;sultats obtenus sont tr&#232;s prometteurs, puisque non seulement le stockage s&#8217;est pass&#233; sans probl&#232;me, mais les lectures ont permis de restaurer plusieurs fois les donn&#233;es sans aucune erreur. Les chiffres obtenus donnent le tournis : une densit&#233; estim&#233;e de 215 p&#233;taoctets par gramme d&#8217;ADN, et un nombre de lectures avant d&#233;gradation estim&#233; &#224; 10^15. Autant dire virtuellement illimit&#233;.<\/p>\n<p align=\"justify\">Pour comprendre la technique utilis&#233;e, il faut rappeler quelques bases. L&#8217;ADN est une mol&#233;cule utilis&#233;e par le monde du vivant pour stocker, transporter et transmettre l&#8217;information, en l&#8217;occurrence le patrimoine g&#233;n&#233;tique (g&#233;nome). Cette information est stock&#233;e gr&#226;ce &#224; des paires de nucl&#233;otides : ad&#233;nine (A), cytosine (C), guanine (G) et thymine (T). L&#8217;ensemble de l&#8217;information est donc repr&#233;sent&#233; par une s&#233;quence de ces quatre lettres.<\/p>\n<p align=\"justify\">\n    <strong>&#8230; les probl&#232;mes non plus<\/strong>\n  <\/p>\n<p align=\"justify\">Le principal probl&#232;me dans le stockage d&#8217;une information dans de l&#8217;ADN est la fiabilit&#233; de la retranscription. Qu&#8217;il s&#8217;agisse de stockage ou de lecture, il peut survenir des erreurs. Il en survient d&#8217;autant plus que les scientifiques, pour obtenir assez d&#8217;ADN en vue d&#8217;y enregistrer des informations, recourent &#224; la technique PCR (r&#233;action de polym&#233;risation en chaine), qui r&#233;plique le double brin.<\/p>\n<p align=\"justify\">En outre, et comme l&#8217;expliquent les chercheurs, certaines s&#233;quences peuvent entrainer des erreurs plus nombreuses de lecture. Par exemple, la trop grande fr&#233;quence des bases C et G, ou les longues r&#233;p&#233;titions d&#8217;une m&#234;me base, comme AAAAAA, ou TTTTTT. Quelle que soit la technique utilis&#233;e, il fallait donc qu&#8217;elle soit accompagn&#233;e d&#8217;une v&#233;ritable tol&#233;rance aux erreurs.<\/p>\n<p align=\"justify\">\n    <strong>Ajouter des donn&#233;es de redondance<\/strong>\n  <\/p>\n<p align=\"justify\">C&#8217;est pr&#233;cis&#233;ment ce qu&#8217;ont fait les chercheurs. Leur technique se nomme Fountain DNA car ils sont all&#233;s chercher du c&#244;t&#233; des &#171; fountain codes &#187;. Ces derniers permettent de g&#233;n&#233;rer des donn&#233;es suppl&#233;mentaires pour les informations transmises par paquets. Plus on ajoute de donn&#233;es, plus la tol&#233;rance d&#8217;erreur devient grande, l&#8217;information r&#233;elle pouvant &#234;tre reconstitu&#233;e. Une technique qui n&#8217;est pas sans rappeler les fichiers PAR(2) notamment utilis&#233;s sur les newsgroups. Ils ont &#233;t&#233; cr&#233;&#233;s justement pour transmettre des donn&#233;es sur des liaisons de tr&#232;s mauvaise qualit&#233;, qui entrainaient des erreurs multiples. Il faut bien entendu trouver le bon ratio pour ne pas surcharger les brins d&#8217;ADN.<\/p>\n<p align=\"justify\">Le processus commence donc avec un encodage tenant compte des fountain codes. Les chercheurs obtiennent alors une grande quantit&#233; de petits paquets. Ces derniers sont ensuite cod&#233;s en s&#233;quences ADN, en s&#8217;appuyant sur les nucl&#233;otides. L&#8217;astuce est alors d&#8217;analyser le code obtenu, et de retirer toutes les s&#233;quences qui pourraient poser des probl&#232;mes &#224; la lecture. Puisque les donn&#233;es suppl&#233;mentaires sont l&#224; en solution de secours, cette suppression n&#8217;a pas d&#8217;impact sur l&#8217;information.<\/p>\n<p align=\"center\">\n    <img decoding=\"async\" alt=\"\" src=\"\/all_uploads\/uploads5\/februarie\/5\/15040_2.jpg\" \/>\n  <\/p>\n<p align=\"justify\">\n    <strong>Une densit&#233; record<\/strong>\n  <\/p>\n<p align=\"justify\">Dans une archive compress&#233;e (tarball) de 2,1 Mo seulement, les chercheurs ont pu stocker un syst&#232;me d&#8217;exploitation minimal et son interface, un film et quelques autres fichiers. Cette archive a ensuite &#233;t&#233; divis&#233;e en 67.088 segments de 32 octets. Chaque segment s&#8217;est vu ajouter 6 octets de fountain code, puis a &#233;t&#233; ensuite inscrit dans une s&#233;quence de 128 nucl&#233;otides (ou bases azot&#233;es). Une quantit&#233; suffisante pour coder de mani&#232;re fiable des fichiers pesant jusqu&#8217;&#224; 500 Mo. 38 octets repr&#233;sentant 304 bits, cette quantit&#233; &#233;tait encod&#233;e dans un brin de 152 paires de base. La redondance obtenue &#233;tait de 7 %, suffisante pour assurer une tr&#232;s bonne r&#233;silience des donn&#233;es face aux erreurs.<\/p>\n<p align=\"justify\">Tous les tests effectu&#233;s ensuite par les chercheurs ont montr&#233; que le syst&#232;me fonctionnait tr&#232;s bien. Ils ont eux-m&#234;mes ins&#233;r&#233; des erreurs ou encore supprim&#233; al&#233;atoirement des s&#233;quences d&#8217;ADN, mais l&#8217;information a quand m&#234;me pu &#234;tre restaur&#233;e &#224; chaque fois. Ils ont &#233;galement dilu&#233; l&#8217;ADN pour chercher le point de rupture (information illisible) et ont ainsi obtenu l&#8217;estimation th&#233;orique d&#8217;une densit&#233; de 215 p&#233;taoctets par gramme de mol&#233;cule.<\/p>\n<p align=\"justify\">&#192; titre de comparaison, Samsung parvient actuellement &#224; stocker 512 Go dans une puce de 1 gramme seulement (avec un d&#233;bit de 1,5 Go\/s), mais nul doute que cette capacit&#233; augmentera au fil des ann&#233;es avec l&#8217;arriv&#233;e de NAND QLC avec toujours plus de couches empil&#233;es.<\/p>\n<p align=\"justify\">\n    <strong>Pourquoi ne pas tout basculer dans l&#8217;ADN ?<\/strong>\n  <\/p>\n<p align=\"justify\">Un stockage p&#233;renne, dont l&#8217;entretien ne co&#251;terait qu&#8217;une fraction de ce que suppose un centre de donn&#233;es aujourd&#8217;hui, tr&#232;s r&#233;sistant aux erreurs et qui assure un nombre virtuellement illimit&#233; de lectures. Pourquoi ne pas d&#232;s lors construire demain des banques de stockage et passer au tout-ADN ? Parce qu&#8217;il y a bien s&#251;r des limites, principalement deux : le co&#251;t et le temps.<\/p>\n<p align=\"justify\">Une fois que l&#8217;information est stock&#233;e, les brins d&#8217;ADN peuvent &#234;tre gard&#233;s dans un endroit isol&#233;, avec peu de moyens. Mais la cr&#233;ation de ces brins d&#8217;informations co&#251;te actuellement une petite fortune : les chercheurs estiment la facture &#8211; tr&#232;s sal&#233;e &#8211; &#224; environ 3.500 dollars par Mo. Il faut cependant tenir compte de la commande initiale d&#8217;ADN par les chercheurs, qui avaient r&#233;clam&#233; des brins sans erreurs. La qualit&#233; pourrait &#234;tre revue &#224; la baisse en laissant les fountain codes faire le travail.<\/p>\n<p align=\"justify\">L&#8217;autre grand probl&#232;me est le temps n&#233;cessaire. Sans m&#234;me parler de toucher &#224; l&#8217;ADN, l&#8217;encodage de chacun des 67.088 segments prenait 2min30 en laissant faire &#171; le CPU d&#8217;un ordinateur portable classique &#187;. On pourrait &#233;videmment aller beaucoup plus vite, mais il resterait le probl&#232;me de la transcription dans l&#8217;ADN, et surtout de sa lecture : pour rappeler l&#8217;archive de 2,1 Mo utilis&#233;e pour les tests, il faudrait presque une journ&#233;e enti&#232;re.<\/p>\n<p align=\"center\">\n    <img decoding=\"async\" alt=\"\" src=\"\/all_uploads\/uploads5\/februarie\/5\/15040_1.jpg\" \/>\n  <\/p>\n<p align=\"justify\">Rappelons cependant qu&#8217;il s&#8217;agit de travaux de recherche. La technique peut donc &#234;tre largement affin&#233;e, surtout si elle devait &#234;tre un jour industrialis&#233;e. Si le stockage dans l&#8217;ADN doit devenir une technique porteuse, les co&#251;ts baisseraient immanquablement. Les soucis de performances seraient nettement plus complexes &#224; d&#233;passer, mais tous les types de stockages ne se valent pas sur ce terrain.<\/p>\n<p align=\"justify\">Ce n&#8217;est pas en effet par ce que l&#8217;ADN est consid&#233;r&#233; comme moyen de stockage que l&#8217;on doit envisager son arriv&#233;e dans les ordinateurs ou les appareils mobiles. On pourrait imaginer des banques de stockage sp&#233;cialis&#233;es dans la pr&#233;servation &#224; tr&#232;s long terme, un domaine dans lequel la mol&#233;cule pourrait avoir son mot &#224; dire.<\/p>\n<p align=\"justify\">&#160;<\/p>\n<p align=\"justify\">\n    <strong>yogaesoteric<br \/>5 f&#233;vrier 2019<\/strong><br \/>\n    \n  <\/p>\n","protected":false},"excerpt":{"rendered":"<p>&#160; Un groupe de chercheurs a r&#233;ussi &#224; stocker une grande quantit&#233; d&#8217;informations dans des brins d&#8217;ADN, en atteignant une densit&#233; th&#233;orique record de 215 p&#233;taoctets par gramme. Une technique qui ouvre de vraies pistes sur le stockage p&#233;renne d&#8217;informations, avec de s&#233;rieuses limitations toutefois sur le co&#251;t et le temps. L&#8217;id&#233;e d&#8217;utiliser de l&#8217;ADN [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uf_show_specific_survey":0,"_uf_disable_surveys":false,"footnotes":""},"categories":[359],"tags":[],"class_list":["post-11832","post","type-post","status-publish","format-standard","hentry","category-la-science-confirme-les-traditions-spirituelles-1603-fr"],"_links":{"self":[{"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/posts\/11832","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/comments?post=11832"}],"version-history":[{"count":0,"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/posts\/11832\/revisions"}],"wp:attachment":[{"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/media?parent=11832"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/categories?post=11832"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/yogaesoteric.net\/fr\/wp-json\/wp\/v2\/tags?post=11832"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}