La popularité des médias sociaux a alimenté un appétit croissant pour des informations telles que les dernières nouvelles de nos amis, qu’ils soient de vrais amis ou des connaissances par Facebook. Nous désignons parfois notre collecte de toutes ces informations comme la somme de nos connaissances. Pourtant, nous nous arrêtons rarement pour réfléchir à l’essence même de l’information. Que savons-nous réellement des informations ?
Selon James Gleick, dans son livre très complet « The Information : A History, A Theory, A Flood », la définition la plus ancienne et la plus durable de l’information a été donnée par le vicaire et mathématicien John Wilkins en 1641 comme « …tout ce qui est capable d’une différence compétente, perceptible à tout sens… ». En d’autres termes, l’information est tout état physique qui pourrait être différent. Par exemple, une pièce de monnaie posée sur une table côté face pourrait être différente posée côté pile. Il s’agit donc d’un élément d’information. Si les deux faces de la pièce étaient identiques, alors il n’y aurait pas d’information. Par ailleurs, la présence même de la pièce sur la table constitue une information puisqu’elle pourrait être absente. La présence ou l’absence d’une particule constitue également une information
L’information est donc partout. Le physicien d’IBM Rolf Landauer a déclaré en 1961 que « l’information est physique ». Chaque particule physique de l’univers implique une information par son existence, toutes ses propriétés, sa position et son interaction avec toutes les autres particules. C’est pourquoi les physiciens constatent que notre univers contient beaucoup plus d’informations que le nombre total de particules élémentaires.
Cependant, cette perspective de l’information est très éloignée de ce que nous considérons habituellement comme de l’information. La plupart des informations décrites ci-dessus sont inaccessibles, inintelligibles et sans intérêt pour le citoyen moyen. Pour combler cette lacune, nous devons nous tourner vers l’ingénieur en communication.
L’ingénieur en communication concentre son attention sur un très petit sous-ensemble d’informations intéressant les physiciens. À l’ère de l’informatique, les informations sont quantifiées et décrites par une série de 0 et de 1, en utilisant tout objet ou dispositif physique qui a un état « marche » ou « arrêt » et qui peut être transmis rapidement d’un endroit à un autre. Tout état physique qui représente un 0 pourrait être différent en étant un 1, et vice versa. En définissant soigneusement un ensemble de conditions normalisées pour représenter ces 0 et ces 1, l’ingénieur en communication permet la transmission d’un message. Claude Shannon est l’ingénieur des Bell Labs qui a le plus contribué à définir et à quantifier l’information dans son article fondateur de 1948. Il a permis de maximiser la quantité d’informations pouvant être transmises, en permettant de distinguer les états « marche/arrêt » qui constituent des informations souhaitées de celles qui constituent du bruit de fond, c’est à dire des 0 et des 1 non souhaités.
L’ingénieur ne se soucie pas du message transmis, mais seulement de l’intégrité des états « marche/arrêt » transmis. Le terme « information » pour un tel ingénieur se rapporte au flux d’états marche/arrêt qui est capable de transmettre un message. Par exemple, un signal de télévision est un signal numérique cohérent qui transmet une certaine image, mais l’ingénieur ne se soucie pas de l’image réelle transmise, qu’il s’agisse d’un match de football ou d’un film classique.
Mais nous, qui sommes les récepteurs de ce message, ne sommes pas vraiment intéressés par une telle vision mécanique de l’information. Nous ne nous soucions que de la signification de l’information. Qui a gagné le match ? Qui est le coupable de ce meurtre mystérieux ? Pour nous, l’information est une question de sens. D’où vient cette signification et comment est-elle liée aux états physiques décrits ci-dessus ?
Les informations qui nous intéressent dans notre vie quotidienne sont généralement encodées sous forme numérique à l’aide d’un code de signification standard. Par exemple, la langue anglaise est un code qui confère une signification à des caractéristiques physiques, telles que les lettres anglaises écrites ou les sons anglais parlés. Ces caractéristiques physiques sont ensuite codées sous une forme numérique binaire que les ingénieurs en communication peuvent facilement transmettre. Le récepteur de ces informations peut alors décoder ces 0 et ces 1 en utilisant le même code que l’émetteur a utilisé. Si l’expéditeur utilisait un code unique inconnu des autres, le récepteur ne pourrait pas décoder le message, à moins que l’expéditeur ne trouve un moyen de transmettre le code secret au récepteur. Le code utilisé est indépendant du message. Divers systèmes et codes physiques peuvent être utilisés, mais il est important de noter que l’expéditeur attribue une signification aux états physiques à l’aide d’un code. La signification n’est pas déterminée par les paramètres physiques qui transmettent le message. Seuls ceux qui savent comment l’expéditeur a encodé le message peuvent vérifier si le récepteur a correctement décodé le message. Si un agent intelligent a encodé le message en utilisant une relation abstraite, alors un agent intelligent connaissant cette relation est nécessaire pour le décoder. Une analyse détaillée des états physiques qui effectuent la transmission du message ne peut pas déterminer la signification du message sans la connaissance du code.
Jusqu’à présent, nous avons examiné trois perspectives de l’information. (1) Le physicien voit l’information dans chaque état physique distinct. (2) L’ingénieur en communication définit l’information comme un ensemble d’états physiques bien définis, généralement des ondes électromagnétiques, qui peuvent être facilement transmises par des fils ou sans fil à la vitesse de la lumière. (3) Le récepteur de ces communications perçoit l’information comme la signification de ces états physiques transmis. Il s’agit de trois perspectives radicalement différentes. D’autres types d’informations peuvent également être décrits, mais ces trois perspectives sont suffisantes pour nous aider à comprendre les concepts essentiels. Étant donné qu’une grande partie des conversations sur l’information aujourd’hui se rapportent au domaine des sciences de la vie, il est utile de réfléchir aux différentes façons dont les biologistes définissent et comprennent l’information.
Tous les organismes biologiques sont composés de cellules qui contiennent une ou plusieurs molécules d’ADN. L’ADN est une chaine formée d’une succession d’unité, les paires de bases nucléotidiques. Le nombre de ces bases, constituant le génome, peut être assez important, plus de 3 milliards de nucléotides chez l’homme. De plus, l’ADN peut être modifié de manière spécifique, ce qui influence son comportement. La molécule d’ADN est assez longue, mais aussi incroyablement fine, de sorte qu’elle peut s’enrouler et s’empiler dans le noyau relativement petit de nos cellules, à l’aide de protéines telles que les histones. La configuration et la forme mêmes de la molécule sont essentielles à une grande partie de sa fonction.
Lorsque le biologiste étudie les informations contenues dans l’ADN du point de vue du physicien, la quantité d’informations présente dans le génome se révèle insondable puisque des configurations innombrables sont possibles. La séquence formée par la succession des nucléotides combinée à la forme de la molécule d’ADN repliée constituent ensemble des informations. La plupart de ces informations ne sont pas significatives.
Cependant, du point de vue du physicien, l’importance réside dans la manière dont l’information est modifiée, générée et conservée. Les processus biochimiques et physiques qui modifient la structure sont essentiels pour comprendre ce qui constitue l’information et comment elle est établie.
La division cellulaire exige que le génome soit dupliqué ; un ensemble d’enzymes y parvient de manière assez fiable, mais chaque copie qui est faite semble présenter une petite variation. Le fait que ces variations soient extrêmement faibles contribue à la stabilité et à la reproductibilité des caractéristiques clés d’un organisme ou d’une cellule.
Et le fait que ces variations existent et ne soient pas nulles signifie que des changements sont possibles et que de nouvelles informations sont générées à chaque étape de la reproduction. Il n’est cependant pas possible, au moment de la réplication de l’ADN, de déterminer les répercussions de ces informations. En d’autres termes, il est impossible de déterminer avec certitude quels sont les conséquences positives, négatives ou neutres de ces changements pour la survie de l’organisme ou de la cellule. Leur influence dépend non seulement de l’information génétique elle-même, mais aussi de l’environnement dans lequel l’organisme se trouve
Le point de vue de l’ingénieur en communication permet au biologiste de se concentrer sur la petite partie du génome qui code pour les protéines et autres molécules biochimiques fonctionnelles, moins de 2% chez l’homme. On les appelle des gènes. La recette pour traduire la séquence de nucléotides en une protéine, ou autre molécule fonctionnelle, se déduit aveuglément d’un code génétique, essentiellement de la même façon que les messages humains sont décodés à partir d’une forme numérique. Toutefois, ce code génétique n’est pas externe à l’ADN mais est lui-même codé dans l’ADN. Contrairement à tout système d’information conçu par l’homme, ce n’est pas un sens attribué à la structure physique par une source externe, mais c’est inhérent à la structure physique de l’ADN lui-même. Ce code génétique n’est pas universel et peut donc différer, même légèrement. Par exemple, l’ADN mitochondrial, qui réside dans la partie de la cellule qui fournit l’énergie à la cellule, utilise un code génétique légèrement différent de celui de l’ADN du noyau. De plus, plus de 20 codes génétiques différents ont été découverts dans la nature. Chacun d’entre eux est physiquement codé dans l’ADN de manière élégante, récursive : le code traduit les protéines mêmes qui déterminent le code.
L’information contenue dans le génome prend de nombreuses formes. Outre la séquence des nucléotides dans les gènes eux-mêmes, il y a des informations dans la forme même de la molécule d’ADN repliée et dans ce qu’on appelle l’épigénome, où diverses petites molécules peuvent être attachées à l’ADN. Même les régions non génétiques qui constituent environ 98% de l’ADN contiennent des informations qui aident à réguler les quantités relatives de protéines à produire. La quantité d’informations contenues dans le génome est vraiment insondable.
La perspective qui intéresse le plus le biologiste est la signification de l’information. Quels messages sont véhiculés par les informations stockées dans cette incroyable molécule ? Tout le domaine de la biochimie est axé sur le déchiffrage des mécanismes d’action des molécules codées par l’ADN. Un premier niveau de compréhension est l’ensemble des fonctions rendues possibles par ces molécules dans l’environnement de la cellule. Les gènes codent pour des protéines et des molécules d’ARN qui, ensemble, remplissent une myriade de fonctions que nous reconnaissons comme étant la manifestation de la vie. Ces fonctions forment un large spectre d’activité qui conduit finalement à la reproduction réussie de la cellule et, éventuellement, de l’organisme hôte. Si la reproduction échoue, cette séquence d’ADN particulière cesse d’exister et ne sera plus jamais répliquée. Si la reproduction réussit, la structure originale est répliquée avec seulement quelques légères modifications. Comme les modifications sont très faibles par rapport à l’ensemble de la structure, la probabilité de survie est élevée. Des modifications se produisent toujours, elles engendrent le minimum nécessaire de variations pour permettre l’apparition d’une nouvelle fonction, ou la modification d’une fonction existante.
Un deuxième niveau de compréhension des informations contenues dans l’ADN est l’histoire évolutive ancestrale enregistrée dans la molécule. Chaque cellule est le produit d’une très longue série d’événements reproductifs réussis avec de légères modifications à chaque étape. Les généticiens peuvent donc déchiffrer de nombreux éléments clés de l’histoire de cette lignée en notant à la fois les similitudes et les différences avec d’autres molécules d’ADN.
Il est à noter que les messages transmis par la molécule d’ADN ne sont pas des messages qui lui sont attribués par un agent externe avec un code externe. Le code lui-même est contenu dans la molécule et les messages sont l’activité biochimique de la molécule elle-même et non une signification attribuée à la molécule. La signification et l’efficacité des messages dépendent de l’interaction de l’ADN avec son environnement. En d’autres termes, aucun agent intelligent n’est nécessaire pour coder, décoder ou vérifier les informations contenues dans l’ADN.
La question fascinante est de savoir comment une molécule aussi incroyablement complexe et efficace a pu exister. Le mystère de l’origine de la vie n’a pas encore été résolu et fait l’objet de beaucoup d’intérêt et de recherches. La structure complexe et hiérarchique du génome avec son code intégré a conduit beaucoup de gens à spéculer sur le fait qu’un agent externe a dû être impliqué dans son origine. Mais aucun argument convaincant pour la plupart des scientifiques n’est apparu concernant soit un tel agent, soit une caractéristique de l’information de l’ADN qui ne pourrait provenir que d’un agent extérieur. D’autres cherchent à appliquer la loi dite de conservation de l’information qui prétend que seuls les agents intelligents peuvent générer de nouvelles informations. Cependant, cette loi ne s’applique qu’à certains types d’informations, comme la signification attribuée aux états physiques. Elle ne s’applique pas aux informations présentes dans les états physiques des molécules d’ADN qui sont simplement le potentiel biochimique de la molécule. La molécule d’ADN peut se modifier par des processus tels que les mutations ponctuelles, la duplication des gènes et d’autres mutations, ce qui modifie l’activité biochimique et donc l’information. Aucune signification abstraite n’est ou ne doit être attribuée à l’ADN. Les messages significatifs dans l’ADN sont intrinsèquement transmis et codés dans l’activité physique de la molécule elle-même. Aucun agent intelligent n’est nécessaire pour générer ou interpréter le code.
Un jour, nous pourrions apprendre les secrets de l’origine de la vie. Plus nous acquérons de connaissances sur les informations contenues dans le génome, plus il semble incroyable que de tels systèmes biologiques merveilleux puissent exister. La puissance créatrice de Dieu est amplement évidente dans la structure même de chaque cellule de notre corps. Tout comme Dieu a créé les galaxies, les systèmes solaires et les planètes par la force de gravité, il semble qu’il ait créé la diversité de la biosphère par l’efficacité de la reproduction biochimique et les variations issues des mutations. Quel privilège de pouvoir étudier l’œuvre de Dieu et de pouvoir l’adorer.
Publié la première fois dans « God and Nature » le magazine (hiver 2015) de l’ASA (The American Scientific Affiliation, une association américaine qui regroupe plus de 2 000 scientifiques chrétiens)
https://godandnature.asa3.org/isaac-knowledge-of-information.html
Traduit avec autorisation par Jean-Pierre Adoul.
Crédit Illustration : Gerd Altmann de Pixabay