Mécanique neurale

 

Un article de Livingstone.

Ce qui suit est en rédaction ou en profond remaniement

Les cristaux et les chaînes moléculaires complexes s’assemblent avec le matériel trouvé là où ils se trouvent. La vie, elle, va chercher ses ressources, utilisant les mêmes principes de base des particules qui la composent : attractions et répulsions.

Les entités vivantes les plus simples comme la paramécie, le mycélium, la limace avancent en s’alimentant et fuient un milieu néfaste, quelle que soit la méthode choisie : reculer, s’effacer, contourner l’obstacle ou fuir en avant.

La trajectoire de ces « vivants » suivra toujours le principe de la « moindre action » ce qui peut conduire aveuglément dans un puits inerte, un piège fatal. Pour éviter cet écueil, il faut pouvoir « voir » au-delà. Or, voir directement le futur est impossible a priori. Il faut donc deviner l’avenir, ce qui peut se faire en projetant une solution par extrapolation à partir de séquences d’évènements comparables connues. Cela impose au préalable de se remémorer ces expériences déjà effectuées et par comparaison entre les prémices des situations déduire une suite probable.

Il faudra parfois reprendre le problème à l’envers comme pour la poule, qui devrait se souvenir du chemin à emprunter pour passer par le trou du grillage qui la ramènera à l’intérieur du poulailler. Mais, plus souvent, les indices mémorisés et comparables seront tellement épars, que le choix devient risqué. Pire, chaque nouvelle découverte risque d’apporter son lot de solutions utiles dans l’immédiat, mais aussi celui de dégâts collatéraux imprévus. C’est toute l’aventure de l’intelligence.

Mais cette intelligence n’a été fabriquée qu’avec de simples briques, des cellules un peu particulières qui ne font qu’une chose : propager un signal électrique. Comment une structure relativement simple comme un neurone pourrait fabriquer de l’intelligence ?

La machine neuronale

L’une des fonctions de l’intelligence est de mémoriser. Non seulement des concepts complexes, mais aussi tous les signaux qui vont contribuer à cette connaissance. Il ne peut se rappeler d’un livre, que s’il se souvient des mots et de leurs agencements pour comprendre les phrases, il n’arrive à déchiffrer le texte qu’après avoir assimilé l’alphabet, il ne donne un sens aux tracés qu’après avoir catégorisés les traits… Plusieurs cellules qui coopèrent peuvent partager un champ électrochimique. C’est utile pour propager une information, mais comment utiliser cette caractéristique pour mémoriser ?

En dehors des évènements qui détruisent une partie des capteurs ou du cerveau et ne peuvent ou ne doivent pas se répéter, tout semble être répétitions, oscillations, ondes dans la perception de l’environnement : les très courtes fréquences comme celles de la lumière qui excite la rétine, celles des fréquences sonores offrant de larges spectres à analyser, les journées, les saisons… et même les lents mouvements corporels comme ceux-là même qui conduisent à l’orgasme. Il est donc probable que le cerveau soit fabriqué pour « interpréter » des cycles, comme les jours, les saisons...

Que se passe-t-il après les premiers neurones « frontaux » qui ont reçu le signal, car il ne suffit pas de détecter quelque chose : il faut l’exploiter, sinon la mémoire ne sert à rien et il ne peut y avoir d’intelligence.

Tout d’abord, pourquoi y aurait-il une différence de « fabrication » entre ces neurones interfacés aux sens et ceux qui contribuent à la mémoire puis à l’action ? Tous ont peut-être le même modèle minimum : stocker une « brique » d’information et la propager aux autres neurones de la chaîne, laquelle peut contenir des neurones qui renvoient une partie de l’information propagée provoquant ainsi une éventuelle rétroaction très utile en cybernétique pour renforcer ou inhiber un comportement. Il existe en électronique des circuits qui permettent de diviser la fréquence. On pourrait obtenir le même phénomène si le premier neurone récepteur passait dans un état « excité », plus précisément « chargé », mais insuffisamment pour exciter le ou les suivants. Cela se passerait comme si la crête de l’onde stockait de l’énergie dans le neurone, mais qu’il fallait plusieurs crêtes pour le charger et le forcer à transporter son énergie excédentaire dans les neurones suivants de la chaîne. C’est un mécanisme simple qui ne requiert pas une spécialisation particulière de la cellule.

À quoi servirait un tel comportement des neurones qui ne se contenterait pas de transmettre tout simplement un signal d’un point à l’autre de l’organisme ? Il permettrait d’évaluer les durées et les rythmes (« rythme » pour distinguer du terme « fréquence » plus adapté aux « ondes pures »). Un pic sonore unique d’une note ne permettrait pas de percevoir l’existence même de ce son. Il faut au cerveau un train d’ondes pour l’extraire du bruit et y « voir » quelque chose. Ce tri est d’ailleurs fait au préalable par la rétine et l’oreille interne de telle sorte que les neurones directement interfacés avec les sens reçoivent un signal « utile ». À partir de cet instant, les chaînes de neurones peuvent mesurer les durées des signaux perçus.

Ce système de démultiplication de fréquence, s’il était seulement de multiplier par 2 la période à chaque passage de témoin au neurone suivant, ne nécessiterait qu’une chaîne de 10 neurones pour mesurer une durée mille fois plus longue. Si ces maillons étaient de l’ordre de 10 µm, une chaîne de 1 mm de long permettrait de mesurer des durées un million de fois supérieures, autrement dit, une période d’une seconde à l’entrée correspondrait à une dizaine de jours à l’autre bout. « Chiffonné » dans un cube cela ne ferait qu’une centaine de microns. On peut déjà penser qu’avec un tel modèle de décorticage des fréquences, la mémoire est probablement en relation avec la longueur des chaînes de neurones et donc le poids du cerveau. Un éléphant aurait donc logiquement plus de mémoire qu’une fourmi. On pourrait donc résumer que les actions de base d’un neurone sont d’emmagasiner une certaine quantité d’énergie reçue pour la redistribuer lorsqu’un seuil a été dépassé. Cela a deux conséquences : la possibilité de mesurer des durées, mais aussi, celle de produire un effet en s’associant. Cette dernière opération participe à l’« intelligence ».

Le but du cerveau est d’assurer la survie de l’organisme dont il fait partie. Il doit inciter l’entité qu’il pilote à éviter ce qui est nocif et profiter de ce qui lui est favorable. Donc ses neurones devront actionner toute une série de manettes pour cela. Une piqûre va propager l’ordre au travers d’une chaîne de commandement plus ou moins longue de manœuvrer les différents muscles qui réagiront contre l’« agression ». À ce stade, seule une « programmation » est nécessaire pour obtenir le comportement « prévu ». Mais, quand, comment et pourquoi cela devient de l’intelligence ? Nous ne sommes pas capables de définir ce qu’est l’intelligence, pas plus que ce qu’est la matière dont nous ne connaissons que des briques la constituant, mais pas la « matière » en soi. Pourtant, si l’essence de l’intelligence nous échappe, il n’est pas vain et présomptueux d’en étudier les briques pour mieux la comprendre, comme ceux qui étudient les briques de l’Univers. Mieux le comprendre, c’est peut-être le fol espoir de mieux comprendre aussi l’Humanité pour lui trouver une existence plus harmonieuse hors des sempiternels axiomes des « Vérités » qui n’ont qu’un but « dominer ».

La réaction minimum d’une chaîne de commandement neurale va donc avoir pour mission d’écarter ce qui est dommageable ou de profiter de ce qui sert à la croissance. Dans tous les cas de figure, même pour une machine sans « intelligence », il faut avant tout éviter sa destruction, sans quoi l’accomplissement de ce pour quoi elle a été créée est compromis. Au minimum, l’action entamée va provoquer une alerte imposant de changer l’action en cours. Il faut remarquer au passage que nos émotions associées au danger sont plus nombreuses que celles associées au plaisir.

Imaginons une limace particulièrement simplifiée.

1. Elle capte les signaux « significatifs » de son environnement tout en avançant et en mangeant.
2. Elle reçoit une alerte : sa nourriture la fait souffrir (toxique par exemple).
3. Elle arrête immédiatement l’action de manger et change de lieu (combien de temps ?).

Si la limace est dotée de mémoire, c’est-à-dire qu’elle dispose d’un système décrit plus haut qui temporise le transfert d’information, elle peut mémoriser certains signaux de l’environnement concomitant avec le danger. Cela lui permettra de développer une logique de causalité, mais faite « au petit bonheur ». En effet quels sont les signaux qui auront été enregistrés lors de l’alerte ? C’est comme dans les sciences expérimentales la répétition qui va conforter les relations des coïncidences. Cela se traduit dans notre schéma par la nécessité de garder une certaine distance par rapport à la source. Il est amusant là de retrouver un comportement « sage » de l’intelligence qui consiste à prendre du recul.

Schématiquement, un neurone ne transmet un signal vers le reste que s’il a assez d’énergie pour le faire, et sans le modèle linéaire simplifié à dessein, cette énergie provient du neurone précédent. Mais, ce neurone pourrait très bien recevoir une information-énergie aussi en provenance d’une autre chaîne, ce qui augmenterait l’énergie de transfert d’information. On pourrait avoir la situation suivante :

chaîne A : détection d’acide (par exemple)
chaîne B : souffrance détectée (issu par exemple de l’appareil digestif)
début de chaîne C : A+B = Danger !

Que ferait cette chaîne créée par la confluence de deux flux d’information ? Elle aurait deux fonctions : déclencher une action d’évitement du danger et mémoriser le couple A+B pour prévenir et améliorer la défense.

On peut supposer sans grand risque d’erreur que les actions les plus urgentes sont préprogrammées et ne dépendent pas nécessairement de prime abord de l’intelligence. Mais l’une des compétences de l’intelligence est celle de pouvoir comparer des choix et ensuite de les anticiper. C’est l’apprentissage. Cela ne peut donc se baser que sur la mémoire qui serait enrichie par le stockage des « informations-durées-périodicités ». En quelque sorte, il devrait être capable de comparer les résultats d’autres « coïncidences » comme « détection de lumière rouge+souffrance détectée » ou « détection d’acide+vitalité détectée », etc.

En effet, que se passe-t-il si la détection d’acide de notre exemple n’est pas associée à une souffrance dans d’autres circonstances ? C’est la répétition qui devrait pondérer les choix. Or le système décrit ici analyse précisément les répétitions, leurs fréquences et leurs durées.

Ce système linéaire simple doit s’enrichir d’autres mécanismes pour répondre à d’autres questions : par exemple, pendant combien de temps la limace de l’exemple fuit le milieu nocif ? Comment pondérer un choix ? Comment effacer ou inhiber une longue répétition (bruit constant, environnement neutre) ? Comment créer une nouvelle acquisition ?

Dans la vie courante, il y a deux grandes sortes de mémoire. D’une part, il y a celle qui sont de longue durée dans laquelle l’information est « gravée », sculpture, peinture, écriture sur divers supports, vinyle, CD, DVD... D’autre part, il existe de nombreuse mémoire « de travail » volatiles qui perdent leur information tant qu’elle ne sont pas entretenue par une alimentation constante. L’ADN gère une mémoire de longue durée, mais qu’en est-il pour un neurone ? Certaines recherches semblent indiquer que l’ADN des neurones pourrait être altéré. Sinon dans tous les cas, l’énergie emmagasinée en attente d’exploitation, c’est-à-dire de pouvoir transmettre une énergie-information aux neurones suivants, doit pouvoir rester suffisante assez longtemps pour être propager les signaux. S’agissant d’une cellule vivante, il est fort probable que alimentation de cette cellule contribue à maintenir cette stabilité.

Combien de temps la limace de l’exemple fuit le milieu nocif ? Comment pondérer un choix ? Comment effacer ou inhiber une longue répétition (bruit constant, environnement neutre) ? Comment un neurone peut dire « Non ! » ? Et de là, comment créer une nouvelle acquisition ?

Tout d’abord, l’information acquise ne doit pas se disperser, sinon il n’y a plus de programmes possibles. Pour éviter que l’information ne parte dans tous les sens, le neurone doit se comporter comme une diode. C’est précisément ce qui se passe : le signal allant des dendrites vers l’axone. Ainsi le début de la chaîne C qui prolonge l’axone est le résultat de la récolte des informations issues de A et de B au niveau des dendrites. Mais a priori, il n’y a pas de différence entre dendrites, donc les signaux en entrée devraient avoir tendance à se combiner par addition. C’est insuffisant comme opération logique, et, pour pouvoir installer une « logique neurale », il faudrait trouver d’autres mécanismes.

Si l’information s’arrête là, à A+B→C, la limace reçoit l’ordre de faire un bon en avant, puis se remet à manger, détecte à nouveau un danger, « rebondit »... À la vitesse des rebonds de la limace, on peut imaginer qu’elle risque de mourir empoisonnée, car elle resterait trop longtemps dans la zone dangereuse qu’elle testerait en permanence à chaque ingestion. Il faut donc entretenir l’ordre de fuite sans manger en même temps.

Il faut donc cesser de donner l’ordre de manger tant qu’il y a fuite, laquelle n’est chez la limace modélisée qu’une marche dont l’ordre reste entretenu pendant un « certain » temps. Cela peut devenir un programme ! En effet, il y a la notion de « tant que P est vrai, faire Q » ou « dès que P est faux, il faut arrêter de faire Q ».

On peut imaginer qu’une action exécutée en permanence tout au long de la vie du système est alimentée par un apport constant d’énergie fourni par une sorte de soupe contenant les toutes ressources nécessaires. Dans notre cas, l’instruction devra être « tant que A+B→C est vrai ne pas manger ».

Ne serait-ce pas plus facile et prudent d’exécuter la séquence « dès que A+B→C est vrai ne pas manger » et ensuite « dès que A+B→C est faux se remettre à manger » ? Cette programmation pourrait mettre à profit le principe de la mesure des durées vu précédemment. Ainsi, la limace avancerait d’un pas, puis détecterait l’acide et la douleur. Au cycle suivant, la limace ferait deux pas avant de s’alimenter et d’analyser la présence de toxique. Puis, si le danger persiste, elle ferait quatre pas, puis huit, seize, etc., doublant le nombre de pas à chaque fois que A+B→C reste vrai. Bien sûr, au départ, la douleur sera fréquente, mais le besoin de s’éloigner du danger va augmenter de manière exponentielle, et très rapidement la limace se sera éloignée de la source de désagrément... sauf évidemment si elle est trop étendue et qu’elle fuit dans la mauvaise direction. Un autre sujet à analyser.

Mais que se passe-t-il si en cour de route, il n’y a plus d’acide, mais que la douleur à l’ingestion persiste ? Ou l’inverse, si la douleur a disparu alors qu’il y a toujours de l’acide sur la route ?

Il ne faut pas que l’opération « A+B » se transforme en « A ou B », autrement dit que la limace panique seulement si l’une des deux causes de fuite en avant apparaît seule. Pour cela, le plus simple, en imaginant que la nature privilégie les solutions les plus simples, serait que les entrées, les dendrites, limitent l’énergie à transférer vers le neurone de telle manière que ni A ni B ne peuvent apporter individuellement assez d’énergie pour activer C.

Si l’on avait en plus l’équivalent d’un signal « Non », notre neurone aurait les fonctions logiques de base en plus de la propriété de diviser les fréquences. C’est le début de tout circuit logique. Mais comment provoquer un signal pour quelque chose qui n’existe pas ?

 Tous les sites de Hôdo