La moitié du cortex du primate non humain et le tiers de celui de l’homme sont dédiés à la vision. C’est parce qu’il est sous-tendu par une imposante machinerie cérébrale que voir est vécu par tout un chacun comme un acte perceptif simple, aisé, automatique. Derrière la simplicité phénoménologique opère pourtant la complexité biologique.
Nous, adultes, percevons aisément et rapidement les personnes et objets qui constituent notre environnement, pouvons les identifier, interpréter l’émotion exprimée par les visages, car des millions voire des milliards de neurones répartis dans différentes zones y travaillent, silencieusement, en connexion intime avec notre mémoire. Le lien profond entre vision et mémoire signifie que voir est un savoir, que nous devons mettre en place dans notre prime enfance. On parle de période sensible-critique, c’est-à-dire d’un moment privilégié dans le développement où les apprentissages doivent être construits. Pour le chaton par exemple, le premier mois de vie est crucial pour la vision. S’il est élevé dans l’obscurité pendant un mois à la naissance, il ne saura plus voir. Mais uniquement percevoir durant cette période ne suffit pas. Pour apprendre à voir correctement, le chaton doit être actif : en interagissant avec son environnement, il coconstruit le monde visuel environnant et les mécanismes de traitement de celui-ci. Il en est de même pour l’homme. Confrontés au même environnement naturel, nous mettons en place les mêmes procédures de traitement, celles efficaces pour interagir rapidement et adéquatement avec le réel.
La preuve ? Regardez la figure de la page suivante. Bien que cette image ainsi construite soit nouvelle pour vous, vous reconnaissez immédiatement et sans effort une pyramide droite et un visage d’homme à l’envers. Cette perception irrépressible, automatique, instantanée, montre l’efficacité du sens de la vision. Mais lorsque l’on examine plus minutieusement la figure, on s’aperçoit que les bords de la pyramide n’existent pas. Si nous les percevons tous, c’est que nous avons tous mis en place les mêmes mécanismes de ségrégation figure-fond. Il en est de même pour le visage avenant de Barack Obama, qui devient effrayant si on le remet à l’endroit (les yeux et la bouche sont positionnés à l’endroit dans la figure inversée). Le fait que cette incongruité ne nous saute pas aux yeux révèle là encore que nous avons mis en place les mêmes mécanismes de traitement des visages. Une personne aveugle de naissance et qui recouvrirait plus tard la vue suite à une opération ne tomberait pas dans de tels pièges visuels, car tout simplement, comme le chaton élevé dans l’obscurité, elle ne « saurait » pas voir. La raison en est que son cortex visuel, puisqu’il ne recevait pas d’information en provenance des yeux, a été utilisé et structuré pour faire autre chose, principalement reconnaître les formes par le toucher. C’est le phénomène de plasticité cérébrale : une partie du cerveau prédestiné à une fonction est capable d’en assurer une autre si la mission première n’est pas possible. Cette plasticité est massive durant la période sensible-critique et moindre par la suite, d’où la non-récupération d’une vision opérationnelle postopératoire chez l’aveugle de naissance.
Une rétine, trois fonctions visuelles
Nous avons dit en introduction que voir est un acte cérébral. C’est vrai dès la rétine : celle-ci est en fait une excroissance du système nerveux central qui a migré au niveau de l’œil au cours de l’embryogénèse, comme si le cerveau était venu directement jeter un regard sur le monde extérieur. La conversion de la lumière en activité neuronale a lieu au niveau des cellules réceptrices de la rétine qui tapissent le fond de l’œil, les cônes (il en existe environ 5 millions) et les bâtonnets (environ 120 millions). Les cônes permettent une vision détaillée, alors que les champs récepteurs des bâtonnets sont plus grands, ce qui donne une vision moins précise, plus floue. La densité des cônes est plus forte au centre, dans la région que l’on appelle la macula, et plus précisément au niveau de la fovéa qui correspond à la projection sur la rétine du point que nous fixons dans le champ visuel. Leur répartition non homogène fait que l’acuité visuelle (l’aptitude à percevoir les détails fins) est maximale à l’endroit où se fixe notre regard (c’est-à-dire à l’endroit perçu par la fovéa). Cette forme de répartition des récepteurs rétiniens permet à la vision d’assumer trois fonctions en parallèle : identifier, explorer et surveiller/s’équilibrer, que l’on peut illustrer dans l’acte de lire en marchant. Lorsque nous lisons, nous portons successivement le regard sur les différents mots qui composent le texte. Chaque fixation va permettre de positionner la fovéa sur la partie du mot à lire, afin de permettre, grâce à la forte densité des cônes à cet endroit, une analyse fine des lettres du mot et, ainsi, de l’identifier. Pendant cette analyse réalisée par la vision fovéale, la vision parafovéale (de part et d’autre de la fovéa), plus floue, renseigne l’œil sur la position des mots suivants, afin de déterminer la trajectoire de la prochaine saccade oculaire. Que fait alors la vision périphérique (correspondant essentiellement à l’analyse des bâtonnets), au codage encore plus flou ? Elle surveille l’environnement et nous donne des références spatiales qui nous aident à maintenir notre posture verticale. C’est pourquoi nous sommes capables de lire en marchant… sans trop d’accident.