Doit-on imposer la vision stéréoscopique ?
Comme nous l’avions indiqué dans un article précédent sur le visiocasque, la vision est un sens actif : le système visuel a besoin de scruter en toutes directions pour construire une perception 3D de l’environnement, à partir des deux images 2D vues par les yeux. De même, toujours inconsciemment, le système oculomoteur est en action permanente, commandant l’accommodation et la convergence des yeux. En regardant un objet à moins de cent mètres environ, l’image réfléchie deviendrait floue sur la rétine si les yeux ne possédaient pas le pouvoir d’accommoder automatiquement : sous l’action des muscles ciliaires, les puissances optiques des deux cristallins varient et permettent de voir net des objets proches ou éloignés. Simultanément, les muscles des globes orbitaux permettent d’orienter les deux yeux en les faisant converger vers le point de l’espace observé. C’est le phénomène de vergence, physiologiquement lié à celui de l’accommodation puisqu’ils doivent s’ajuster tous les deux à la distance de l’objet observé.
Dans un casque, le dispositif optique, composé au minimum de deux lentilles, fournit deux images virtuelles plates focalisées à une certaine distance, issues des images des deux écrans (à 1,3 mètre par exemple pour le casque Rift d’Oculus). En conséquence, l’accommodation est figée pour les deux yeux, contrainte identique à celle imposée lors de la visualisation des films stéréoscopiques au cinéma « 3Ds » (acronyme plus exact que « 3D »).
Cette contrainte technique implique un phénomène non naturel pour notre système visuel, car nous n’avons plus la relation normale entre l‘accommodation et la vergence des yeux, liées par la distance de l’objet observé. Dans un casque, comme avec un écran plat stéréoscopique de cinéma 3Ds ou de télévision 3Ds, il en découle l’incohérence oculomotrice entre accommodation et vergence, qui est susceptible de créer des difficultés visuelles et de la fatigue pour certains utilisateurs. C’est une des causes des maux de la réalité virtuelle. Remarque : il n’y a pas qu’un « mal de la VR » (cybersickness), mais plusieurs, dus aux onze incohérences sensorimotrices éventuelles, listées dans le livre « Les casques de réalité virtuelle et de jeux vidéo ».
En conséquence, il est indispensable de proposer, à l’intention des personnes gênées par la vision stéréoscopique (3Ds), la possibilité d’une vision monoscopique dans le visiocasque, quelle que soit l’application VR. Pour les autres usagers, il faut obligatoirement limiter le décalage entre les images stéréoscopiques gauches et droites pour que l’incohérence oculomotrice soit faible et donc supportable. Cette condition impose de limiter les disparités rétiniennes entre les deux yeux : inférieures à 1,5°, voire 1°. En pratique, cela implique de positionner les objets virtuels dans un espace borné, par exemple entre 0,75 m et 3,5 m dans le Rift d’Oculus.
Depuis plus d’un siècle que l’on propose la vision stéréoscopique, on sait qu’elle n’est pas indispensable pour percevoir en trois dimensions (3D) grâce aux indices monoculaires (perspectives, tailles apparentes, etc.), acquis depuis notre enfance… Dans un visiocasque, faites l’expérience suivante : proposez à vos collègues d’évaluer une application VR en vision stéréoscopique et une heure après, proposez la même en vision monoscopique, en leur demandant s’ils perçoivent une différence de qualité… Tous n’apercevront pas la perte partielle de perception de profondeur, surtout si dans votre application, l’usager doit se déplacer autour de la scène observée, car le changement de parallaxe (changement de point de vue) est un indice plus performant pour percevoir un espace en trois dimensions que la vision stéréoscopique. Par contre, si l’expérimentateur a besoin de manipuler un objet proche, telle qu’une manette de commande, la colocalisation de ses mains est bien mieux perçue en vision stéréoscopique, très souhaitable dans cette condition.
L’évolution du visiocasque
L’avenir passe par la suppression de l’incohérence oculomotrice en modifiant le principe d’affichage des images, grâce à différentes techniques comme les écrans Light Field ou la technique VRD (Virtual Retinal Display) (voir le livre « Les casques de réalité virtuelle et de jeux vidéo »), permettant une accommodation adaptative en chaque pixel : avec ces techniques, chaque pixel sera vu à une distance d’accommodation variable, correspondant à la distance de la zone observée, qui sera aussi celle du point de convergence des yeux. On pourra alors se permettre de parler « d’hologramme » car le résultat visuel sera identique à celui que procure un véritable hologramme, et bien que le principe de l’holographie ne soit pas exploité. Ce type d’affichage sera spécialement intéressant pour les casques de réalité augmentée pour ne pas avoir la rupture d’accommodation en deux zones connexes observées, l’une réelle et l’autre virtuelle.
Notons que la plus grande difficulté de conception d’un visiocasque concernera toujours le système optique qui impose de fortes contraintes techniques : il doit être très léger, peu encombrant, low-cost et s’adapter à toute morphologie et capacités visuelles de chaque utilisateur, tout en fournissant les plus grands champs de vision. L’évolution de la qualité d’interfaçage des visiocasques ne se fera donc pas aussi rapidement que certains veulent le croire. Il a fallu vingt ans pour avoir des casques low-cost acceptables pour le grand public, malgré les fortes motivations dès les années 90 des sociétés de jeux vidéo Nitendo, Sony, Sega, etc. Il faudra des dizaines d’années pour avoir une résolution des écrans acceptable par rapport aux capacités visuelles humaines. Rappelons qu’il a fallu plus d’un demi-siècle pour avoir des écrans de téléviseurs répondant aux mêmes exigences ! Les deux grandes limites des casques actuels sont donc leur résolution d’écran modeste et, pour la plupart, leurs champs de vision encore trop restrictifs. Par contre, le temps de latence, inférieur à 20 millisecondes, comme l’exige la durée du réflexe vestibulo-oculaire (VOR) est maintenant acceptable ainsi que la fréquence d’affichage, de l’ordre de 100 Hz, permettant de percevoir des mouvements fluides, surtout couplée avec la technique Black Frame Insertion (BFI)
Dans un proche avenir, la plupart des visiocasques seront équipés de tracking des yeux, comme cela est déjà proposé dans le casque Fove. Avec un tracking des yeux ayant une très faible latence, il sera possible d’envisager plusieurs fonctionnalités visuelles complémentaires :
-
analyse et évaluation des zones observées par le spectateur, après visualisation de vidéos 360 et VR vidéos ;
-
adaptation du scénario d’une VR vidéo, ou de toute autre application VR, en fonction des zones observées par l’usager. Cet usage n’est pas encore exploité actuellement pour créer des VR vidéos à scénario adaptatif ;
-
amélioration en temps réel de la vision dans le casque par traitement des images qui sera fonction de la zone observée : flou en vision périphérique pour être plus proche de la vision naturelle, permettant, entre autres, une plus confortable vision des images stéréoscopiques.
En conclusion, la vision via un visiocasque n’est pas identique à la vision naturelle mais s’en rapproche seulement. Il faut bien comprendre les processus physiologiques et cognitifs misent en œuvre pour connaître les limites techniques actuelles et futures de cev type d’interfaçage visuel, pour l’exploiter correctement et en tirer le meilleur profit.
Philippe Fuchs
Professeur de réalité virtuelle à Mines ParisTech
Ancien président de l’AFRV
Co-animateur du collège R&D d’UNI-VR
www.philippe-fuchs.fr
Laurent Bonnotte
Chargé de cours à l’Hôpital La Salpétrière
Artiste vidéaste créateur de la série de vidéos animées « Les lendemains hybrides »
www.sante-digitale.fr/author/laurent-bonnotte
- Partager l'article :