Otras publicaciones:

Book cover

9789871867936_frontcover

Otras publicaciones:

9789877230444-frontcover

9789877230390-frontcover

5 Las imágenes de realidad virtual[1]

5.1. Introducción

Aunque hay antecedentes que datan de la década de 1960, las imágenes de realidad virtual (RV) han tenido un crecimiento considerable hacia alrededor de 2014 y 2015, cuando se produjo la expansión de los teléfonos celulares inteligentes (smartphones) que podían funcionar como sus pantallas. Vinculada de diversos modos con distintos lenguajes visuales o audiovisuales como la fotografía, el cine o los videojuegos, numerosos autores coinciden en señalar la realidad virtual como una de las tecnologías que tomarán la escena en los próximos años y que conducirán cambios en el modo de vincularnos tanto con los espacios como con los objetos y las personas que los habitan.

Es altamente probable que lo que hoy conocemos como “experiencias de realidad virtual” sea un fenómeno acotado en el tiempo, un momento en una transición hacia otro tipo de imágenes o dispositivos que buscarán acentuar todavía más su realismo, su carácter inmersivo y sus posibilidades de interacción. Aun así, en las páginas que siguen, nos proponemos describir lo que se observa hoy en relación con estas experiencias. Buscaremos situar nuestra indagación en algunos aspectos diferenciales del fenómeno que constituyen su especificidad, y que por tanto –podemos presumir– seguramente permanezcan –probablemente integrados o combinados de maneras diversas– cuando las actuales tecnologías de realidad virtual continúen su desarrollo.

Comencemos por describir muy brevemente a qué se llama hoy “imágenes de realidad virtual”. En principio, señalemos que estas imágenes pueden ser de muy distinta naturaleza, como veremos enseguida: digamos, para empezar, que pueden tener su origen tanto en un registro de video como en una síntesis por computadora. Para ver este tipo de imágenes, la persona (que llamaremos con asiduidad “el usuario”, tomando este término de los estudios referidos a los consumos digitales) debe colocarse un dispositivo frente a los ojos, conocido como “casco” o “anteojos”. Estos anteojos son en verdad una pantalla que queda muy cercana a los ojos. Por su estructura cerrada, los anteojos de realidad virtual obturan toda posibilidad de ver el mundo exterior, es decir: la totalidad del campo visual queda tomado por las imágenes que se ven en las pantallas. La particularidad que tienen estas imágenes es que son tridimensionales y en 360º: cuando el usuario gira la cabeza, la proyección cambia en forma sincronizada y puede ver lo que está “detrás” o “encima” de él en la imagen; si mira hacia abajo, ve el suelo figurado. Por esa razón, la sensación es la de estar dentro de la escena que se está observando, lo que ha hecho que estas imágenes se denominen “inmersivas”. Si bien las imágenes pueden ser estáticas (por ejemplo, en el caso de las “fotografías de realidad virtual”), lo habitual es que sean móviles y con audio, por lo que se puede ver en ellas una sucesión de acontecimientos con la sensación de “estar allí”; esto probablemente explique la denominación de “experiencias” que se le ha dado a buena parte de las producciones de RV. Son estas “experiencias” las que tendremos en el horizonte en este capítulo cuando describamos las imágenes de realidad virtual. A lo largo de sus páginas, volveremos sobre cada una de las particularidades que hemos señalado para describirlas con mayor profundidad y problematizarlas, con un conjunto de preguntas que buscarán dar cuenta de la especificidad del dispositivo de realidad virtual y de las imágenes a él asociadas.

5.2. Breve historia de la realidad virtual

Una reconstrucción genealógica de la realidad virtual no debería dejar de incluir, al menos, tres hitos, correspondientes a sendos dispositivos. Cada uno de ellos, empleando técnicas muy diversas, puede considerarse un antecedente de la realidad virtual, por su coincidencia en la búsqueda de la generación de imágenes en tres dimensiones o con una visión panorámica de 360º.

El primero de ellos es la pintura de panoramas, que tuvo su auge en el siglo XIX, y que proponía ya entonces una visión en 360º. Como mencionamos recién, este tipo de visión es también propio de los dispositivos de realidad virtual: “El término Panorama se utilizó en el siglo XIX para designar gigantescas pinturas circulares, que eran la generalización lógica de la perspectiva renacentista, un tipo de pintura que permitía una visión de 360° al espectador” (Bastida de la Calle, 2001: 206). En estas pinturas, de gran tamaño, el espectador se sitúa parado en la zona central, por lo que queda rodeado de la obra, que puede apreciar en cualquiera de las direcciones en las que mire.[2]

El segundo dispositivo son los estereoscopios, inventados por Charles Wheatstone en 1840. Estos viejos instrumentos ópticos trabajaban con dos imágenes planas de un mismo objeto, en las cuales el objeto se veía desde dos puntos de vista poco separados entre sí (ver figura 5.1.). Cada una de ellas era mostrada a un solo ojo, y –en forma similar a lo que ocurre con la visión ordinaria– esto generaba en los espectadores la ilusión de relieve o tridimensionalidad. Como veremos enseguida, el mismo principio es empleado por los cascos de realidad virtual para generar la ilusión de tridimensionalidad en los usuarios.

estereoscopio-editado

Figura 5.1. Un estereoscopio del tipo de los creados por Wheatstone. Imagen: Antigüedades Barón.

Finalmente, deberíamos incluir también en este repaso inicial los cascos con visor empleados originalmente en aviación de combate estadounidense desde la década de 1970 conocidos como Head-Mounted Display (HMD), que pueden considerarse un antecedente no solo de la realidad virtual, sino también de la tecnología conocida como “realidad aumentada” (en inglés, augmented reality). Al igual que en otras áreas de la tecnología, también en la realidad virtual fueron las investigaciones bélicas las que desarrollaron más tempranamente dispositivos de visionado con el empleo de cascos y pantallas. Existen HMD de muy diverso tipo (para uno o dos ojos, con pantallas tradicionales o semitransparentes, etc.); no es nuestra intención profundizar aquí en toda su diversidad, sino señalar que los HMD constituyen un antecedente técnico directo de los cascos de realidad virtual.[3]

Según Howard Rheingold, los inicios de la imagen de realidad virtual propiamente dicha pueden ubicarse en 1966. De acuerdo con lo que reseña este autor, fueron Ivan Sutherland y sus colegas quienes comenzaron a investigar un prototipo de realidad virtual ese año, con la financiación de la Agencia de Proyectos de Investigación Avanzada de Defensa y la Oficina de Investigación Naval de los Estados Unidos. La idea de Sutherland era generar una representación tridimensional que le diera al usuario una imagen en perspectiva que cambiara cuando este se moviera.[4]

En sus versiones iniciales, la realidad virtual trabajaba con dos monitores:

El ordenador seguía la trayectoria de la cabeza del espectador y en función de ésta ajustaba la perspectiva de la imagen del ordenador. El visualizador en sí mismo constaba de dos monitores de seis pulgadas montados junto a las sienes. Proyectaban una imagen que aparecía superpuesta en el campo de visión del espectador (Manovich, 2001[2006b]: 155).

El fundador de la conocida revista Wired, Kevin Kelly, cuenta que sus primeras experiencias de realidad virtual fueron en 1989 en compañía de Jaron Lanier: armado de un casco y de guantes, pudo trasladarse a un mundo de síntesis con aires de dibujo animado que a su vez podía compartir con otro avatar, correspondiente a Lanier. Según Kelly, fue Lanier quien llamó a este tipo de experiencias “realidad virtual”.

Kelly señala que, si bien todos los elementos principales de la realidad virtual estaban listos por ese entonces –el casco, los guantes, la experiencia inmersiva social–, faltarían varios años para que los costos se volvieran accesibles para los grandes públicos, lo que se logró recién con la llegada de los teléfonos inteligentes o smartphones. Reseña Kelly:

Veinticinco años más tarde, surgió un salvador impensado: el teléfono inteligente. Su éxito global elevó la calidad y a la vez redujo el costo de las pantallas de alta resolución pequeñas. Así, las pantallas de RV podían tomar prestados los giroscopios y sensores de movimiento incorporados a los teléfonos para darles seguimiento a la cabeza, la mano y las posiciones del cuerpo por costos muy accesibles. Además, el poder de procesamiento del chip de uno de estos teléfonos era igual a una vieja supercomputadora, lo que les permitía mostrar películas en la pequeña pantalla con facilidad […]. Todas las pantallas de RV montadas en la cabeza de hoy se construyen a partir de esta tecnología de teléfono barato (Kelly, 2016).[5]

5.2.1. Una genealogía de la pantalla

En su reconstrucción histórica de la genealogía de la pantalla, Lev Manovich habla de un “fenómeno intrigante” del período moderno, que comienza con el cuadro pictórico: “La existencia de otro espacio virtual, de otro mundo tridimensional, que está encerrado en un marco y situado dentro de nuestro espacio normal” (Manovich, 2001[2006b]: 147). Dispuestos en los espacios de la vida cotidiana, los cuadros vienen a traer un componente de novedad. En efecto, en los espacios que transitamos en el día a día (piénsese, por ejemplo, en un living-comedor), los modos de disposición de los objetos (mobiliario, utensilios, lámparas) presentan una organización de alta previsibilidad. Al decir de Marita Soto, se observa allí una sintaxis estable que está basada en la repetición: “En un cierto nivel general de la organización o configuración de los espacios (definidos por una función), se puede pensar que opera una retórica de la reiteración, campo nítido de la verosimilitud y del hábito” (Soto, 2014: 119). Soto señala que las paredes, con su posibilidad de colgar cuadros, fotografías y otros tipos de imágenes figurativas, introducen en esa cotidianidad un componente novedoso, una suerte de ventana que permite una “fuga” de ese espacio habitado todos los días:

La particularidad de las paredes es que su funcionalidad se oculta detrás de su condición de plano disponible, comportándose como soporte de la fantasía, de lo otro, del juego, y se transforma, de esta manera, en una superficie con capacidad metafórica (Soto, 2014: 148).[6]

A partir de reflexiones acerca del dispositivo del cuadro, Manovich expresa lo que él entiende como la “pantalla clásica”, que define de este modo:

Es una superficie plana y rectangular. Está pensada para una visión frontal […]. Existe en nuestro espacio normal, en el espacio de nuestro cuerpo, y actúa como una ventana abierta a otro espacio, que es el espacio de la representación y que normalmente presenta una escala diferente a la de nuestro espacio habitual (Manovich, 2001[2006b]: 147).

Con el surgimiento del cine, apareció también la pantalla que Manovich llama “dinámica”, en la que lo que se ve cambia con el tiempo; junto con el cine, el video y la televisión también comparten este tipo de pantalla. Esta pantalla sigue limitada a un espacio rectangular, aunque el régimen visual que trae aparejado –fundamentalmente el cine– busca lograr una cierta plenitud visual:

Aunque la pantalla sólo es en realidad una ventana de dimensiones limitadas que está ubicada en el espacio físico del espectador, se espera que éste se concentre por completo en lo que ve en ella, fijando la atención en la representación mientras hace caso omiso del espacio físico exterior (Manovich, 2001[2006b]: 148).[7]

Ubicado en el espacio de la vida cotidiana, y en continuidad con el cuadro, el televisor también trae otros espacios al espacio habitado. La metáfora de “ventana al mundo”, acuñada para el cine, vale también para este medio, y adquiere un sentido de inmediatez particular con la modalidad del vivo, en la que accedemos a lo imprevisible de la vida, y podemos constituirnos, al decir de Carlón, en testigos: “[Con la televisión en vivo,] nos constituimos […] en testigos mediáticos […] somos testigos en un sentido pleno, como si lo estuviéramos viendo donde acontece” (Carlón, 2004: 132).

La similitud entre la pantalla y el cuadro como espacios que traen otros espacios ya había sido tematizada en viejas producciones de ficción futuristas (como la serie de TV Star Trek, o el dibujo animado Los Supersónicos), y hace varios años es ostensible con los televisores de pantalla plana, que están lejos de ser el “mueble” que originalmente fue el televisor. Y que, de hecho, cada vez funcionan menos como televisores, y más genéricamente como pantallas.

Regresando a la historización de las pantallas que hace Manovich, este autor propondrá que el régimen visual de la pantalla dinámica se ve desbaratado por la aparición de dos tipos de pantallas: la del ordenador y la de la realidad virtual.

La pantalla del ordenador, con la moderna interfaz gráfica del usuario, divide la superficie en múltiples ventanas que coexisten: no hay ya una única imagen. El origen de esta configuración, señala el autor, debe rastrearse más en el diseño gráfico que en la pantalla cinematográfica.

La realidad virtual, por su parte, trae un efecto sobre el que deseamos detenernos, que Manovich caracteriza como una desaparición de la pantalla. Citamos aquí su descripción al respecto, dado que coincide plenamente con nuestras observaciones:

La realidad virtual suele utilizar un monitor montado en la cabeza, cuyas imágenes ocupan por completo el campo visual del espectador. Éste ya no mira una superficie plana y rectangular desde cierta distancia, una ventana abierta a otro espacio, sino que ahora se ve completamente situado dentro de él. O, para decirlo de manera más precisa, los dos espacios, el físico y real, y el virtual y simulado, coinciden. El espacio virtual, que antes quedaba confinado a una pantalla de cine o a un cuadro, ahora abarca por completo el espacio real. La frontalidad, la superficie rectangular y la diferencia de escala han desaparecido. La pantalla se ha esfumado (Manovich, 2001[2006b]: 149).

Este efecto de “desaparición” es también señalado por Israel Márquez (2015: 205) en su recorrido genealógico por las pantallas, cuando busca caracterizar las propiedades de la realidad virtual. Este efecto, señala el autor, fue un propósito explícito de los investigadores que desarrollaron los sistemas de realidad virtual. Reseña Márquez:

Para los primeros investigadores de la RV, la pantalla de ordenador o ciberpantalla actuaba (como la del cine o la de la televisión […]) como una barrera que debía ser suprimida si se quería acceder a la verdadera experiencia de la RV, caracterizada por una sensación de inmersión y de interactividad en un mundo tridimensional generado íntegramente por ordenador. Para muchos de estos autores, si el mundo virtual está en la pantalla de un ordenador y el usuario frente a ella, no es posible experimentar y disfrutar íntegramente de este tipo de realidad alternativa. Es decir, si puedes ver la pantalla, no estás dentro de la RV. Únicamente cuando la pantalla desaparece y puedes ver la escena, entonces estás dentro de la RV (Márquez, 2015: 205).

Desde luego, como también señala Márquez, esta desaparición no es efectiva, sino solo perceptual:

Lo que se produce no es tanto una eliminación material de la pantalla sino una eliminación perceptiva. El casco visualizador tiene efectivamente dos marcos delimitadores en las pantallas de los monitores que se acoplan a cada ojo. Pero en la conciencia perceptiva del usuario, tales marcos no existen debido a la proximidad de las pantallas a sus ojos (Márquez, 2015: 206).

Manovich cita las definiciones de Barthes sobre la pantalla:

Un puro segmento recortado que define con claridad los bordes, irreversible e incorruptible; todo lo que le rodea lo hace desaparecer […], mientras que todo lo que admite en su campo es promovido a la esencia, a la luz, a la visión.[8]

Manovich señala que este acto desdobla al sujeto de la visión, que pasa a existir en dos espacios: “el físico y familiar de su cuerpo real, y el espacio virtual de una imagen dentro de la pantalla” (Manovich, 2001[2006b]: 156). Añade además que esta escisión, que aflora particularmente con la realidad virtual, existe en verdad ya en la pintura y en otras artes dióptricas, es decir, consumibles con la mirada.

En relación con la corporalidad del espectador, Manovich señala que la tendencia general del aparato figurativo occidental, basado en los dispositivos de tipo pantalla –que para este autor incluyen, como vimos, tanto la pintura como la fotografía–, tiende a exigir la quietud o inmovilidad del cuerpo. Manovich repasa distintos tipos de inmovilidad, tanto conceptual como literal, vinculada a las distintas técnicas. Señala, por ejemplo, la que se les requería a las personas que deseaban ser retratadas fotográficamente en los primeros tiempos de existencia de la fotografía:

[…] los estudios de retrato empleaban, de manera universal, diversas pinzas para asegurar la estabilidad de la persona sentada a lo largo del extenso tiempo de exposición. Las pinzas de hierro, que recordaban instrumentos de tortura, mantenían firmemente en su lugar al sujeto, que voluntariamente se volvía preso del aparato a fin de ver su propia imagen (Manovich, 2001[2006b]: 159).

Manovich marca la llegada del cine como el inicio del movimiento corporal en la pantalla. Movimiento figurado que, sin embargo, se complementaba como es sabido con la quietud corporal de los espectadores.

La realidad virtual, dice Manovich, es el aparato de representación que vino a romper con esta tradición, puesto que establece un tipo de relación radicalmente distinto entre el cuerpo del espectador y las imágenes: “A diferencia del cine, donde la cámara móvil se desplaza independientemente de la inmovilidad del espectador, ahora el espectador tiene que moverse efectivamente en el espacio físico a fin de experimentar el movimiento en el espacio virtual” (Manovich, 2001[2006b]: 162).

Es interesante observar que un señalamiento similar ha sido realizado en relación con el cine 3D, un tipo de imagen que, aunque mantiene la proyección en pantalla, también pone en cuestión la representación visual de imágenes tal como la conocíamos en las dos dimensiones. Tanto en el cine 3D (el que habitualmente se ve con gafas especiales), como en la realidad virtual, la percepción es verdaderamente en tres dimensiones; hay que distinguir esto de la figuración de las tres dimensiones en una pantalla de imágenes de dos dimensiones (2D). De hecho, lo que ordinariamente se llama “3D”, por ejemplo, en los estudios de los videojuegos, no es sino la capacidad de ciertas imágenes de mostrar la profundidad en un cuadro 2D. Estos efectos, dice Luis Perillán Torres, “nunca son una real percepción tridimensional, sino que más bien permiten al cerebro crear una percepción 3D de imágenes 2D” (Perillán Torres, 2015: 47). El fenómeno señalado por Perillán Torres es caracterizado como “2D y medio” por Claude Bailbé, autor que considera que este tipo de imagen opera como una suerte de transición histórica entre las imágenes 2D y las 3D: [9]

La 2,5D es la etapa necesaria hacia la 3D […] en esta etapa solamente vemos una faceta de la realidad, un subconjunto de lo visible, captado por ambos ojos, es cierto, con relieve y profundidad, probablemente, pero es aún una escena egocentrada, vista desde un ángulo dado. Percibimos los frentes, pero no las espaldas, algunos lados son visibles, otros no; numerosos objetos se enmascaran unos a otros (Bailbé, 2015: 26).

Bailblé señala que en esta etapa es la que trabaja predominantemente el cine, hasta la llegada del cine 3D, que él problematiza. Cuando describe este tipo de cine, Bailblé lo refiere como “la liberación de la idea de imagen”, que eventualmente podemos entender como liberación de la idea de representación visual:

[…] la última etapa, llamada 3D […] libera al observador (pero no al espectador) de la idea misma de imagen. Es el momento en que el punto de vista se borra como tal del campo visual, para constituir una realidad espacial liberada de la imagen de la retina 2D y de la aspectualidad 2,5D […]. En 3D, los volúmenes reencuentran su tamaño real, su ubicación y su color, es decir, una existencia de objeto y no de imagen. En otras palabras, el espacio es objetivado en una dimensión verdadera, con todas las distancias necesarias (Bailblé, 2015: 24).

Retomando esta observación para el caso de la realidad virtual, podría decirse que el efecto es doble: por un lado, efecto de desaparición de la pantalla, por la ausencia de los marcos; por el otro, efecto de desaparición de la representación (en el sentido originario del funcionamiento sígnico señalado por Peirce: ser algo que está en lugar de otra cosa), como resultado de las mayores similitudes perceptuales entre la visión ordinaria y la imagen de realidad virtual.

Hacia el final de la citada discusión, publicada en 2001, Manovich problematiza la paradoja de que, al mismo tiempo que el espectador ya no está inmovilizado, está aprisionado por los aparatos de realidad virtual, que rodean su cabeza de máquinas colgadas, con monitores ensamblados a rieles en el techo. Esta descripción de los aparatos de RV no se corresponde con los equipos de hoy, relativamente livianos y portables. La restricción a la movilidad, sin embargo, se mantiene vigente por otra razón: la imposibilidad de percibir visualmente el espacio físico hace que no sean visibles los objetos del mundo, y por tanto, el espectador puede toparse con facilidad con ellos, con el riesgo de romperlos, de golpearse o de tropezarse. Por esta razón, además, el consumo de RV implica habitualmente, junto al movimiento corporal que señala Manovich, el no desplazamiento en el espacio: las imágenes de RV suelen mirarse sentado o de pie, haciendo giros y movimientos con la cabeza que ayuden a dirigir a distintos puntos la mirada, pero, en cualquier caso, sin cambiar de posición.[10]

Manovich ya ve, sin embargo, las tendencias a la movilidad creciente que vienen asociadas al desarrollo de las nuevas técnicas y predice, en 2001, que el aprisionamiento que está describiendo para el caso de la realidad virtual muy probablemente acabará por desaparecer: “Esta inmovilización representa probablemente el último acto de la larga historia del aprisionamiento del cuerpo. A nuestro alrededor todo son signos de una creciente movilidad y de la miniaturización de los aparatos de comunicación” (Manovich, 2001[2006b]: 167). Varios años después, podemos decir que su proyección estaba acertada.

Hay otras observaciones que hace este autor en ese texto que hoy remiten con relativa exactitud al año de su producción: escrito en 2001, se hace evidente en las descripciones de las experiencias de realidad virtual que las técnicas de entonces eran diferentes de las contemporáneas. Tal vez la principal sea la caracterización del encuadre como rectangular, una particularidad que aleja esas imágenes de lo que observamos en las interfaces de RV actuales. La cercanía que el autor observa entre la cámara de RV con la del cine, sumada a la existencia del encuadre rectangular, hace que en ese año el autor concluya que la experiencia de realidad virtual “está mucho más cerca de la percepción cinematográfica que de la visión inmediata” (Manovich, 2001[2006b]: 134), una afirmación que hoy sin duda podríamos discutir. De hecho, algunos años después, el mismo Manovich describía en otro trabajo las imágenes de realidad virtual como que ocupaban la totalidad del campo visual, sin ninguna referencia a un encuadre rectangular, tal como lo hemos hecho aquí: “En un sistema típico de realidad virtual, todo el trabajo se realiza en un espacio virtual; el espacio físico se vuelve innecesario, y la percepción visual del espacio físico está completamente bloqueada para el usuario” (Manovich, 2006a: 238).[11]

Como adelantamos, el fenómeno de expansión que se vivió desde aproximadamente el año 2015 se apalanca en el lanzamiento al mercado de teléfonos celulares inteligentes compatibles que tienen la capacidad de insertarse en los cascos visualizadores y operar como pantallas. Toda la tecnología para el funcionamiento básico de las experiencias de realidad virtual se encuentra dentro de los celulares: además de la pantalla y las salidas de audio, entra en juego la unidad de medición inercial (IMU, por sus siglas en inglés), cuyo componente principal es el giroscopio, que permite medir la rotación del teléfono móvil (La Valle, 2017: 44). Las funciones primordiales de los anteojos son dividir la visión entre los dos ojos, que miran cada uno una mitad de la superficie dividida, ajustar el foco con unos lentes que habilitan el funcionamiento del celular como pantalla, que queda muy cercana a los ojos, y cerrar el resto del campo visual. Si se retira el teléfono de un casco, se podrá observar la vista que se está teniendo en ese momento partida en dos imágenes, cada una correspondiente a un ojo. Las imágenes son casi idénticas, pero –como en los viejos estereoscopios– tienen una mínima diferencia que genera el efecto de tridimensionalidad, tal como ocurre en la visión ordinaria (ver figura 5.2.).

Figura 5.2. Cuando funciona como pantalla de anteojos de realidad virtual, el celular divide su superficie en dos, y cada una muestra la visión de un ojo. Imagen: Mamut Films.

El hecho de que los desarrollos tecnológicos se encuentren en el teléfono se hace evidente en la existencia de visualizadores de cartón (cardboards) que permiten tener en sus aspectos básicos las mismas experiencias de realidad virtual que los “cascos” o “anteojos” más sofisticados, como el Samsung Gear VR. Esto llama nuevamente la atención sobre la centralidad del software en la determinación de las regulaciones instauradas por los dispositivos digitales, que hace que en este caso el teléfono móvil se comporte como un visualizador de experiencias de realidad virtual. El caso de la RV nos hace reparar también en la multiplicidad de sensores y dispositivos de salida que existen en los celulares, más allá de la pantalla y los altoparlantes; entre ellos, los sensores de movimiento que –coordinados con el software habilitan que el celular se comporte, en este caso, como pantalla de RV.

5.2.2. Los tiempos sociales de adopción

Cuando se escribió la primera versión de estas líneas, los referentes de la industria de realidad virtual hablaban de una etapa muy temprana de su adopción, de la necesidad de regular su uso por su alto poder de representación y de crear familiaridad. De hecho, Oculus –la compañía de realidad virtual de Facebook– indicaba explícitamente que su casco de realidad virtual no debía ser empleado por niños menores de 13 años.

Son ilustrativas, en este sentido, las observaciones de Janet Murray acerca del tiempo necesario para habituarse a un incremento en el poder de representación de los medios:

Parte del trabajo inicial en cualquier medio es explorar la frontera entre el mundo representado y el mundo real. Es casi un lugar común en el siglo XX advertir de los peligros de las nuevas simulaciones muy elaboradas […] porque distancian a los seres humanos de la experiencia directa. Pero gran parte de nuestro desconcierto […] (ante lo que Umberto Eco llamó la cualidad “hiperreal” de la vida americana) deriva simplemente del hecho de que necesitamos un cierto tiempo para acostumbrarnos a cualquier aumento del poder de representación de los medios (Murray: 1997[1999]: 115).

Se trata, desde luego, de tiempos sociales para la adopción de estos nuevos dispositivos, que experimentan en forma individual particularmente aquellas personas habituadas a grados de representación menores (o modos de representación diversos), que deben desarrollar hábitos e interpretantes para vincularse con las nuevas imágenes.

Al respecto, un metadiscurso habitual entre los productores de experiencias de realidad virtual señalaba, para la misma época, que los públicos no estaban aún preparados para experiencias demasiado intensas, que implicaran, por ejemplo, movimientos abruptos o efectos de mucha cercanía a las situaciones o personajes representados. Murray se refiere justamente a la necesidad de regular las emociones de los participantes de las experiencias inmersivas, bajo el riesgo de que el efecto de inmersión quede interrumpido. Retomando a Winnicott, señala que es necesario que “los objetos del mundo imaginario no sean demasiado apetecibles, terribles o reales, porque se rompería el trance de inmersión” (Murray, 1997[1999]: 132). Kelly lo señala explícitamente en relación con las experiencias de realidad virtual:

El grado de presencia puede ser tan fuerte en RV que se debe atenuar la evocación de las emociones básicas y la representación de la fuerza bruta. […]. Los escenarios exagerados que son meramente convincentes en el mundo ordinario pueden ser abrumadores cuando se está inmerso en ellos (Kelly, 2016).[12]

5.3. Las experiencias de realidad virtual

Decíamos al inicio de este capítulo que el foco de nuestro análisis estará en las “experiencias” de realidad virtual. ¿Cómo podemos definirlas? Se trata, desde luego, de producciones audiovisuales de realidad virtual; es claro, en ese sentido, que se distinguen de las “fotos” de RV, en la medida en que estas últimas son estáticas, y no trabajan el plano sonoro. Nos interesa, sin embargo, problematizar su distinción de otro fenómeno muy cercano: los films o películas de realidad virtual.

Algunas de las descripciones que se encuentran en la literatura sobre RV señalan como propios del tipo de imagen o del dispositivo prácticas que hasta el momento son habituales, pero que no son características que necesariamente vayan a estar siempre presentes; de hecho, se encuentran ya algunos casos que demuestran lo contrario. Tal es el caso, por ejemplo, de la ausencia de cortes en la imagen: “Es la propia mirada del visitante la que va creando –poniendo en acto– un mundo, una escena que se presenta sin cortes ni montajes en tiempo real, como una suerte de plano secuencia llevado al infinito”, dice Márquez (2015: 206). Si bien la ausencia de cortes puede ser habitual en las producciones de RV, existen ya varias de ellas que contienen cortes.[13] Ciertamente, el montaje por corte directo produce un efecto más abrupto que en la pantalla tradicional cinematográfica, una suerte de dislocación que genera un quiebre en la continuidad de la experiencia espacial: el montaje narrativo se pone por delante del carácter inmersivo de la realidad virtual, y la sensación vívida de “estar allí” se ve interrumpida.

Sin embargo, basta con experimentar unos cuantos cortes para familiarizarse con ellos y ver surgir allí un ejercicio de montaje en este nuevo tipo de imagen. No por casualidad, en lo que habitualmente se llama “experiencias de RV”, no suelen observarse este tipo de cortes; eventualmente, hay fundidos a negro completos que generan una transición más suave en términos de esos cambios de lugar, sin producir un efecto de ruptura en una visión que es siempre la de una cámara subjetiva.[14] Los cortes, en cambio, se observan en los llamados “films” o “películas de RV”, narrativas en imágenes (sea ficcionales, sea documentales) en las que el usuario se ve inmerso en más de una escena como observador. La ausencia o presencia de montaje parece ser uno de los indicadores del límite entre las experiencias y los films. De hecho, el lugar central y específico del montaje en el lenguaje cinematográfico es destacado por Bailblé:

[…] si bien el cine tomó prestado de la pintura […], de la fotografía […], de la arquitectura […], del teatro […], de la novela […], e incluso de la música […], inventó sobre todo un campo que le pertenece como propio: la edición. Es entre 1905 y 1913 […] que las películas se emancipan del cuadro de autarquía de los Hermanos Lumière para inventar ese lugar paradójico, que está a la vez inmóvil y siempre centrado –la pantalla– y que, sin embargo, cambia sin cesar, siempre provisional –el plano imagen. […] El empalme autoriza la elipsis y su disimulación en una “casi continuidad temporal” […] en beneficio de un tiempo que se estrecha, sin costuras aparentes (Bailblé, 2015: 19).

La ausencia del ejercicio de montaje en las experiencias de realidad virtual las aleja de cierto tipo de visualidad que Manovich (2001[2006b]: 130) llama las “maneras cinematográficas de ver el mundo”, o el “modelo de la cámara”.[15]

Así como el montaje remite al lenguaje cinematográfico, se puede arriesgar que el fundido a negro, aun cuando es un recurso observable en él, proviene fundamentalmente del teatro, un lenguaje performático que tiene un vínculo radicalmente diferente con la espacialidad y las imágenes: no hay en él una pantalla,[16] sino una puesta en escena, y hay una percepción directa (no mediatizada) de ese espacio en el cual tienen lugar las representaciones miméticas.

En 2001 Manovich ya se preguntaba si las experiencias de realidad virtual serían más herederas del cine o de diversas formas del teatro: “Queda abierta la cuestión de si […] [las experiencias de realidad virtual] suponen en realidad una ampliación del cine, o si más bien deberíamos considerarlas una continuación de tradiciones como el teatro de improvisación o el de vanguardia” (Manovich, 2001[2006b]: 134). Como proponemos aquí, al menos en algunos aspectos observamos un fuerte vínculo con la segunda de estas opciones.

Sin embargo, aparecen con asiduidad en las producciones de realidad virtual varios recursos y convenciones propios del universo cinematográfico: voz en over, musicalización (no diegética), títulos y subtítulos. Junto con el montaje, todos estos recursos tienden a configurar las producciones como películas o films. Del otro lado, distintas posibilidades de interacción que aparecen en ciertas producciones de realidad virtual, a través de las cuales se puede alterar las acciones o los acontecimientos que tienen lugar en ese mundo diegético, tienden a configurarlas como experiencias.[17] Este segundo rasgo parece tener más fuerza que la cuestión del montaje.

La denominación de “experiencia” está vinculada además con la ilusión de no representación: las imágenes de realidad virtual no se perciben como “estando en lugar de”, sino simplemente estando, no juegan a representar, sino a presentarse; la ausencia de marco y el tipo de percepción propuestas las alejan de la sensación de exterioridad que tiene lugar en el consumo de otros tipos de textos. En este sentido, la denominación de “experiencia” pone por delante sus cualidades inmersivas, y parece tener una mayor generalidad (pues el efecto de inmersión está siempre presente); la de “película”, en cambio, se aplicaría solo a una parte de las producciones, que recuperan ejercicios de montaje en este nuevo tipo de imagen.

La ilusión de no representación es uno de los efectos de la ilusión de la ausencia de pantalla ya señalada. Desde luego, se trata siempre de efectos textuales, de un nuevo tipo de textualidad, a la que eventualmente podemos llamar, siguiendo una denominación extendida, como “inmersiva”, un término del que nos ocuparemos enseguida.

Si se observa la metadiscursividad en las distintas plataformas de realidad virtual hoy, como Oculus o Within, se encuentra que el modo de nombrar estas producciones no está por el momento estabilizado. Habrá que observar cómo se desenvuelven estas denominaciones en el tiempo, pero parecen vislumbrarse al menos dos opciones. De un lado, es probable que la posibilidad de alterar el curso de la narración a través de distintos tipos de interacciones termine marcando la línea divisoria entre las experiencias y las películas. Del otro, es probable que las convenciones cinematográficas terminen por expandirse en la mayor parte de las producciones de RV y que finalmente terminemos adoptando el genérico de “películas” también para estos productos audiovisuales, distinguiendo cuando sea necesario –tal como hacemos con el cine– el tipo de imagen específico del que se trata en cada caso.

5.4. Los sentidos de “lo virtual”

Son múltiples las acepciones de lo virtual, siempre ligadas a posibilidades abiertas por tecnologías digitales de la comunicación. Paula Sibilia señala que lo virtual viene vinculado a la superación de los límites presenciales, cuando el cuerpo se hace presente de modo mediado pero en tiempo real: “Las nuevas soluciones ofrecidas por la teleinformática permiten superar los límites espaciales: anulan las distancias geográficas sin necesidad de desplazar el cuerpo e inauguran fenómenos típicamente contemporáneos como la ‘telepresencia’ o ‘presencia virtual’” (Sibilia, 2005[2009]: 50).

La denominación de este tipo de tecnologías de visionado de imágenes como “virtual” es ya de larga data. Si bien la expansión social del conocimiento de las imágenes de realidad virtual y de los dispositivos que permiten este tipo de experiencias es relativamente reciente, las primeras experiencias comenzaron, como se señaló, hace ya varias décadas. Una de las reflexiones pioneras desde los estudios del campo de la comunicación lo constituyó el libro Lo Virtual, de Philippe Quéau, publicado originalmente en 1993. El autor abre su libro denominando ya como “virtuales” a estos fenómenos, aunque evita hablar de “realidad”, y opta por los términos “entornos” o “mundos”: “¿Cómo definir un ‘mundo’ o ‘entorno virtual’? Un mundo virtual es una base de datos gráficos interactivos, explorable y visualizable en tiempo real en forma de imágenes tridimensionales de síntesis capaces de provocar una sensación de inmersión en la imagen” (Quéau, 1993[1995]: 15).

En esta definición hay varias cuestiones que deberíamos discutir o matizar: por ejemplo, qué significa que los gráficos sean “interactivos”, cuál es el significado del “tiempo real” (y si esta es una exigencia de toda experiencia de realidad virtual) y la afirmación de que todas las imágenes son de síntesis. Aparece además en la definición de lo virtual la cuestión de la inmersión, que el autor asocia también a la visión estereoscópica. Las definiciones de “mundo” o “entorno” refieren a la generación de un espacio; el hecho de que la experiencia sea inmersiva da cuenta de la sensación ya no de ver ese espacio como una representación exterior (tal como se contempla una pintura, o una obra cinematográfica), sino de estar dentro de él. Lo virtual refiere aquí al sentido original de aquello “que tiene existencia aparente y no real”, como dice la tercera acepción del DRAE. Luego de una discusión terminológica, Quéau llegaba hace casi 25 años a optar por la denominación de “simulación virtual”: “Preferiremos a todos los neologismos apresurados el concepto de simulación virtual que, a nuestro parecer, parece describir mejor la auténtica originalidad de estas nuevas formas de representación sin inducirnos a la vez a considerar estas ‘realidades intermedias’ como ‘realidades sustanciales’” (Quéau, 1993[1995]: 25).

El desplazamiento del entorno o mundo a simulación implicó al mismo tiempo una pérdida y una ganancia. La pérdida se evidencia en el hecho de que Quéau abandona estas denominaciones iniciales, que nombraban el carácter espacial de las representaciones de estos tipos de imagen, complementado con un sustantivo que daba cuenta de su carácter no factual, y opta por un sustantivo que da cuenta de lo mismo que el adjetivo que lo califica: a fin de cuentas, una “simulación virtual” es algo así como una “simulación simulada”.

La denominación de “simulación”, sin embargo, enfatiza una cierta capacidad sustitutiva en términos experienciales de la realidad virtual: cualquier dispositivo con capacidad de simulación no solo debe aparentar ser otra cosa, sino que también debe presentar la posibilidad de interactuar con él en modo análogo a lo sustituido. Así, un simulador de vuelo, o un simulador de manejo, no solo deben parecer respectivamente la cabina de un avión o de un vehículo, sino que también deben permitir interactuar de modo similar a las cabinas reales (con palancas, volantes, tableros, etc.), lo que implica, además, que generen respuestas equivalentes a las de los sistemas que emulan (habitualmente solo figuradas o representadas).

Si se regresa a la definición de Quéau, notamos que habla exclusivamente de imágenes de síntesis; es decir, está pensando semióticamente en íconos sin componentes indiciales: si un espacio es “virtual”, no puede ser entonces un registro de lo real. Hoy, en cambio, la tecnología que denominamos “realidad virtual” puede emplearse con imágenes que pueden tener una multiplicidad de estatutos semióticos. Mientras que existen muchas imágenes de RV de naturaleza completamente sintética, hay también numerosos videos grabados con la misma tecnología de visualización tridimensional estereoscópica, que por tanto pueden generar experiencias inmersivas.

Se hacen así visibles dos sentidos de lo virtual, que en el caso de Quéau aparecen solapados: por un lado, la virtualidad afecta a las técnicas de visionado. Esta virtualidad es del orden del dispositivo, y se verifica en el hecho de que las experiencias son inmersivas, con imágenes de percepción tridimensional, sin fuera de campo, con punto de vista variable según la posición física efectiva de la persona. Aquí se ubica el ya mencionado efecto de disolución de la pantalla, que genera a su vez un efecto de presentación (no representación), de no estar ante una imagen de los objetos del mundo, sino ante los objetos mismos. Este carácter de lo virtual (parece que estamos en otro espacio, pero no lo estamos) se verifica tanto en imágenes de síntesis, como en otras de registro, y es el que hace que podamos hablar de realidad virtual también cuando estamos ante imágenes de video. Lo virtual en este caso es que esa percepción, que se confunde con la percepción ordinaria de la experiencia cotidiana, es en verdad la percepción de una imagen: una reedición del trompe-l’œil en su sentido original: la imagen se confunde con el referente, la experiencia perceptual que tenemos es similar en los aspectos señalados a la que experimentamos con los espacios y objetos ordinarios del mundo. Por el otro lado, la virtualidad puede afectar o no al estatuto de la imagen. Semióticamente, podemos pensar que es virtual toda aquella imagen que no contenga componentes indiciales, es decir, que no guarde relación con un existente al modo de los índices genuinos.[18] En términos de Quéau: “No debe olvidarse nunca que las técnicas de representación virtual son esencialmente numéricas. A diferencia de las técnicas básicamente analógicas, como la fotografía o el vídeo, las imágenes numéricas no participan directamente de lo real” (Quéau, 1993[1995]: 20). Si lo pensamos en este sentido, acordamos con el autor en que una imagen virtual solo puede ser de síntesis, puesto que de otro modo sería una “imagen real” o representación, en el sentido restringido de analogon de un existente.[19] Este carácter de lo virtual (parece un espacio real, pero no tiene existencia efectiva) solo se verifica en las imágenes de síntesis, pero no en las de video. En los orígenes de los “entornos virtuales”, las imágenes eran exclusivamente de síntesis, y ambos sentidos de lo virtual aparecían solapados. Con las técnicas de grabación de video 360º estereoscópico, una imagen puede ser virtual en su experiencia perceptiva, pero de registro/indicial en su génesis. Los empleos de las imágenes de RV que realizan algunas agencias de viaje, que en sus salas de espera suministran anteojos a sus clientes para que experimenten un paseo por alguno de los destinos comercializados con imágenes de video registradas en ellos, solo podrían funcionar con este segundo tipo de imágenes: virtuales en su modo de visionado, de registro indicial en su naturaleza semiótica.

El primer sentido de lo virtual, el referente a la vista tridimensional y en 360º que cambia con el movimiento del usuario, solo se hace materialmente posible porque los sistemas actuales de realidad virtual responden adecuadamente: el giroscopio y el acelerómetro del teléfono celular detectan la velocidad y el sentido del movimiento, y la imagen en la pantalla cambia inmediatamente para ajustarse al nuevo punto de vista. Este cambio se produce hoy con tal velocidad que no es perceptible para el usuario. Los viejos sistemas de realidad virtual presentaban una demora en este aspecto, conocida como “latencia”: había un tiempo perceptible entre el momento en que se producía el movimiento efectivo del usuario y la imagen se ajustaba a la nueva posición. Este delay atentaba contra la búsqueda de similitud perceptual construida por estos sistemas. Con posterioridad, la velocidad de procesamiento de los smartphones en las aplicaciones de realidad virtual permitió eliminar perceptualmente estas demoras.

Al referirse a la ausencia de tiempos de latencia, los escritos acerca de la realidad virtual también hablan de “tiempo real”, una noción que ya habíamos problematizado en el capítulo 2. En este caso, la denominación no hace referencia a ninguna de las dos acepciones que habíamos repasado allí, sino a la posibilidad que tienen ciertos sistemas informáticos de brindar una respuesta inmediata a ciertos inputs con una demora humanamente imperceptible. En el caso de la realidad virtual, el tiempo real se refiere a la modificación inmediata de la imagen que se ve en la pantalla cuando se produce un movimiento del usuario.

La ausencia de tiempos de latencia perceptibles, señala Márquez, es condición para que se produzca un efecto de transparencia en relación con la técnica:

[…] la velocidad con que el ordenador traduce los movimientos y las órdenes del usuario resulta crucial para provocar la sensación de inmersión. Si entre la acción física y su representación virtual transcurre un intervalo de tiempo apreciable, la sensación de artificialidad es grande, destruyendo así la pretendida invisibilidad del medio (Márquez, 2015: 208).

5.5. Las imágenes de la realidad virtual

En la discusión anterior, se hizo evidente que con “realidad virtual” no definimos un tipo de imagen, sino un conjunto de imágenes de naturaleza variada, vinculadas a la especificidad de un dispositivo. Estas imágenes comparten algunas características que ya hemos descripto: son tridimensionales, tienen 360º y son siempre vistas a través de un dispositivo que hace que ocupen la totalidad del campo visual, con un punto de vista que varía según el usuario y que genera siempre el efecto de “estar allí”, conocido como “inmersión”. A propósito de la reflexión sobre el concepto de “virtual” de Quéau, señalamos al menos dos grandes conjuntos: la imagen de video, y la imagen de síntesis que no posee componentes indiciales. Deberíamos añadir aquí un tercer conjunto: aquel referente a las imágenes que poseen componentes de indicialidad atenuada, como las que hemos examinado con detenimiento en el capítulo anterior. Nos dedicaremos en este apartado a revisar primero las imágenes de video (que tienen a su vez múltiples dinámicas posibles), diremos unas pocas palabras acerca de las de síntesis no indiciales, y luego revisaremos algunas dinámicas que se dan en la realidad virtual con las imágenes de indicialidad atenuada.

5.5.1. Las imágenes de video

En el caso de la imagen de video, la realidad virtual matiza el efecto de tiempo pasado que surgió con los primeros dispositivos de registro de imágenes (la fotografía), y que de algún modo se trasladó también al cine, como lo señalaba Barthes en La cámara lúcida:

[…] desde un punto de vista fenomenológico, el Cine comienza a diferir de la Fotografía; pues el Cine (ficcional) mezcla dos poses: el “esto-ha-sido” del actor y el del papel que desempeña, de suerte que (esto es algo que nunca experimentaré ante un cuadro) jamás puedo ver o volver a ver en un film a unos actores que sé que están muertos sin una especie de melancolía: la misma melancolía de la Fotografía (Barthes, 1980[1989]: 125).

El tipo de visión propio del dispositivo genera un efecto de pasado que se actualiza como presente en cada visualización, y que genera por tanto el efecto de trasladarse en el tiempo y en el espacio (un estar allí ahora). La ausencia de marco debilita su carácter de texto y trae al frente la experiencia inmersiva: se suspende toda otra percepción. Así, de algún modo, el efecto se experimenta como una teletransportación.

Ahora bien: a pesar de sus movimientos entrecortados, el color blanco y negro de la película, la pantalla rectangular y la ausencia de sonido, son conocidas las crónicas que relatan que, en las primeras proyecciones cinematográficas de los hermanos Lumière, el corto “Llegada del tren” generó un efecto de extremo realismo, al punto de generar temor en los espectadores de que pudieran ser arrollados por él. En ese sentido, no se debe perder de vista que incluso la sensación extrema de “estar allí” que producen hoy las imágenes de realidad virtual es un efecto histórico: como señala Murray, “lo hiperreal o virtual siempre es un blanco en movimiento. Lo que hoy en día nos parece extraño, mañana será algo habitual” (Murray, 1997[1999]: 124).

El generar la sensación de estar siempre en otro lugar es constitutivo del dispositivo. En ese aspecto, es interesante la propuesta estética que presentó en su momento el reproductor de video de Oculus para ver los videos guardados en el teléfono en la modalidad de RV: la aplicación nos trasladaba a una sala cinematográfica en la que había una “pantalla gigante” en la cual estos videos se proyectaban.

En el caso de los videos no ficcionales, el efecto de “estar allí” es aún más intenso. Como lo adelantamos, es tan patente que ya ha sido empleado con fines promocionales por una conocida agencia de turismo de Argentina, que en las salas de espera de sus locales de atención ofrecía visores de RV con escenas grabadas en distintos destinos turísticos para que los clientes tuvieran la experiencia de “estar allí” antes de concretar la contratación de su viaje.[20]

A propósito de este último empleo, Murray señala justamente que la narrativa de viajes “es un arquetipo universal reconocible en todas las variaciones de cultura, autor o soporte” (Murray, 1997[1999]: 149), y reconstruye rápidamente distintos medios y soportes en los que se ha plasmado: la producción literaria con la imprenta, el cine, la televisión. Mientras que en todos estos lenguajes señala obras que referencialmente tratan sobre viajes (Don Quijote en la literatura, La diligencia en el cine, Star Trek en la televisión), cuando se refiere al ordenador retoma la idea del viaje con un sentido metafórico, comparando la experiencia de emplear una computadora con la de viajar: “En el ordenador, la narrativa de viajes se centra en la navegación, la transición entre lugares diferentes, las llegadas y las salidas” (Murray, 1997[1999]: 149). En RV, el efecto de viaje proviene del dispositivo: aun cuando no haya construcción narrativa alguna, el tipo de imagen genera el efecto de trasladarse a otro espacio. La conocida metáfora del cine como “ventana al mundo” implica la segregación de espacios: se está de un lado de la ventana, lo que se observa está en ese “afuera” visible, donde no se está. Eso que se ve puede ser una historia de un viaje, como en La diligencia, pero puede consistir también en una multiplicidad de mundos diegéticos diferentes. En la realidad virtual, el efecto de no pantalla apuntala el de “estar allí” y derriba cualquier efecto de ventana: no hay marco, no hay dos espacios, el efecto no es estar viendo desde afuera, sino el de haberse trasladado o viajado hacia ese otro lugar (que a su vez podrá ser o no ficcional).

Dentro de las imágenes de realidad virtual basadas en video, debemos hacer una distinción: en su enorme mayoría, se trata de imágenes grabadas con anterioridad. El dispositivo puede generar efectos de presencia o simultaneidad, pero el tiempo de esa imagen será siempre pasado: el noema barthesiano del “haber estado allí” opera en este caso en la imagen de registro del mismo modo que lo hace en el cine o en el grabado televisivo. Existe, sin embargo, la posibilidad de hacer transmisiones de imágenes de realidad virtual en vivo, es decir, emplear la transmisión simultánea a través de Internet (conocida como streaming) para distribuir imágenes en directo, al mismo tiempo que son capturadas. Se abre aquí toda una problemática referente al grabado y al directo, que para el caso de la televisión, como hemos visto, ha sido trabajada por Mario Carlón (2004). Las observaciones que junto a este autor hacíamos con respecto al directo televisivo valen también para la realidad virtual en directo: el usuario se transforma en un testigo de los acontecimientos, expuesto a la imprevisibilidad de la vida. En estos casos, los dispositivos de la realidad virtual ya no trasladan a otro espacio-tiempo, sino solo a otro espacio, en el mismo tiempo. La modalidad del vivo abre así posibilidades muy atractivas tanto para la transmisión de grandes eventos deportivos o culturales, como para paseos turísticos.[21]

Las modalidades del vivo y el grabado en la realidad virtual abren posibilidades de juegos discursivos similares a las que ya hemos señalado para la televisión en el capítulo 4, cuando revisamos el caso del programa Showmatch. Al igual que en aquella emisión, mientras que no haya intervención[22] en la experiencia, no habrá rasgos en la imagen que permitan decidir si se trata de un grabado o de un vivo, y podrían tener lugar fingimientos textuales, con producciones grabadas haciéndose pasar por vivos y viceversa. En general, de todas maneras, los modos de consumo contemporáneo son muy distintos en el grabado y el directo, y hay entornos y prácticas de recepción muy diferentes: al día de hoy, no se “mira realidad virtual” como se “mira televisión”, no existen el zapping ni las emisoras: hay un abismo entre la cotidianidad de encender el televisor y la práctica mucho menos habitual de colocarse los anteojos de realidad virtual.

Como lo adelantamos, tanto en uno como en otro caso (el grabado, el vivo), las imágenes de video de la realidad virtual solo lo son en el primer sentido: el referente a la vista tridimensional y en 360º que cambia con el movimiento del usuario. No lo son en el segundo sentido, esos espacios y objetos que vemos se corresponden con existentes reales; por su naturaleza icónico-indicial, la sola existencia de esas imágenes es prueba de ello.

5.5.2. Las imágenes de síntesis no indiciales

Dedicaremos unas pocas líneas a las imágenes de síntesis que son ostensiblemente generadas por computadora, en las cuales es evidente que no hay componentes de tipo indicial. Pensamos, por ejemplo, en muchas de las producciones de Disney Movies VR, en las que se ven personajes ficcionales animados en mundos fantasiosos.[23] Diremos solamente que también en ellas se puede pensar en un efecto de viaje; en este caso, sin embargo, se trata de un traslado a un mundo que se sabe no real. Aquí la experiencia es plenamente virtual (también en el segundo sentido: sintetizado); el placer en este caso no es el de la teletransportación, sino el de saberse estando en un mundo de fantasía.

5.5.3. Las imágenes de indicialidad atenuada

Podemos preguntarnos ahora qué ocurre cuando la indicialidad está presente, pero en forma atenuada: nos encontramos aquí con imágenes de síntesis que guardan relación estrecha con las que analizamos en el capítulo 4. Como se recordará, esas imágenes trabajan con rasgos provenientes de dos registros diferentes: de uno toman la gestualidad y los movimientos, del otro toman los rasgos visibles, la apariencia. Como buena parte de las técnicas digitales de animación, ese tipo de imagen también puede ser empleada para la generación de experiencias de realidad virtual. En términos generales, y más allá de las figuras humanas a las que nos referíamos en aquel capítulo, existe hoy una multiplicidad de técnicas de animación que logran resultados del mismo tipo: imágenes que perceptualmente parecen de registro, pero que no lo son. Montañas, lagos, trenes, animales existentes y prehistóricos, una multiplicidad de espacios, objetos y seres vivientes pueden ser modelados con una apariencia tal que no se distinga si se trata de una imagen de registro o de una de síntesis; en buena parte de estas imágenes, han intervenido elementos indiciales en su génesis. Así, por ejemplo, podemos ver a un dinosaurio despertar de su sueño, acercar su rostro al nuestro y parpadear mientras nos mira a los ojos con la naturalidad de los animales que conocemos en el mundo.[24] La intensidad de las experiencias con estas imágenes se multiplica, puesto que construyen precisamente sobre el realismo de esa realidad virtual, es decir, parecen (registros) reales. En múltiples casos, el usuario solo podrá descubrir que una imagen es de síntesis únicamente cuando algún hecho que ocurre en esa trama queda fuera de los posibles reales: si la locomotora que veo venir a lo lejos repentinamente desvía su marcha para desplazarse sobre el agua, abalanzarse sobre mí y convertirse, justo cuando va a impactarme, en una bandada de pájaros negros –como ocurre en la experiencia Evolution of verse–,[25] entonces esa locomotora era el resultado de una síntesis. Dicho de otro modo: si esas imágenes de síntesis que ya parecían el registro de un existente ahora son percibidas como si estuvieran realmente allí, el efecto de la realidad virtual se potencia.

En este tipo de imágenes, la expresión “realidad virtual” adquiere toda su fuerza oximorónica: esa imagen se percibe como realidad (=registro de un existente), pero en verdad es virtual (=de síntesis, no de registro). El placer aquí es tal vez el más singular de todos, puesto que no tiene la certeza de los demás, sino que reposa en una incertidumbre: la de animarse a habitar por unos momentos un espacio que no se sabe si es real o no, cuestión que podrá resolverse en algún momento de la experiencia, o permanecer sin respuesta durante todo su desarrollo.

La locomotora que súbitamente avanza sobre el agua en Evolution of verse y se transforma en una numerosa bandada de pájaros conmociona no solo por el impacto de verla de frente y a punto de arrollarnos, en una versión contemporánea –casi un homenaje– del temor que sintieron los primeros espectadores del corto de los hermanos Lumière, sino también y sobre todo porque lo que se quiebra en el momento en que avanza sobre el agua hacia nosotros es un verosímil: la imagen que parecía de registro no lo es, ese tren no estaba realmente allí, las reglas que rigen este espacio que estamos habitando virtualmente no son las del mundo cotidiano como creíamos; los objetos avanzan sobre el agua y las máquinas pueden convertirse súbitamente en seres vivos (ver figura 5.3.).

Figura 5.3. Capturas secuenciales de Evolution of verse. El paisaje que se observa inicialmente parece de video, pero, cuando la locomotora avanza hacia nosotros sobre el agua, se hace ostensible que había componentes de síntesis. Cuando está por arrollarnos, se convierte en una bandada de pájaros. Ver bit.ly/2H6etu3 [consulta: 15/7/2017]. Imágenes: Within.

5.6. De nuevo, el trompel’œil

La búsqueda de la “invisibilidad del medio” mencionada por Márquez en relación con la ausencia de tiempos de latencia se vincula con la ya señalada pretensión de trompe-l’œil o engaño al ojo: de algún modo, la realidad virtual se enlaza con la historia de las técnicas que buscan la fidelidad en la reproducción, junto con la invisibilización de esas mismas técnicas. Dicho de otro modo, mientras que en el capítulo 4 nos referíamos –a propósito de ciertas imágenes audiovisuales de síntesis– a la búsqueda de una indistinción perceptual entre distintos tipos de textos, lo que parece buscarse aquí es la indistinción perceptual entre la experiencia ordinaria y los discursos, entre los registros visuales y lo visible. En el caso de la realidad virtual, además, esta pretensión de invisibilidad se combina con el carácter inmersivo de la técnica. Al respecto, Diego Levis se refiere al histórico deseo de entrar en el interior de un cuadro, o de introducirse en la pantalla del televisor. En su repaso de las distintas tecnologías de comunicación, señala precisamente la realidad virtual como aquella que finalmente permitió generar en forma vívida el efecto de estar ingresando en la imagen: “Hasta la aparición de las técnicas inmersivas que ofrecen las simulaciones digitales avanzadas (conocidas como realidad virtual) ningún medio de expresión o aparato de comunicación había permitido franquear la superficie exterior de una representación visual y auditiva” (Levis, 2014: 200).

La indistinción perceptual entre los fenómenos efectivos y sus registros la conocíamos desde hace tiempo con las producciones sonoras: si se escucha en la quietud una grabación con alta fidelidad de un piano tocando, puede confundirse con un piano que efectivamente está sonando; no hay rasgos en esa materialidad que permitan distinguir si se trata de un registro grabado o de un piano sonando realmente, y, en verdad, no hay nada distinto en ella. Si disfrutamos más de la experiencia de escuchar un pianista en vivo es por el conjunto de la experiencia (nos movilizamos, lo vemos, y sabemos que eso que estamos escuchando está siendo ejecutado en vivo). Sin embargo, ese sonido que llega a nuestros oídos probablemente no tenga diferencia alguna con el que proviene de una grabación. En el caso de la visión, esta búsqueda tiene siglos: la pretensión de la reproducción fiel en las naturalezas muertas y la técnica de trompe-l’œil ya mencionadas son solo dos estaciones de esas aproximaciones. En lo referente a las imágenes móviles, han predominado históricamente las dos dimensiones, o el efecto visual de la perspectiva. El ya mencionado cine 3D, con el uso de gafas especiales, trajo por primera vez la posibilidad de ver imágenes en movimiento en tres dimensiones, separando lo que veía cada uno de los ojos con filtros de colores.[26] La posibilidad de abarcar la totalidad del campo perceptual con una imagen de visión tridimensional que incluya escenarios, objetos y personajes surge con la realidad virtual.

Decíamos recién, a propósito del sonido, que una grabación de alta fidelidad escuchada “en la quietud” podía ser indistinguible perceptualmente de un sonido efectivamente emitido de una fuente. Hacíamos esta aclaración conscientes de que la audición de los seres humanos, a través de dos oídos, detecta no solo las cualidades propias de los sonidos (altura, duración, intensidad, timbre), sino también la posición y la distancia de las fuentes; por esa razón, un movimiento de nuestra cabeza hace cambiar también nuestra manera de percibirlos. La razón por la que ocurre esto es relativamente sencilla: dado que los oídos están físicamente separados por la cabeza, las ondas sonoras deben recorrer un trayecto algo más largo para alcanzar el oído más alejado de la fuente. El cerebro humano detecta este retardo temporal y así sabe de qué lado se ha originado el sonido. Frente al sonido monoaural, la estereofonía representó un avance sustancial en los métodos de grabado y reproducción de sonido, dado que logró construir un efecto de posición y distancia (izquierda/derecha, cerca/lejos), aunque aún en dos dimensiones: los sonidos se escuchan como si se tratara de un plano paralelo al suelo a la altura de los oídos. Un registro generado con este sistema puede guardar gran semejanza con el sonido original, pero encuentra sus límites cuando se desea que el plano sonoro acompañe en sus regulaciones lo que ocurre en el plano visual. Dicho de otro modo: al voltearnos con un casco para ver lo que tenemos a nuestras espaldas en una experiencia de realidad virtual, si el sonido está grabado con el sistema estereofónico tradicional, seguirá escuchándose del mismo modo que antes de haber girado. Como un modo de sortear esta limitación, las experiencias de realidad virtual comenzaron a incluir un sistema de audio conocido como binaural. Frente al sonido en estéreo, que trabajaba dos posiciones, el binaural agrega la dimensión de la altura, por lo que se lo conoce también como un sonido “3D”. El sonido binaural, además, se regula acompañando los movimientos de la imagen, por lo que recrea las sensaciones perceptuales relacionadas con la posición. Por ejemplo, si giramos 180º, lo que estábamos escuchando por el oído izquierdo pasaremos a escucharlo por el derecho y viceversa, puesto que se habrá modificado nuestra posición relativa en relación con esa fuente (virtual) de sonido.[27] Así, se logra generar aún más realismo en las experiencias de realidad virtual. Kelly lo distingue de este modo: “A diferencia del estéreo, en el sonido binaural dinámico, a medida que se mueve la cabeza cambia la ubicación aparente de la fuente de sonido, lo que genera sensaciones mucho más realistas en el oído interno” (Kelly, 2016).

El desarrollo de fidelidades cada vez mayores en los distintos planos hace preguntarse si en un futuro la cuestión de saber si estamos ante un texto o viviendo una experiencia no será resuelta, como en el caso del sonido del piano, solo en una información colateral, en el “dato” que funcione como interpretante y que nos permita leer nuestras percepciones como directas o como mediadas. Al respecto, Diego Levis señala como uno de los efectos de los avances de las tecnologías de la comunicación la disolución de los marcadores de realidad, y lo vincula con la idea de simulacro: “Un simulacro permanente en el cual cada vez es más difícil distinguir lo representado de su representación” (Levis, 2014: 199). En la construcción del “simulacro” del que habla Levis, incide también el efecto de ausencia de pantalla del que dábamos cuenta inicialmente. Al respecto, puede decirse que en la realidad virtual la exterioridad no es ya la de la pantalla o la del escenario, que es siempre un espacio recortado, sino la exterioridad propia de la mirada: lo que vemos es ese mundo exterior que nos rodea, en el que estamos virtualmente inmersos. El efecto se verifica, en principio, en cualquier dirección en la que observemos esos espacios virtuales. En ese sentido, en las experiencias de RV, el discurso cambia con las acciones del operador, aunque habitualmente no lo hace la historia.[28] Dicho de otro modo: cambia lo que se ve cada vez, y, en términos de experiencia perceptual, el repertorio de combinaciones de perspectivas o puntos de vista en cada momento aparece como ilimitado. En las experiencias de realidad virtual, hay una puesta en situación en el interior de una historia, que luego simplemente transcurre más allá de lo que el usuario realice, y en la que el usuario puede elegir, en cada momento, distintos planos o encuadres. En otras palabras, la duración, el desarrollo y el final de cada experiencia de RV están escritos desde un inicio.[29]

Decíamos recién que el espacio virtual de estas experiencias puede verse en cualquiera de las direcciones en las que orientemos nuestra mirada. Existe, sin embargo, una instancia en la que se produce un quiebre: extendemos los brazos, queriendo ver nuestras extremidades, y nada aparece; miramos hacia abajo, buscando nuestros pies o piernas, y tampoco hay nada allí. La no figuración del cuerpo es probablemente la marca por ausencia que genera el mayor efecto metadiscursivo de los productos de RV como texto.[30]

Hay además otras propiedades de las imágenes y del dispositivo de la realidad virtual que juegan en contra del efecto de transparencia: marcas en los textos que los señalan como tales y generan, en ese sentido, una cierta opacidad. En principio, debemos señalar que las imágenes aún son pixeladas; esta discontinuidad en la imagen nos recuerda desde ya que se trata de una representación. El usuario, además, se encuentra con un campo de visión acotado, y con un casco con pantalla (y probablemente auriculares) puestos en su cabeza. En ese sentido, se hace ostensible que se está frente a una imagen, y no frente a los objetos del mundo.

Aun así, se pueden generar ciertos efectos en recepción que, en algunos aspectos, se asemejan a los que tienen lugar cuando se está no ante imágenes de los espacios, sino en los espacios efectivos: de hecho, Janet Murray cuenta que las experiencias de realidad virtual pueden tener un impacto emocional tan alto que han sido empleadas con fines terapéuticos:

En varios centros de investigación, los psicólogos tratan a los pacientes aquejados de fobias exponiéndolos a entornos virtuales que simulan las situaciones que desencadenan sus ataques de ansiedad […] han curado el miedo a las alturas de pacientes crónicos haciéndoles caminar por puentes virtuales (Murray, 1997[1999]: 183).

Esta capacidad de ser empleadas como simuladores da cuenta, una vez más, de su capacidad representativa y de su cualidad inmersiva. Los entornos son virtuales, pero las sensaciones que experimentan los usuarios son como si no lo fueran:

Uno de los aspectos más notables de los entornos virtuales inmersivos es que los usuarios tienden a responder de manera realista a las situaciones virtuales y a los eventos a pesar de saber que éstos no son reales, efecto llamado “suspensión de la incredulidad” (Gifreu-Castells, 2016: 57).[31]

Llama la atención que estos efectos se producen más por el dispositivo inmersivo que por la calidad o resolución de la imagen: “Esta ‘respuesta como si fuera real’ (‘Rairo’, response-as-if-real) se produce incluso aunque el nivel de realidad respecto a la realidad física experimentada se reduzca drásticamente” (Gifreu-Castells, 2016: 57). Dice al respecto Kevin Kelly, contando su propia experiencia: “Lo que descubrí en cada mundo virtual en el que entré fue que si bien cada uno de estos ambientes era falso, las experiencias que tenía en ellos eran genuinas” (Kelly, 2016).

5.7. Realidad virtual y videojuegos

Veíamos recién que varios autores, con los que acordamos, coinciden en señalar la coexistencia, en la realidad virtual, de algunos aspectos más situados del lado de lo “real” (“experiencias genuinas”, “sensaciones reales”) junto con otros más cercanos a lo “virtual” (“entornos no reales”, “ambientes falsos”). El tipo de imagen del que nos estamos ocupando tiene, en efecto, una denominación oximorónica: ¿cómo podría ser virtual lo real, y cómo lo real podría ser virtual? La pregunta, en todo caso, debería ser reformulada: ¿qué es lo real y qué es lo virtual en las experiencias de RV?

Existe un campo de estudios que ha trabajado desde hace tiempo con un escenario similar, al que deseamos acercarnos ahora para problematizar este doble carácter de las experiencias que nos ocupan: los estudios sobre videojuegos. Resulta fecundo revisar algunos textos clave de la copiosa bibliografía sobre esos fenómenos, con el fin de caracterizarlos comparativamente en relación con la realidad virtual. En principio, señalemos que ninguno de los dos fenómenos acota una materialidad única, sino un campo de fenómenos variados que, aun así, mantienen algunos rasgos en común que permiten, en cada uno de ellos, que el nombre que los denomina opere como una categoría social de una cierta estabilidad.[32]

Al igual que el videojuego, puede considerarse que la realidad virtual es una máquina half-real, al decir de Juul (2011), en cuanto propone interactuar con reglas reales en un mundo ficcional. Juul explica:

[…] los videojuegos son reales en el sentido en que poseen reglas reales, con las cuales los jugadores realmente interactúan: ganar o perder un juego es un evento real. Sin embargo, cuando se gana un juego abatiendo a un dragón; ese dragón no es real, sino ficcional […] esos son entonces dos componentes de los videojuegos: reglas reales y mundos ficcionales (Juul, 2011: 1).

En el caso de la realidad virtual, operan reglas reales en relación con la visión: distancias, objetos, perspectivas se comportan siguiendo las regulaciones propias de la mirada en el mundo ordinario. Sin embargo, no se trata de espacios, objetos ni seres reales. En ese sentido, el oxímoron “realidad virtual” expresa también la idea de half-real: la coexistencia en el dispositivo de las reglas ordinarias de la visión junto a espacios que solo están figurados en imágenes.

En la imagen de realidad virtual, esos mundos son siempre representados, es decir, imágenes que están en lugar de otra cosa; sin embargo, no son necesariamente ficcionales, si entendemos por ficcional aquellos que no tienen correlato existente en el mundo real. Como hemos visto en varios ejemplos, una gran cantidad de producciones de la realidad virtual, muchas de ellas de tipo documental y basadas en imagen de video, no proponen un “fingimiento lúdico compartido”, tal como define Schaeffer (1999[2002]: 129) a la ficción, sino un modo diverso de acceder a imágenes de registro que presentan referentes que se proponen como existentes, es decir, con fuerte componente indicial.[33]

5.7.1. Cibertextualidad y carácter ergódico

En los estudios sobre videojuegos, es habitual su caracterización como cibertextos, una denominación tomada de Espen Aarseth. En ellos, la participación activa del usuario modifica el texto, así como también el curso de los acontecimientos en ese mundo diegético/ficcional en el que se desarrollan los acontecimientos del juego. La acción requerida para modificar el texto es física (se debe mover la mano sobre el joystick, o el dispositivo de control del que se trate); es justamente la presencia de acción física en la interacción la que establece para Aarseth el límite entre un cibertexto y otros tipos de texto. Un cibertexto funciona entonces como una máquina, en cuanto se trata de un “dispositivo mecánico que requiere el accionar del operador humano […] en la construcción de sentido” (Aarseth, 1997: 2, citado en Molina Ahumada, 2014: 4).

El término “literatura ergódica”, muy extendido en el campo de estudio de los videojuegos, fue acuñado por Aarseth, y hace foco justamente en el tipo de textos que requiere algún esfuerzo físico para su consumo:

[…] el usuario de cibertexto también actúa en un sentido extranoemático. Durante el proceso cibertextual, el usuario habrá efectuado una secuencia semiótica, y este movimiento selectivo es una obra de construcción física del que los distintos conceptos de “lectura” no dan cuenta. Este fenómeno lo llamo ergódico […] En la literatura ergódica, para recorrer el texto, se requiere del lector un esfuerzo no trivial (Aarseth, 1997: 1).[34]

Murray (1999) habla de esta participación activa del usuario en términos de una “actuación”, que Pablo Molina Ahumada explica de este modo: “[…] realización de una variante en un conjunto limitado de posibilidades, previstas por el autor y reguladas por un procedimiento informático” (Molina Ahumada, 2014: 4). En su lectura de Murray, el autor argentino enfatiza que la actuación tiene un componente importante de regulación: la participación activa del usuario sería siempre “una variante dentro de un conjunto limitado de posibilidades, todas ellas previstas por el autor y reguladas por el procedimiento informático. Lejos de ser un co-autor, el jugador desempeña un papel en una escena que lo aguarda” (Molina Ahumada, 2015: 86).[35]

A este conjunto de posibilidades previstas y reguladas, nos referimos cuando, en un viejo artículo, trabajamos la noción de “motor” a propósito de los videojuegos tradicionales. Habíamos dicho que un motor se caracterizaba por ciertas propiedades:

[…] una cierta disposición de personajes y objetos, en la cual es habitual la presencia de ayudantes y oponentes, sobre una determinada estructuración espacial que se muestra en pantalla con un cierto punto de vista configurando una escena en la cual se desarrolla un cierto tipo de acción, con su propia dinámica temporal y de interacción para el usuario (Zelcer, 2007: 8).

En aquel trabajo nos ocupábamos de los videojuegos de tipo arcade, donde no siempre hay estructuras de relato fuerte (aunque sí hay, de algún modo, presencia de narratividad); un aspecto que tiene mucha mayor presencia en los modernos videojuegos de los que se ocupa Molina Ahumada, así como también en buena parte de las experiencias y películas de realidad virtual.

Decíamos algunas páginas atrás que en las experiencias de realidad virtual hay una puesta en situación en una historia, que luego simplemente transcurre más allá de lo que el usuario realice, y que el usuario puede observar, en cada momento, en distintos planos o encuadres. La posibilidad de hacer encuadres ilimitados en los videojuegos solo se verifica en algunos de ellos: aquellos que trabajan con espacios modelados en 3D, que el usuario puede recorrer con relativa libertad (dentro de las regulaciones señaladas); en los restantes, las restricciones para los puntos de vista y perspectiva son mayores. Los videojuegos, en cambio, presentan mayores grados de libertad en relación con el desarrollo de las historias, que –aun cuando se mueven sobre un repertorio predeterminado– pueden tener distintos desarrollos y desenlaces en cada partida. En las experiencias de RV, en cambio, los acontecimientos transcurren siempre iguales independientemente de cómo sean vistos.[36] Tanto en unos como en otros, lo que cada uno ve depende de su performance.

¿Las experiencias de realidad virtual pueden ser entonces consideradas cibertextos, o –en términos de Aarseth­– “literatura ergódica”? Antes de responder esto, volvamos una vez más a este autor para observar cómo define su opuesto: la literatura no ergódica. Dice Aarseth:

Si la literatura ergódica tiene sentido como concepto, también debe haber literatura no-ergódica, donde el esfuerzo por recorrer el texto es trivial, sin responsabilidades extranoemáticas para el lector, con excepción de (por ejemplo) el movimiento ocular y el giro periódico o arbitrario de páginas (Aarseth, 1997: 1).

El esfuerzo para interactuar con la imagen de RV en su forma básica no es mayor que el requerido para interactuar con un texto o incluso un film ordinario; una vez puesto el casco, no hay más exigencia física que la requerida al espectador cinematográfico: oír, mirar; nada que tocar, desplazar o presionar. Ni siquiera está la acción de pasar las páginas que Aarseth concede a la literatura no ergódica como un pequeño esfuerzo permitido que no cambia su estatuto. En una primera lectura de Aarseth, podríamos tender a pensar entonces que las experiencias de realidad virtual no constituyen cibertextos. Ahora bien, cuando Aarseth excluye el hojear (junto con el movimiento de los ojos) de los “esfuerzos no triviales” de consumo de la literatura ergódica, lo hace, podríamos decir, porque eso no altera en nada la construcción de sentido; antes bien, es la acción física mínima requerida para su consumo ordinario. Nos vemos tentados enseguida a refutar estar afirmación, diciendo que el caso de la realidad virtual es diferente puesto que, al movernos, la imagen cambia radicalmente. El solo moverse, en ese caso, estaría ocupando un lugar equivalente al tocar o intervenir el texto en otros tipos de producciones, como los videojuegos. La intervención es justamente señalada por Aarseth como el modo propio de vinculación de los “lectores” (categoría que también discute) con los cibertextos: “El lector de un cibertexto […] no está seguro, y por tanto –puede decirse– no es un lector. El esfuerzo y la energía que el cibertexto le requiere a su lector lleva a pensar, más que en interpretación, en intervención” (Arseth, 1997: 4).

¿Realmente podemos considerar estos cambios de vista, por más novedosos que sean en sus aspectos técnicos, como una intervención textual? Si observáramos una escultura, texto indiscutiblemente no ergódico, desde distintos puntos de vista, no dudaríamos demasiado en decir que, por el solo hecho de cambiar nuestra perspectiva o distancia, su estatuto de no ergódico no se modifica. Incluso si estuviéramos ante esculturas barrocas o románticas, en las que muy habitualmente el único modo de observar la totalidad de la superficie escultórica sea adoptando múltiples posiciones y ángulos, seguiríamos sosteniendo lo mismo: lo que cambiaría en esos casos es lo que se ve cada vez, no las cualidades de ese objeto. En ese aspecto, ¿una experiencia de realidad virtual se asemeja más a una escultura o un videojuego? Lo que estamos discutiendo aquí es si la cualidad de ergódico implica una intervención en el plano del discurso o en el de la historia. En el videojuego, las intervenciones modifican ambos planos, mientras que, en las experiencias ordinarias de realidad virtual, solo modifican el discurso, pero no los acontecimientos, objetos o personajes de esa diégesis. Siguiendo una vez más a Aarseth, nos inclinaremos por decir que la posibilidad de intervención propia de los textos ergódicos se juega en el nivel de la historia:

Las tensiones que están en juego en un cibertexto, aunque no son incompatibles con las del deseo narrativo, son también algo más: una lucha no sólo por la intuición interpretativa sino también por el control narrativo: “quiero que este texto cuente mi historia; la historia que no podría ser sin mí”. (Aarseth, 1997: 4).

Ahora bien, como veremos enseguida, dentro de las experiencias de RV pueden aparecer algunas posibilidades de interacción que permitan intervenir en el curso de los acontecimientos; en esos casos, indudablemente estaríamos ante textos ergódicos. Esto quiere decir que la imagen de realidad virtual no es de por sí ergódica o no, como tampoco puede predicarse tal cosa de la letra escrita. La cualidad cibertextual se define entonces en otro nivel, referente a las posibilidades de intervención en la historia: así, experiencias interactivas de realidad virtual, o incluso juegos montados sobre realidad virtual, serán indudablemente textos ergódicos, mientras que las películas de RV, o las experiencias no interactivas, no lo serán.[37] Enseguida nos ocuparemos de describir algunas de las maneras básicas de interactuar ergódicamente en la realidad virtual.

5.7.2. Identificaciones

Regresemos a la comparación con los videojuegos, para preguntarnos ahora por los modos de representación del usuario en la imagen. En las experiencias de realidad virtual, esta representación no está figurada: no hay un avatar, no nos vemos a nosotros mismos, no hay un personaje con el cual identificarse. En este sentido, prima una identificación con el lugar de la cámara, tal como señalaba Metz para el lenguaje cinematográfico. Es impactante revisar, varias décadas después, la descripción de la situación del espectador cinematográfico que realizaba Metz en 1973, puesto que también da cuenta en buena medida de la situación del usuario de realidad virtual. La citamos aquí in extenso:

[…] la institución del cine prescribe un espectador inmóvil y silencioso, un espectador hurtado, en constante estado de submotricidad y de superpercepción, un espectador alienado y feliz, acrobáticamente aferrado a sí mismo por el hilo invisible de la vista, un espectador que sólo en el último momento se recobra como sujeto, mediante una identificación paradójica con su propia persona, ya extenuada en la mirada pura. No se trata aquí de la identificación del espectador con los personajes de la película (ya secundaria), sino de su identificación previa a la instancia vidente (invisible) constituida por la misma película como discurso, como instancia que pone por delante la historia y que la da a ver. Si la película tradicional tiende a suprimir todas las marcas del sujeto de la enunciación, es para que el espectador tenga la impresión de ser él mismo ese sujeto, pero en estado de sujeto vacío y ausente, de pura capacidad de ver […]. Estos múltiples datos certifican sin ninguna duda que la identificación primaria del espectador se realiza alrededor de la propia cámara, tal como lo ha demostrado Jean-Louis Baudry (Metz, 1973: 97).

Más allá de las similitudes, deseamos señalar al menos dos diferencias entre esta situación del espectador cinematográfico y la del usuario de realidad virtual. Por un lado, la submotricidad que presenta es menor: al igual que el espectador cinematográfico permanece en un mismo lugar, pero puede estar tanto sentado como de pie y moverse ligeramente, en particular, se espera que lo haga con la cabeza.[38] Por el otro, la superpercepción es diferente; mayor por un lado y menor por el otro. Mayor porque la imagen ocupa una superficie mayor del campo perceptual visible, y menor porque en la realidad virtual el espectador/usuario nunca ve toda la imagen al mismo tiempo.[39]

Por contraposición a las experiencias de realidad virtual, en los videojuegos sí hay una representación digital de un “yo” en el “avatar” o personaje que es comandado por el usuario. Mientras que en las experiencias de realidad virtual la identificación con la cámara es la que prima; en el caso de los videojuegos, la identificación con estos personajes –que en el cine Metz considera “secundaria”– es la que toma la escena. La identificación con los personajes es del orden de una exterioridad; me identifico con ese otro; en el caso de la cámara, me identifico con esa mirada, con esa “instancia vidente” de la que habla Metz. Sin embargo, en la RV se produce un efecto de desaparición de la pantalla; en ese sentido, a diferencia del cine, en estas imágenes desaparece perceptualmente la idea de mediación: si en el cine veo a través de los ojos de ese otro que es la cámara, en la realidad virtual parecería que veo directamente.

5.7.3. Espacialidad: Web, videojuegos, realidad virtual

Aarseth discute y critica la idea del texto narrativo como “laberinto”. El estudio de los cibertextos, dice este autor, hace ostensible la debilidad del empleo de las metáforas espaciales en la teoría de la narrativa, puesto que la literatura ergódica la encarna de un modo diferente:

Esto puede ser difícil de comprender para el crítico literario tradicional, que no percibe la diferencia entre estructura metafórica y estructura lógica, pero es esencial. El lector de cibertextos es un jugador […] el cibertexto es un mundo de juego, o un juego del mundo, en el que es posible explorar, perderse o descubrir caminos secretos, no en sentido metafórico, sino a través de las estructuras topológicas de la maquinaria textual (Aarseth, 1997: 4).

Como señalamos en un viejo trabajo, la World Wide Web trajo consigo un conjunto de metáforas provenientes de distintos universos, en el que se destaca el de la arquitectura (y en general, la espacialidad). Decíamos entonces:

Las metáforas de la tridimensionalidad y la espacialidad son características de Internet, sobre todo, cuando se habla de la Web: dan cuenta de ello términos tales como sitio, arquitectura, portal, navegación, ciberespacio, red, etc. Se trata de denominaciones que reconocen un origen metafórico […], pero que forman parte del lenguaje llano para referirse a la Web, en la medida en que son el único modo que existe de denominar a esos fenómenos (Zelcer, 2006: 4).

Este universo metafórico espacial se extendió a diversos ámbitos discursivos, que incluyen al menos dos: por un lado, la generación de mediciones en la Web: así, en cada sitio se miden las visitas que se generan mensualmente. Por el otro, a textos académicos, donde también aparecieron referencias a estos productos digitales en términos de la espacialidad. Una de las autoras que lo emplea en ese campo es Murray, quien se refiere a la aparición del ordenador como un “medio participativo de inmersión”. Describe Murray: “Con sus detalles enciclopédicos y sus espacios navegables, el ordenador puede proporcionarnos un espacio concreto para visitar aquellos lugares que deseamos conocer” (Murray: 1997[1999]: 110).

El empleo del término “concreto” en un universo conceptual de origen metafórico no hace sino indicarnos el hecho de que el uso de la Web se experimenta efectivamente como un recorrido espacial. Como señalan Lakoff y Johnson (1980[2007]), las metáforas terminan por estructurar el modo en el que conceptualizamos nuestras experiencias cotidianas. En el caso de estos conjuntos de términos, se han vuelto en el universo de la conversación sobre Internet en la denominación llana de los fenómenos (catacresis) (ver Zelcer, 2006: 5).

Frente a la espacialidad metafórica de la Web, en la realidad virtual la remisión a un espacio no es de tipo figural, sino referencial: esas imágenes construyen un espacio. Un espacio en el que –todos coinciden en señalar– el usuario experimenta una inmersión.

5.8. La inmersión

Como hemos visto en numerosas citas presentadas en este capítulo, es coincidente en la literatura acerca de la realidad virtual el señalamiento de que se trata de experiencias de tipo inmersivo. Una revisión bibliográfica indica que este calificativo aplicado a las imágenes digitales tiene larga data; se encuentra ya en estudios clásicos sobre la Web (cuya navegación nos presentaría experiencias inmersivas), sobre videojuegos (que serían, también, experiencias inmersivas) y, como se dijo, en los estudios de realidad virtual. ¿En qué radica la cualidad de inmersivo de un dispositivo? ¿Se denomina de este modo a un efecto perceptual, uno psicológico, o una combinación de ambos?

El calificativo de “inmersivo”, expandido a propósito de las tecnologías de realidad virtual, había sido empleado hace ya veinte años también por Murray para referirse a las posibilidades abiertas por los ordenadores. En su problematización de este término, la autora define: “La experiencia de trasladarse a un lugar ficticio muy elaborado es un placer en sí misma, independientemente del contenido de la fantasía. Esta experiencia es la que denominaremos ‘inmersión’” (Murray: 1997[1999]: 111).

Enseguida Murray reconoce el origen metafórico del término; una vez más, la metáfora se refiere a movimientos en el espacio:

Es éste un término metafórico derivado de la percepción física de estar sumergido en el agua. En una experiencia de inmersión psicológica buscamos lo mismo que cuando nos zambullimos en el océano o en una piscina: la sensación de estar rodeados por una realidad completamente diferente (Murray, 1997[1999]: 111).

Como se ve, aquí la definición de Murray es inicialmente de tipo psicológico; en este caso aparece a propósito de representaciones bidimensionales observables en computadoras; sin embargo, como la misma autora propone, podría pensarse para cualquier materialidad:[40] “Una narrativa sugestiva en cualquier medio se puede experimentar como si fuera realidad virtual, porque incluso nuestro cerebro está preparado para sumergirse en las historias con una intensidad tal que el mundo a nuestro alrededor desaparece” (Murray: 1997[1999]: 109).

Curioso giro retórico, en el que la realidad virtual no es el término metaforizado, sino el que funciona como metáfora, en la que el sema en común es la desaparición del mundo circundante. Como se ve, este empleo como término metaforizante arroja luz sobre la singularidad de la inmersión en la realidad virtual.

La definición de “inmersión” con la que abre su capítulo dedicado al tema, restringida al orden psicológico, se amplía conforme avanza el texto para incluir también cuestiones perceptuales. Refiriéndose al CD-ROM Enterprise, señala: “El movimiento es tan fluido, los gráficos tan realistas y la representación tan eficiente, que nuestra visita a la Enterprise se convierte en algo mágico. Es como si de veras estuviésemos a bordo de la nave real” (Murray: 1997[1999]: 121). En el desarrollo del texto, la autora parece finalmente contemplar un conjunto de cuestiones diversas en relación con las cualidades inmersivas, entre los que deben contarse al menos la calidad de representación, la presencia de una historia y la posibilidad de participación.

Arnau Gifreu-Castells también problematiza la noción de “inmersión” a propósito de los medios digitales, aunque –aclara desde un inicio– no es un concepto que se restrinja solamente a ellos. Si bien la define de un modo distinto, este autor la conceptualiza considerando los mismos factores como los principales constructores del efecto inmersivo para el caso de estos medios: “En el campo que nos ocupa, el ámbito de los medios digitales, la inmersión se puede conseguir a partir de la representación visual y la interacción con las historias que nos posibilitan las tecnologías digitales” (Gifreu-Castells, 2016: 56). También este autor aclara que la sensación de inmersión no se logra solo con capacidades tecnológicas: “Esta es una cualidad psicológica que se debe despertar en el usuario a partir de la recreación de un escenario digital interactivo” (Gifreu-Castells, 2016: 56).[41]

En los videojuegos, señala Diego Maté, las posibilidades de interacción bastan para sumergir al jugador en una experiencia inmersiva, lo que hace que no requieran “per se de un modo de representación fotorrealista o de mecanismos narrativos como los del cine” (Maté, 2016: 98). Dicho de otro modo, lo que señala Maté es que, dentro del par representación/interacción ya formulado por otros autores, la especificidad de la inmersión en el videojuego pasa predominantemente por la dimensión interactiva.

En este par, podemos pensar, la realidad virtual se encuentra mucho más del lado del primer factor señalado por Murray: la calidad de la representación, donde por “calidad” entendemos no solo cuestiones técnicas referentes a cierto nivel de sofisticación, como la resolución que pueda tener la imagen, sino también sus aspectos cualitativos, que incluyen, como se ha señalado, el abarcar la totalidad del campo perceptivo, la visión en 360º y la tridimensionalidad. De hecho, frente a otros dispositivos vinculados a los medios digitales, es muy acotada la intervención que el consumidor de experiencias de RV puede tener en ese mundo diegético. Sin embargo, hay de base un efecto inmersivo en cualquier producto de la realidad virtual por la combinación de la suspensión de la conexión sensorial/perceptual con el afuera del texto (siempre con la vista, muy habitualmente con el oído, cuando se emplean auriculares) y su reemplazo por la visión panorámica en tres dimensiones. Como se ve, esto va más allá del mayor o menor realismo de la imagen, o incluso de su estatuto semiótico: se trata de características perceptuales propias de su dispositivo. Sobre esa base de cualidades inmersivas, sí pueden producirse mayores o menores efectos provenientes del realismo o la calidad de la imagen. Y a su vez, sobre las cualidades de esta representación pueden encabalgarse eventuales efectos psicológicos de inmersión.

La anulación de toda otra percepción visual del mundo circundante hace que la realidad virtual no sea inmersiva como lo puede ser una novela literaria, un film, o incluso un sitio web o videojuego de consola. En todos estos tipos de textos, hay siempre un marco y una percepción de un “fuera del texto”, que en la RV no se produce. Eso hace que ocupe un lugar privilegiado entre las técnicas inmersivas: “La realidad virtual inmersiva, tan de moda actualmente, implica una inmersión sensorial en el entorno virtual. Esta técnica se constituye como el máximo exponente de la promesa de inmersión que desde sus orígenes ha acompañado a los entornos digitales” (Gifreu-Castells, 2016: 57).[42]

Uno de los términos estrechamente vinculados al de inmersión es el de “simulación”. En efecto, ese “mundo circundante” diferente que aparece en las experiencias inmersivas puede ser pensado como un espacio simulado. Manovich señala que, a diferencia de la tradición de la representación, la de simulación persigue mezclar los espacios físico y virtual en vez de separarlos. Sin embargo, a diferencia de las simulaciones clásicas, que creaban falsos espacios que continuaban a los normales, en este caso, la sustitución es total: la realidad física desaparece del campo perceptual visual y es reemplazada por la simulada, virtual.

Diego Levis define justamente las propiedades inmersivas en relación con la posibilidad que ciertas tecnologías tienen de realizar simulaciones. En su perspectiva, podría decirse, el foco de la inmersión está más en los aspectos perceptuales que en los psicológicos. Su definición de lo inmersivo –restringida a los productos informáticos– pone el foco en la ilusión de estar en un espacio:

La inmersión se refiere a la propiedad de ciertas aplicaciones informáticas de simular con imágenes y sonidos un espacio físico dentro del cual el usuario se puede mover (o tiene la sensación de moverse, como en el caso de algunos videojuegos) (Levis, 2014: 200).

Es interesante que Levis incluya en su definición el plano sonoro. El sonido es señalado por Gifreu-Castell como uno de los elementos que pueden potenciar ambientes inmersivos: “La utilización del sonido, utilizado a partir del ambiente sonoro generado por la música y los efectos principalmente, es una estrategia que puede generar por sí misma inmersión en el relato” (Gifreu-Castells, 2016: 59). En rigor, más allá de los casos de sonidos generados y añadidos en otros productos como los videojuegos (en los que probablemente Gifreu-Castells esté pensando), los sonidos ambientes en registros de video son también parte constitutiva de ese espacio. La construcción espacial inmersiva de la realidad virtual se complementa entonces articuladamente con este universo registrado o elaborado técnicamente de sonidos ambientes. Como señala Stadler Reinhold, en las experiencias de la RV se amplifican los sentidos de la vista y del oído, mientras que los otros tres (gusto, olfato y tacto) permanecen conectados con la realidad física, aunque de un modo disminuido (Reinhold, 2016: 4). Con los auriculares completando los visores, las experiencias de RV suspenden así no solo la percepción visual del entorno, sino también la auditiva, y la sustituyen completamente por ese mundo de imágenes y sonidos en el que el usuario está inmerso.[43]

5.9. Una propiedad de la interfaz RV: la intuitividad

Podemos pensar también la RV como una interfaz que articula dos espacios: el construido en las imágenes, y el efectivamente habitado por el usuario. A través de la interfaz, se construiría el mundo de cada una de las experiencias virtuales.

¿Qué entendemos aquí por “interfaz”? Diego Maté (2016) señala cómo los distintos desarrollos teóricos del concepto han oscilado entre dos grandes aproximaciones: un tipo de definición amplia, que excede el marco discursivo e incorpora dimensiones tecnológicas y sociales, y otro restringido, que se centra en dimensiones textuales, y deja de lado cualquier componente extradiscursivo.[44] Puede decirse que la noción de “interfaz” se encuentra en un momento de desarrollo teórico en el cual tiende a dominar la definición amplia, que designa una enorme cantidad de fenómenos de muy distinta materialidad y de distinto orden, como si su empleo propusiera no tanto una acotación de los fenómenos por su naturaleza, sino más bien una mirada específica sobre una multiplicidad de ellos. Se destaca en este tipo de aproximaciones Carlos Scolari, quien en su libro Las leyes de la interfaz (2018) justamente compara la noción de “interfaz” con otras que, en décadas pasadas, fueron dominantes en la observación de los fenómenos sociales, como “estructura”, “signo” o “discurso”:

Si en los años 1950 todo era /estructura/, en los años 1960 se pasó al /signo/, y en los 1980 el /discurso/ se presentó como el concepto clave para comprender infinidad de fenómenos, ¿por qué la /interfaz/ no podría ser una de las palabras clave del Siglo XXI? (Scolari, 2018: 16).

En su lectura de esta obra de Scolari, Andrés Cuesta González lo resume de este modo: “Desde esta perspectiva, todo constructo social puede ser comprendido como una interfaz. Incluso puede plantearse que toda producción de sentido, en tanto tenga circulación, implica la puesta en funcionamiento de una interfaz” (Cuesta González, 2018: 153). Si se debe resumir en pocas palabras, podría decirse que, para Scolari, la pregunta por los fenómenos como interfaces implica abordarlos atendiendo a su funcionamiento como lugares en los que tiene lugar la interacción. En palabras del autor: “La interfaz como lugar o espacio de interacción es quizá la mejor metáfora, la que revela más rasgos pertinentes de la interacción” (Scolari, 2018: 29).

Es así como estamos considerando aquí la realidad virtual: como un espacio de interacción, que comprende desde luego una “interfaz de usuario” (Scolari, 2018: 28), pero es también una interfaz en el sentido más amplio que propone este autor. Como tal, está regida por las “leyes” que propone Scolari. El recorrido genealógico que propusimos al inicio de este capítulo, en el que pensamos la realidad virtual en relación con otras pantallas o interfaces, puede pensarse en forma sincrónica, si se entiende que al día de hoy la realidad virtual coexiste con esas otras pantallas con las que se vincula. En una aproximación de tal tipo, nos preguntamos cómo la realidad virtual conforma un ecosistema con otras interfaces con las que guarda relación (ley 3), tanto de similitudes como de diferencias. Incluso las nuevas experiencias de “realidades” que siguieron a la realidad virtual –como la realidad aumentada y la realidad mixta–, que al día de hoy coexisten con ella, pueden pensarse como formas de evolución de la realidad virtual (leyes 4 y 6); el tiempo dirá si estas nuevas “realidades” terminan por desplazar a la virtual, o coexisten largamente con ella.

Los avatares de la noción de “interfaz” recuerdan en cierto modo lo ocurrido con la noción de “dispositivo” que discutimos en el capítulo 1: mientras que algunas aproximaciones restringen su empleo al sentido de la técnica, y se ocupan –por tanto– de los dispositivos técnicos (por ejemplo, Fernández, 1994), otras aproximaciones le asignan un sentido más amplio. De un lado, la semiótica (por ejemplo, Traversa, 2001 y 2009), como vimos, mantiene para los dispositivos un cierto nivel de indagación específico referente a las regulaciones de los vínculos y los intercambios mediados, yendo más allá de la mera técnica. Del otro, como también vimos, aproximaciones de la filosofía contemporánea, como la de Giorgio Agamben (2006), que parte de reseñar y discutir a su vez la obra de Foucault (1975), terminan volviendo la noción de “dispositivo” aplicable a fenómenos de distinto orden y materialidad. En algunos ámbitos del conocimiento, como en los estudios sobre videojuegos, la noción de “interfaz” y la de “dispositivo” tendieron a solaparse o confundirse. El mencionado trabajo de Maté ayuda a ordenar esta discusión (ver Maté, 2016).

Regresemos ahora a la realidad virtual como un tipo específico de interfaz. ¿Qué propiedades tendrían estas interfaces, y cómo se distinguen de otras pantallas? Volvamos una vez más a Manovich: en su análisis de las interfaces de los ordenadores, este autor desarrolla la noción de “interfaz cultural”, con la que designa “una interfaz entre el hombre, el ordenador y la cultura: son las maneras en las que los ordenadores presentan los datos culturales y nos permiten relacionarnos con ellos” (Manovich, 2001[2006b]: 120). El autor señala que el lenguaje de las interfaces culturales “se compone en gran parte de elementos de otras formas culturales que ya resultan familiares” (Manovich, 2001[2006b]: 121), entre las que señala el cine, la palabra impresa y la interfaz de usuario generalista. Al retomar estas formas culturales conocidas, la pantalla del ordenador se vuelve intuitiva. En un trabajo anterior (Zelcer, 2014), discutimos justamente la cualidad de lo intuitivo a propósito de ciertas pantallas e interfaces. La pregunta que nos hacíamos allí era cómo un determinado diseño de interfaz en un nuevo dispositivo tecnológico –estábamos trabajando entonces con las pantallas táctiles– podía volverse intuitivo. Nuestra perspectiva retomaba la noción de “interpretante” de Peirce para señalar que el efecto de intuitividad tenía que ver con la convocatoria, por parte de un determinado diseño de interfaz, de configuraciones y modos de interacción ya conocidos.[45] Puede pensarse que, en aquel trabajo, estábamos de algún modo preguntándonos por el modo en el que se produce esa “familiaridad” con ciertas formas culturales de las interfaces que ya había señalado Manovich. Decíamos entonces:

Así entendido, lo intuitivo a propósito de la interacción con interfaces está ligado a las configuraciones conocidas. Desde la semiótica, puede decirse que la intuición no es otra cosa que una denominación para la posesión de ciertos interpretantes, vinculados justamente con distintos niveles de estas configuraciones: esquemas de interacción, estructuras u organizaciones espaciales, relaciones causa-efecto, convenciones iconográficas, etc. De algún modo, entonces, la cualidad de intuitivo es un efecto de corpus: una cierta configuración o propuesta de interacción se propone como intuitiva en tanto sigue ciertos moldes o patrones que han sido empleados con cierta insistencia en el pasado, al punto tal de producir una cierta “naturalización”. La intuitividad implica así algún tipo de repetición (Zelcer, 2014: 46).

En el trabajo citado, proponíamos una clasificación de los interpretantes que puede convocar un determinado diseño para construir intuitividad. La presentamos aquí porque creemos que puede resultar relevante para pensar de qué modo una experiencia de RV puede proponerse como “intuitiva”. Organizábamos entonces los distintos interpretantes en tres grupos:

  • El primer grupo corresponde a aprendizajes adquiridos en el empleo de interfaces soportadas en otros dispositivos digitales, diferentes del que se está considerando. Este grupo de interpretantes nos permitía explicar, por ejemplo, cómo ciertos modos de interactuar con pantallas táctiles resultaban intuitivos por parecerse a los modos de interacción que tenían lugar con otros equipos electrónicos conocidos con antelación; por ejemplo, computadoras de escritorio o notebooks. En este sentido, un diseño de interfaz resulta intuitivo cuando presenta esquemas de interacción ya conocidos por la experiencia con otros dispositivos o pantallas, que se recrean sin modificación o con cambios menores en las nuevas técnicas.
  • El segundo grupo corresponde a los saberes referentes a un conjunto de esquemas de interacción que son propios de las interfaces del dispositivo técnico que se está estudiando. Por ejemplo, el “clic derecho” resulta desde hace años para el usuario de PC un recurso al que puede recurrir intuitivamente para conocer qué operaciones puede realizar con un determinado elemento (archivo, carpeta) que observa en la pantalla (cortar, copiar, borrar, etc.). Es evidente que no hay nada de natural en hacer clic con el botón secundario del mouse con este fin; sin embargo, es una de las operaciones que llamamos “intuitivas” por su grado de fijeza en la interacción con los sistemas operativos informáticos más extendidos. En el caso de los nuevos dispositivos técnicos, hay modos de interacción que no presentan inicialmente intuitividad, pero que pueden volverse intuitivos por un efecto de repetición que instaure previsibilidad.
    Como se ve, tanto los interpretantes del primer grupo como los del segundo corresponden a aprendizajes obtenidos en la experiencia con interfaces digitales. Sin embargo, mientras que el primer grupo nos explica los casos en que un determinado diseño de interfaz nos resulta intuitivo por parecerse a los aprendidos con otras técnicas, el segundo nos explica aquellos casos en que un cierto recurso se vuelve intuitivo por efecto de la repetición de sus apariciones dentro de las interfaces de una misma técnica (por ejemplo, un cierto tipo de pantalla o dispositivo digital). En relación con la problemática de la realidad virtual, los primeros interpretantes son aquellos que explican cómo la frecuentación de otros tipos de pantallas puede volver intuitiva una experiencia de RV, mientras que los segundos son aquellos que se vuelven intuitivos por su empleo insistente dentro de las experiencias de RV.
  • Finalmente, el tercer grupo de interpretantes es el convocado por una serie de esquemas de interacción que realizamos con las pantallas o interfaces de un modo similar al que lo hacemos con los objetos de la vida cotidiana. En el trabajo citado, observábamos cómo habían surgido nuevos modos de interacción de este tipo con las pantallas táctiles, con ciertos modos de desplazamiento de los objetos, que no podían manifestarse de ese modo en las pantallas tradicionales. A diferencia de los interpretantes puestos en juego en los dos primeros conjuntos, que son de naturaleza digital, los de este conjunto fueron aprendidos en nuestras interacciones con los objetos del mundo, incorporados tempranamente en nuestras vidas –algunos de ellos, incluso cuando estábamos desarrollando nuestras primeras habilidades motrices–.

El “principio de coherencia” del que habla Manovich cuando caracteriza la moderna interfaz del usuario hace referencia justamente a uno de los modos de construir intuitividad, que es la persistencia en el tiempo del empleo de los mismos elementos para las mismas funciones; una estabilidad que genera previsibilidad: “Uno de los principios básicos de la moderna interfaz de usuario es el de coherencia. Dicta que menús, íconos, ventanas de selección y otros elementos de la interfaz deben ser los mismos en las distintas aplicaciones” (Manovich, 2001[2006b]: 143). Se trata de funcionamientos que señalamos para el primero y segundo conjunto de interpretantes, en los que la repetición genera previsibilidad. Entre estos elementos, podrá haber varios que tengan funcionamientos icónicos o metafóricos, lo que puede agregar a su vez un funcionamiento intuitivo en una doble dirección: el ejemplo que cita Manovich, del ícono para hacer zoom en las aplicaciones de computadora, resulta intuitivo tanto por su funcionamiento metafórico de origen (es una función digital que sirve para ver más grandes los elementos, comparable con lo que permiten hacer las lupas con los objetos del mundo), como por su grado de repetición. La eficacia de los elementos con origen icónico similares a objetos tecnológicos que han caído en desuso da cuenta de su fuerte funcionamiento convencional, como ocurre con el ícono de “guardar” similar a los viejos diskettes, hoy desconocidos para las generaciones más jóvenes de usuarios de computadoras, tal como lo ilustra una viñeta humorística que circuló hace un tiempo por las redes sociales (ver figura 5.4.).

Figura 5.4. La efectividad del ícono de un diskette para la función de “guardar” en los programas informáticos no radica solamente en su analogía perceptual con un viejo soporte de almacenamiento, sino (sobre todo) en la previsibilidad instituida por su repetición. Imagen: Avira México. Extraída de bit.ly/31K7Oga [consulta: 25/10/2020].

¿Qué ocurre en el caso de la realidad virtual? La pantalla de RV nos obliga a suspender múltiples interpretantes que ponemos en juego en relación con las pantallas que conocíamos hasta ahora (es decir, los del primer conjunto). Si una pantalla es una superficie que se percibe como bidimensional, con límites definidos, que no cambia lo que muestra por el hecho de que la miremos (como el cine o la televisión), o si lo hace, es por acciones que realizamos con cierto esfuerzo físico (cambiar el canal con un control remoto, cliquear un mouse, digitar en un teclado, dar toques o desplazar el dedo en una pantalla táctil) que siempre exceden el mero mirar (como señala Aarseth); entonces muchos de los hábitos o leyes que ponemos en juego en nuestro contacto con las pantallas no tienen lugar aquí. Como ocurrió con la llegada de las pantallas táctiles, que nos invitaron a desaprender nuestro hábito de tomar el teclado o el mouse para que algo ocurriera en ellas, y volver a poner en juego interpretantes propios de nuestra interacción con los objetos del mundo, con las pantallas de RV debemos poner en juego hábitos corporales del mirar que empleamos para conducirnos en la vida cotidiana más allá de las pantallas: son los interpretantes del tercer conjunto. Si, en nuestra relación con la pantalla cinematográfica o televisiva, debemos permanecer con la cabeza quieta y la mirada posada sobre los límites rectangulares de su superficie, dejando que el texto decida qué mostrarnos en cada momento, las pantallas de RV nos llevan a abandonar esa quietud y a girar la cabeza para observar el entorno, decidiendo nosotros qué veremos y desde qué perspectiva, como lo hacemos a diario cuando deseamos observar el espacio que nos rodea. Dicho de otro modo, la intuitividad de las pantallas de realidad virtual no proviene tanto de nuestra interacción con otras pantallas como de nuestra experiencia visual en el mundo.[46]

Como con el desplazamiento de elementos sobre las pantallas táctiles, en la realidad virtual se ponen en juego interpretantes aprendidos en el contacto con los espacios del mundo. En este sentido, el tipo de interacción propuesto se asemeja a las interfaces de videojuegos que Juul (2010) denomina “miméticas”; en palabras de Diego Maté, se trata de aquellas que “no requieren del usuario una destreza previa [puesto] […] que se apoyan en saberes externos al videojuego” (Maté, 2016: 93); un ejemplo de estas interfaces serían los juegos de consola en los que el jugador comanda el avatar en pantalla haciendo los movimientos que desea que realice con su propio cuerpo. Estas interfaces se oponen a las llamadas “arbitrarias”, que requieren la utilización de un joystick y por tanto la puesta en juego de habilidades y saberes específicos de los géneros del videojuego, es decir, aquellos adquiridos por la frecuentación de otros textos.[47] La mímesis en el caso de la realidad virtual es de carácter perceptual: son las formas de emplear la mirada sobre los objetos y el espacio las que resultan similares en ambos entornos.

En varios pasajes adelantamos que, incluso en las experiencias de realidad virtual en las que solo se emplea un casco, sin ningún “guante” o sensor háptico adicional, existen algunos modos de interacción que van más allá del ajuste de la imagen según el movimiento de la cabeza, que es el constitutivo del dispositivo. Deseamos revisar aquí dos de ellos a la luz del agrupamiento de interpretantes propuesto, porque nos permitirán identificar algunas relaciones de las interacciones presentes en la realidad virtual con las provenientes de dispositivos preexistentes.

En primer lugar, señalemos que algunos cascos de RV, como el Gear VR de Samsung, poseen un pad y un botón en uno de los lados. El pad es bien conocido para los usuarios de notebooks: se trata de una superficie sensible sobre la cual, tocando y desplazando un dedo, se puede mover el puntero en pantalla, tal como se lo haría empleando un mouse. El pad constituye ya una superficie táctil, pero no es una pantalla: sigue funcionando como un dispositivo periférico a través del cual se realizan acciones en la pantalla. Puesto en los cascos de RV, permite interactuar de distintos modos en la imagen, por ejemplo, moviendo un punto en ella, que funciona como el equivalente al puntero. Tanto con el botón como con el pad del casco, se ponen en juego, como es evidente, interpretantes del primer tipo.

En segundo lugar, muchas experiencias presentan también hot spots en la imagen. Estos recursos nacieron en la primera década del siglo XXI en los sitios web que empleaban tecnología Flash y que simulaban ser un espacio tridimensional. En ese entonces, definimos los hot spots como “‘puntos llamativos’ señalados gráficamente en la imagen” (Zelcer, 2016), y explicábamos que en varios de esos sitios, por entonces novedosos, venían a reemplazar los menús de navegación, herederos a su vez del índice, un modo de organización propio de la gráfica. En los sitios web, los hot spots se podían seleccionar haciendo clic con el mouse, algo que evidentemente no puede tener lugar en las experiencias de la realidad virtual. El recurso empleado en RV, en cambio, consiste en hacer aparecer un punto cuando nuestra mirada está cerca de ellos. Si lo hacemos coincidir con el hot spot, este realiza una animación de unos pocos segundos (como si estuviera “cargando”) y, si la mirada se sostiene allí, el toque se considera realizado. Como señala Vytautas Alech, un especialista en UX (experiencia del usuario), se trata de “un círculo que carga, que cuenta como un ‘clic’ una vez que se ha completado”.[48] El gráfico que se observa en la figura 5.5. es ilustrativo al respecto.

hot-spots-v03

 

Figura 5.5. El funcionamiento de los hot spots en la realidad virtual (elaboración propia a partir de los esquemas de Vytautas Alech).

El toque prolongado se ha extendido hace ya varios años tanto en el mundo de las interfaces físicas, como en el de las digitales. En dispositivos de botón único, es habitual que se consiga un efecto con un toque breve, y uno diferente cuando se hace uno prolongado. En el caso de las interfaces digitales, habíamos ya señalado el toque prolongado como una de las convenciones que se habían vuelto habituales en las pantallas táctiles, y que venían a ocupar el lugar equivalente al clic con el botón secundario del mouse (Zelcer, 2014). El sostener (allí el toque, aquí la mirada) reconoce entonces un antecedente relevante en las pantallas táctiles (interpretante del primer tipo), pero, en la especificidad de la mirada, tiende a constituirse en un modo estable de interacción con los dispositivos de la realidad virtual (segundo caso); uno y otro contacto sostenido parecen indicar a su vez una cierta estabilización de la operatoria que atraviesa múltiples interfaces, soportadas sobre diversas técnicas.

Como se ve en este breve repaso, las experiencias de realidad virtual construyen su intuitividad con múltiples recursos, que incluyen interpretantes de los tres tipos: si bien lo que distingue la singularidad del dispositivo es el desplazamiento de interpretantes del primer conjunto por los del tercero (es decir, al tiempo que debemos poner en suspenso nuestros hábitos instalados en relación con las pantallas, debemos poner en juego hábitos del mirar que empleamos en relación con los espacios y objetos de la vida cotidiana), hay muchos otros recursos que provienen de otras interfaces (sitios web, pantallas táctiles) y que construyen su intuitividad por su similitud con ellas.

En este recorrido, es singular el tránsito que se produce en los tipos de interacción con los textos digitales que se corresponden con la acción de seleccionar, que van del clic al toque, y del toque al movimiento y la mirada. El primero (el clic) se realiza con un dispositivo periférico como el mouse: como es sabido, los movimientos de la mano se reproducen en el puntero de la pantalla, y al presionar el botón principal del mouse se produce el clic, con el cual seleccionamos los elementos. En el caso del toque, el dispositivo periférico desaparece, y el contacto con la pantalla es directo. Como ya señalamos (Zelcer, 2014), el clic con el llamado “botón secundario” es sustituido por el toque prolongado. En las experiencias de realidad virtual, la imagen en pantalla cambia solo con nuestros giros de cabeza, y fijar la mirada en un punto de interacción equivale a un clic en el mouse, o a un toque en las pantallas táctiles. El tránsito clic/toque/mirada sostenida da cuenta de un recorrido singular en el modo de interactuar físicamente con las pantallas digitales. En los primeros dos casos, la distinción pasa por la presencia o ausencia de mediación en el contacto: mientras que en el clic encontramos un contacto mediado, en el toque, es directo. La mirada sostenida constituye una novedad de los dispositivos de realidad virtual; por su similitud funcional con el clic y el toque, le da a la mirada una cualidad táctil. Así, el oxímoron “mirada táctil” parece definir un tipo de interacción singular que nace con las experiencias de realidad virtual. Se trata de un oxímoron no solo porque adjetivo y sustantivo señalan dos sentidos humanos diferentes (la visión y el tacto), sino también porque el mirar se ha opuesto históricamente al intervenir: así fue en las pantallas tradicionales, se sostuvo también en los dispositivos de pantallas dinámicas (Manovich, 2001[2006b]: 148) –en las que nada de lo que se ve en ellas cambia por el hecho de ser visto, sino eventualmente por alguna acción física, como el pulsar un botón de control remoto– y fue de igual modo en las interactivas tradicionales, en las que la interactividad implicaba siempre algún tipo de contacto: sea con un dispositivo periférico, sea con la pantalla. En todos esos dispositivos, el espacio entre la pantalla y la mirada era insalvable y de flujo unidireccional: las imágenes iban hacia los ojos, pero cualquier intervención en ellas se realizaba manualmente. En la realidad virtual, la pantalla detecta que está siendo mirada:[49] es una pantalla que no solo es vista, sino que nos mira, y que –en un flujo inverso al fotónico que es determinante en la generación de las imágenes de impresión, como la fotografía, el cine o televisión– es alterada por nuestro propio mirar. Podría pensarse que el tránsito clic/toque/mirada implica también un progresivo ocultamiento: primero de la mediación (en el toque ya no se cliquea), y luego de la acción misma (en la mirada sostenida ya no se toca).

Antes de finalizar este apartado, recordemos una vez más que existen hoy múltiples dispositivos adicionales que funcionan en conjunto con los anteojos, como distintos tipos de sensores hápticos o de movimiento. Todos ellos constituyen conglomerados de dispositivos que funcionan en modo coordinado, al modo de un hiperdispositivo, y multiplican las maneras posibles de interactuar con las imágenes; sin desconocer su existencia, no los abordaremos aquí, aunque diremos algunas palabras sobre ellos hacia el final de este capítulo.

5.10. Intuitividad y cámara subjetiva. ¿Una enunciación transparente?

En términos enunciativos, una interfaz que despliega una propuesta de interacción intuitiva se vincula con un cierto efecto de transparencia.[50] No casualmente existe una discursividad que evalúa positivamente aquellas interfaces que se “invisibilizan” para el usuario. Siguiendo este razonamiento, la cualidad de intuitivo operaría un cierto borramiento de la interfaz. Carlos Scolari revisa ciertas teorizaciones acerca de las interfaces llamadas user-friendly (“amigables para el usuario”), y señala justamente cómo el efecto de borramiento de la interfaz ha sido ponderado en forma positiva en una parte de la literatura especializada:

El verdadero problema con la interfaz –escribe Donald Norman […]– es que “se trata de una interfaz […]. Yo no quiero focalizar mi atención en la interfaz, yo quiero concentrarme en mi trabajo”. Toda la filosofía del llamado Diseño Centrado en el Usuario (User-Centered Design) […] gira alrededor de esta idea: para que el usuario pueda concentrarse en su trabajo hay que eliminar la máquina y hacer desaparecer la interfaz (Scolari, 2004: 24).[51]

De hecho, señala Maté, es habitual encontrar un tono fuertemente prescriptivo en los textos del game design cuando se refieren a la cuestión de la transparencia: “Se privilegian y hasta se alienta la producción de interfaces que borren sus propias huellas hasta ‘desaparecer’” (Maté, 2016: 98).

¿Puede pensarse que este efecto de transparencia estaría en tensión con la cámara siempre subjetiva de la realidad virtual? Nos preguntamos esto porque la cámara subjetiva fue indicada históricamente como una instancia de enunciación marcada en el lenguaje cinematográfico: en ella, esa “ventana que mira al mundo” con sus efectos de transparencia se suspendía para situarnos en los ojos de uno de los personajes; ese cambio de punto de vista señalaba al mismo tiempo que el texto estaba enunciado. En la medida en que siempre proponen una mirada inmersiva desde una “cámara” situada en el interior de las escenas (sea una cámara real, en la imagen de video, o una “posición de cámara” de síntesis, en la imagen generada por computadora), podría decirse que, en la realidad virtual, todas las cámaras son del tipo “subjetivo”. Así lo señala Márquez (2015: 206): “Si por algo se caracterizan los sistemas de RV es por su visión en primera persona, con el efecto cinematográfico de la cámara subjetiva en movimiento”.

Sin embargo, no todos los autores coinciden en caracterizar la visión de la realidad virtual como la de una cámara subjetiva. Según sostienen algunos de ellos, entre los que se encuentra Kelly (2016), por su carácter inmersivo, la visión que se tiene en RV no debe ser considerada de primera persona, sino una vista de “tú-persona” (“you person” view); lo argumenta diciendo que lo que tiene lugar allí es más una posición de sentir que de observar. ¿A qué se refiere con esto? De algún modo, podríamos pensar que Kelly y otros autores están señalando que la llamada “cámara subjetiva” implica pensar la intermediación de la pantalla, mientras que el efecto de borramiento de la pantalla del que ya hemos dado cuenta genera en este tipo de visión una sensación de presencia mucho mayor.[52]

Lo que se discute aquí es en qué medida el efecto de desaparición de la pantalla implica también un efecto complementario de desaparición de la cámara. Dicho de otro modo: ¿estamos ante una omnipresencia de la cámara subjetiva, o ante un borramiento de la cámara? Si la cámara se hace visible a través de la definición de un encuadre, una cierta distancia, unos ciertos movimientos y un cierto tipo de visión (atribuible a la lente), aquí el encuadre se pierde: queda de él solo la posición, que es uno de sus atributos. Dicho de otro modo, la “cámara” de la realidad virtual tiene en cada instante unas coordenadas, pero no un punto de vista, que implica una determinada direccionalidad de la mirada. Sin ignorar que los videos de realidad virtual han sido hechos seguramente con el empleo de cámaras, no encontramos en las imágenes de RV un encuadre determinado. El encuadre era –hasta el advenimiento de los videos 360º y las imágenes de realidad virtual– una marca necesariamente presente cuando existía una imagen generada por cámaras. La expresión “puesta de cámaras” se cristalizó con tanta estabilidad para los productos audiovisuales que incluso es empleada hasta el día de hoy para referirse al punto de vista de imágenes que no son de registro, como varios tipos de animación. Atendiendo a esto, podríamos decir entonces que no hay en la realidad virtual una “cámara subjetiva” como se observa en el cine, puesto que no hay definición de una direccionalidad de la mirada, sino solo una posición. Esta particularidad de las imágenes de RV, más las ya señaladas referentes al cambio que se produce en ellas con el movimiento del sujeto espectador, hacen que la cámara subjetiva no sea en estas imágenes un efecto de enunciación marcada, sino, por el contrario, uno de los principios constitutivos de su transparencia. El efecto de trompe-l’œil que señalamos anteriormente se vincula con este mismo efecto de transparencia: las cosas simplemente están allí, los sucesos transcurren y nosotros los observamos.

¿No hay, entonces, efectos de enunciación marcada? En el plano de la imagen, uno de estos efectos tiene lugar cuando se produce el desplazamiento de la posición de la cámara. Decimos “de la posición” en la medida en que, como lo señalamos, no hay “puesta de cámara” en el sentido tradicional: desde cada posición, la visión es 360º. En ese sentido, estos desplazamientos no son equivalentes a un travelling cinematográfico. En los primeros tramos de la experiencia “U2 – Song For Someone”,[53] en la que vemos a los músicos de esa conocida banda tocar desde una posición única, podemos girar la cabeza y ver a nuestro alrededor, pero siempre desde un mismo lugar, en el que se nos propone que “estamos situados” dentro de esa experiencia. En estos casos, la quietud de la cámara coincide con la del usuario de RV, que efectivamente permanece en el mismo sitio sin desplazarse mientras mira el video. El no desplazamiento colabora con un mayor efecto de transparencia. Cuando, en cambio, vemos una experiencia grabada con una cámara desde una montaña rusa,[54] la posición de esa cámara se mueve a gran velocidad. Podemos elevar la vista y ver el cielo, o voltearnos y observar los rostros de las personas que se encuentran en los asientos traseros emocionadas por el vértigo: mientras que la direccionalidad de la mirada la decidimos nosotros, su posición varía a la misma velocidad a la que se mueve el vagón de la atracción electromecánica. La sensación visual de desplazamiento, junto con la quietud física efectivamente experimentada –con la que contrasta–, vuelven más marcada la enunciación: la ausencia de sensaciones corporales de movimiento señala la imagen como tal.

En ese sentido, podemos discutir algunos señalamientos realizados por Manovich en relación con la imagen de realidad virtual. Este autor señala que, en cada momento, en la realidad virtual se tiene una visión parcial de un espacio más amplio y, “como en el cine, la cámara virtual va de un sitio a otro para revelar diferentes partes de dicho espacio” (Manovich, 2001[2006b]: 132). En efecto, por contraposición a la fotografía o el cine, que muestran un único encuadre, los videos 360º y la realidad virtual permiten conocer distintas partes de un espacio. Sin embargo, en RV esto no ocurre “como en el cine”, tal como lo señala el autor: en el cine los movimientos de la cámara vienen dados por el film, y es su enunciación la que definirá qué partes de ese espacio son dadas a ver y cuáles no en cada momento; en cambio, en la RV, como el mismo Manovich dice, “la cámara la controla el usuario” (Manovich, 2001[2006b]: 133). Las imágenes de realidad virtual son entonces una secuencia puesta en disponibilidad sobre la cual la visión queda determinada, por contraposición al cine, por el usuario.

El hecho de que el montaje o la edición se resuelvan del lado del consumo es una novedad que diferencia las experiencias de realidad virtual de las narrativas audiovisuales de los medios tradicionales como el cine o la televisión.[55] En términos de la enunciación, las experiencias de RV no terminan de configurar un discurso como lo conocíamos en el lenguaje cinematográfico, que implicaba una cierta operatoria de contigüidad sintagmática que incluía la selección de planos o montaje; en cambio, sí hay una cierta configuración espaciotemporal de sentido sobre la cual la selección y combinación de planos (o las formas que adquiera un extenso plano secuencia) se definirán cada vez. En ese sentido, cada visualización de una “misma” experiencia funciona con la lógica de los sinsignos peircianos.[56]

Como ya observamos, el montaje por corte directo también resulta opaco en términos enunciativos, en la medida en que produce una suerte de dislocación: se interrumpe la sensación de estar en un espacio para recordar súbitamente que se trata de una producción de imágenes.[57] Otros recursos que ya señalamos para los llamados “films en RV”, como la musicalización, también construyen las imágenes audiovisuales como textos, en la medida en que el plano auditivo aparece un elemento extradiegético.

5.11. Espectador, testigo, participante

A modo de conclusión, nos proponemos caracterizar cómo las diferencias recién señaladas entre la visión de la realidad virtual y la propia de la expectación cinematográfica tradicional construyen figuras diversas en el plano de la enunciación.[58] Como se sabe, el dispositivo cinematográfico trabaja con la figura del espectador: un sujeto en posición de quietud que se vincula con las imágenes a través de la pantalla, que es siempre una superficie ostensiblemente exterior a él, situada en un espacio mayor (la sala cinematográfica) que, aun en penumbras, es perceptible. En ese sentido, el espectador de cine está siempre en un espacio-otro con respecto a ese espacio diegético.

La desaparición de la pantalla como espacio segregado y las propiedades inmersivas (tridimensionalidad, visión en 360º, ausencia de fuera de campo) desplazan la figura del espectador, propia de distintos dispositivos en los que hay espacios diferenciados (como la pantalla cinematográfica, pero también el escenario teatral) hacia la de testigo. La figura del testigo es un resultado de la construcción del “estar allí”, como un observador privilegiado situado en el lugar y en el momento de los hechos. No se trata del mismo tipo de testificación que proponía Mario Carlón para el directo o vivo televisivo. En el caso de la televisión, como vimos, el espectador puede ser efectivamente un testigo, porque está expuesto al nunca del todo predecible devenir de los hechos, a “la previsibilidad e imprevisibilidad de la vida” (Carlón, 2004: 132). Testigo mediado, pues observa los hechos a través de una pantalla, pero contemporáneo a ellos: el dispositivo instaura en ese caso una coalescencia temporal efectiva. En la realidad virtual, hay un efecto de estar en lugar de los hechos derivado del efecto de no pantalla. En este caso, sin embargo, la temporalidad es diferida: estrictamente, no estamos siendo “testigos” en términos de ser contemporáneos de los hechos: asistimos a una suerte de grabado, en el que los acontecimientos efectivos o bien ya han tenido lugar (en registros de video no ficcional), o bien son construcciones ficcionales:[59] se trata entonces de un efecto de coalescencia espacial. En el caso de los textos ficcionales, hay en la experiencia algo del orden de lo performático: los acontecimientos de esa historia transcurren y, como en muchas performances, no hay distinción entre espacio escénico y espectatorial: el observador está ubicado en la escena. Sin embargo, el efecto de “estar allí” termina por generar también un efecto de estar en ese momento: a esto se refiere Diego Levis cuando, citando a la autora Estrella de Diego, señala que, a los espacios simulados de la realidad virtual, se entra “no sólo a estar allí sino entonces” (Levis, 2014: 200):[60] el efecto es el de trasladarse tanto en el espacio como en el tiempo.[61] La construcción de la figura del testigo en la realidad virtual reposa entonces fundamentalmente en el efecto de “no mediación”, de “presencia directa” que genera el dispositivo.

La figura recién vista del testigo no es tan lejana de la del espectador como parece: si bien no encuentra espacios segregados, al igual que en el cine, ve transcurrir una historia en la que no puede intervenir; en ese sentido, no es un testigo que testimonie; su presencia no da cuenta de nada en relación con los hechos. Esto cambia radicalmente en el caso de los videojuegos,[62] en los que la propuesta lúdica cobra relevancia por sobre el relato, y la inmersión se construye fuertemente por las posibilidades de interacción:[63] en ellos, la figura no es la del espectador ni la del testigo, sino la del participante o jugador.[64] Como se ve, estamos aquí enfatizando el sentido de intervención al hablar de participación: si bien coloquialmente se puede hablar de “participar en una experiencia de realidad virtual”, lo cierto es que nada en esa historia se modificará por lo que haga el usuario que la experimente; por ello, hablamos más de un testigo que de un participante. Se trata, sin embargo, de un testigo que, al decidir qué ver con su mirada, trae a la pantalla unas imágenes y no otras. En ese sentido, se puede decir que guarda con ellas una relación de activación: las imágenes solo se vuelven visibles cuando él decide mirarlas.[65] En las imágenes de videojuegos, la construcción del participante suele figurarse visualmente, a través del ya mencionado avatar, mientras que el testigo de las experiencias de realidad virtual no aparece representado en ella: se construye en las perspectivas y sus variaciones.

La construcción de la figura del participante implica habitualmente la ejecución de algún acto físico (mediante botones, pads, o incluso mediante el movimiento efectivo del cuerpo, registrado por sensores hápticos); se trata de acciones que pueden generar, en términos de Aarseth, una modificación del texto: es lo que ese autor había denominado “cibertexto”. Retomando entonces lo señalado por Aarseth, se puede pensar que las propiedades específicamente cibertextuales, en las que las intervenciones producen cambios en el devenir de la historia figurada en la diégesis –como en los videojuegos–, tienden a construir una figura de participante, mientras que el tipo de interacción que se da en las experiencias de realidad virtual –en las que solo se modifica el plano del discurso (pero no el de la historia)– tiende a construir la figura del testigo.

5.12. ¿Hacia dónde va la realidad virtual?

En su artículo “Hipervisión”, Kevin Kelly repasa el estadio de las técnicas de realidad virtual y menciona distintos desarrollos tecnológicos que se vinculan con ella de diversos modos. En este último apartado del capítulo, nos proponemos simplemente repasarlos y ordenarlos, a modo de presentación, con el solo objetivo de reflexionar acerca de los derroteros que ha seguido la realidad virtual, y de los que podría seguir en un futuro. El lector interesado podrá consultar bibliografía específica sobre cada uno de estos ítems, que, además, se encuentran en permanente cambio y evolución.

5.12.1. Las tres “realidades”

Kelly recapitula dos tipos de “realidades” más que forman sistema con la realidad virtual: la realidad aumentada y la realidad mixta.

En la realidad virtual, dice este autor, el usuario está en un espacio completamente diferente de aquel en el que se encuentra. “Sea que ese espacio es generado por computadora o registrado en video, toma totalmente el campo de visión del usuario, que no percibe con la vista su ambiente natural” (Kelly, 2016), resume, en coincidencia con las observaciones que ya hemos realizado a lo largo de este capítulo.

En la realidad aumentada, en cambio, se trabaja con dispositivos que combinan al mismo tiempo la visión exterior con agregados sobreimpresos en la imagen: “Al mundo natural visible se le superpone una capa de contenido digital que funciona como interfaz”, dice este autor.[66] Algunos ejemplos que cita Kelly de tecnologías que trabajan con este tipo de “realidad” son los anteojos Google Glass o la función Monocle de la aplicación de Yelp en dispositivos móviles. De hecho, algunos trabajos hablan de una “decadencia” de la realidad virtual, que sería desplazada por la realidad aumentada.[67] La “realidad aumentada” no es patrimonio exclusivo de lentes especiales: se denomina también de este modo a los efectos de sobreimpresión que se generan con esta tecnología cuando son visibles en una pantalla. Dado que habitualmente la sobreimpresión se produce al mismo tiempo que la imagen se registra, se trata por lo general de pantallas situadas en dispositivos técnicos que tienen también cámara incorporada, como los smartphones o las tabletas. De hecho, muchos de los efectos que vimos en el caso de las “lentes” de Snapchat en el capítulo 3 funcionan con una tecnología de este tipo: sobre la imagen de registro en video, se añaden –en el mismo momento del registro– elementos sobreimpresos que la modifican. El empleo de este tipo de recursos (extendido también a otras redes, como Instagram) es probablemente una de las prácticas de generación de imágenes de realidad aumentada más extendidas en la cotidianidad.

Finalmente, en las tecnologías de realidad mixta, los objetos virtuales se integran en el mundo natural y responden a él: una pelota virtual que rodara imaginariamente por el suelo hasta terminar debajo de una mesa real dejaría de ser visible, porque la mesa se interpondría en el trayecto de la mirada, tal como ocurriría con una pelota real. En este tipo de “realidad”, los anteojos que se emplean son semitransparentes, por lo que el usuario puede percibir el entorno real que lo rodea. Sobre él se integran imágenes de elementos o personajes, o incluso pueden quitarse paredes y transformarse en un ventanal abierto a una pradera. Peter Jackson, de la empresa de efectos especiales Weta Workshop, lo explica de este modo: “La realidad mixta no te saca de este mundo; en cambio, añade elementos a nuestro mundo real” (citado en Kelly, 2016).

5.12.2. Sensores, interacción y movimiento

Como adelantamos, existen dispositivos que funcionan como guantes o sensores táctiles que permiten interactuar sea con elementos presentes en los escenarios de la realidad virtual, sea con objetos del mundo real que aparecen con equivalentes construidos en la realidad virtual, lo que puede dar una sensación más vívida y realmente “mixta”. Estos guantes son usados en múltiples juegos de realidad virtual, en los que el usuario puede interactuar con objetos que aparecen en la imagen empleando sus manos. En estos casos, las “manos virtuales” son visibles en la imagen (a veces solas, a veces como parte de un avatar que se ve habitualmente de espaldas).

Además de estos guantes, existen también tecnologías que permiten recorrer los espacios virtuales caminando efectivamente en los espacios reales; la técnica llamada “de redireccionamiento de la marcha” (redirected walking) hace que se pueda tener la sensación de recorrer distancias o espacios mucho más dilatados que los reales. Gracias a un sistema de reajustes mínimos, imperceptibles para el usuario, se logra que, moviéndose en un espacio acotado, el usuario experimente la sensación de estar recorriendo grandes distancias en el mundo virtual. Para ello, se acondicionan especialmente ambientes que puedan ser recorridos con los anteojos puestos (dado que el usuario sigue sin poder ver efectivamente el entorno físico que lo rodea). Este tipo de producciones se aleja en múltiples aspectos de las “experiencias” de realidad virtual descriptas en este capítulo, tanto en los modos de interacción habilitados, como en los aspectos referentes a la permanencia o alteración de la historia construida. Los sensores también pueden emplearse en experiencias de realidad mixta empleando gafas semitransparentes, y entonces la interacción se complejiza aún más, porque en la visión se combinarán objetos físicos efectivamente existentes con otros añadidos por la técnica en la imagen.

5.12.3. La desaparición de los píxeles

La mayor parte de los cascos de realidad virtual, que emplean como pantalla los actuales teléfonos inteligentes, muestran imágenes en las cuales es visible el pixelado. La discontinuidad de esta materia significante vuelve ostensible su cualidad de imagen, neutralizando de algún modo los efectos realistas que consigue el dispositivo con su visión tridimensional que ocupa la totalidad del campo de visión y con la desaparición perceptual de los tiempos de latencia en los ajustes de la imagen con el movimiento. El aumento de la resolución de la imagen hasta un punto en el cual los píxeles no sean humanamente perceptibles constituiría un nuevo estadio del trompe-l’œil en el mundo de las tecnologías de realidad virtual. Kelly se entusiasma con ese futuro de indistinción perceptual:

Dentro de dos décadas, cuando se mire a través de una pantalla de realidad virtual, el ojo será engañado, y se tendrá la sensación de estar mirando a través de una ventana verdadera en un mundo real. Será tan brillante y fresco como lo que se ve por una ventana (Kelly, 2016).

5.12.4. El carácter social

Kelly también señala el carácter social de las experiencias de realidad virtual como uno de los aspectos que seguramente marquen su desarrollo, hasta volverlo un medio más social que lo que hoy se conoce como “redes sociales”. En las experiencias de realidad virtual compartidas, el usuario se vincula con otros que también están conectados, y que pueden tener la forma de un avatar. Kelly cuenta que tecnologías como la observada en el Oculus de Facebook logran generar avatares que incluso reproducen la gestualidad de aquellas personas a las que representan en entornos virtuales.[68]

5.12.5. ¿Hacia la desaparición de las pantallas domésticas?

Cerramos este capítulo dando cuenta de algunos desarrollos que parecen señalar perspectivas en las que las pantallas domésticas serían reemplazadas por dispositivos que se llevan sobre el cuerpo (conocidos en inglés como wearables). Kelly indica que uno de los objetivos de Microsoft con sus anteojos Hololens es justamente reemplazar las diversas pantallas que se encuentran en una oficina típica. Así, se podrían hacer reuniones en salas virtuales 3D entre compañeros de trabajo situados en espacios distantes, tal como sugieren los desarrolladores de este producto en sus videos de demostración. De expandirse, imagina Kelly, estos anteojos podrían terminar sustituyendo a las pequeñas pantallas con las que interactuamos cotidianamente:

No es descabellado imaginar que tales anteojos reemplazarán algún día las pequeñas pantallas que todos llevamos en nuestros bolsillos. En otras palabras, esta es una tecnología que puede al mismo tiempo reemplazar a las computadoras de escritorio, las laptops y los teléfonos celulares (Kelly, 2016).

Bibliografía del capítulo 5

Aarseth, Espen J. (1997). Cybertext. Perspectives on Ergodic Literature, Londres/Baltimore, The Johns Hopkins University Press.

Barthes, Roland (1989). La cámara lúcida. Nota sobre la fotografía, Barcelona, Paidós. Edición original: 1980. La chambre claire. Note sur la photographie, París, Cahiers du Cinéma/Gallimard/Seuil. Traducción de Joaquim Sala-Sanahuja.

Bailblé, Claude (2015). “El dispositivo cine 3D”, en revista deSignis, n.º 23, enero-junio de 2015, 17-27, FELS-UNR Editora. Traducción del francés de Víctor Fajnzylber.

Bastida de la Calle, Ma. Dolores (2001). “El Panorama: una manifestación artística marginal del siglo XIX”, en revista Espacio Tiempo y Forma, Serie VII, Historia del Arte, n.º 14, 205-217. Disponible en bit.ly/3kwg6Q2 [consulta: 20/8/2018].

Carlón, Mario (2004). Sobre lo televisivo. Dispositivos, discursos y sujetos, Buenos Aires, La Crujía Ediciones.

Cuesta González, Andrés (2018). “Carlos A. Scolari – Las leyes de la interfaz” (reseña bibliográfica), en Austral Comunicación, Vol. 7, n.º 1, 153-155, Buenos Aires. Disponible en bit.ly/31GrhOQ [consulta: 7/4/2019].

Gifreu-Castells, Arnau (2016). “Inmersión en narrativas interactivas y transmedia”, en Irigiaray, Fernando y Renó, Denis (comps.) (2016). Transmediaciones. Creatividad, innovación y estrategias en nuevas narrativas, Buenos Aires, La Crujía Ediciones.

Jenkins, Henry (2004). “Game Design as Narrative Architecture”, en Wardrip-Fruin, Noah y Harrigan, Pat (comps.). First Person: New Media as Story, Performance, and Game, Cambridge, MIT Press, pp. 118-130.

Juul, Jesper (2011). “Introduction”, en Half-real. Cambridge (Massachusetts) y Londres (Inglaterra), The MIT Press. Disponible en bit.ly/2HBmas0 [consulta: 7/6/2017].

Kelly, Kevin (2016). “Hyper Vision”, en revista Wired, abril de 2016 (versión digital). Disponible en bit.ly/3mloHWc [consulta: 10/7/2017].

Lakoff, George y Johnson, Mark (2007). Metáforas de la vida cotidiana, Madrid, Cátedra. Edición original: 1980. Metaphors We Live By, Chicago, University of Chicago. Traducción de Carmen González Marín.

La Valle, Steven M. (2017). Virtual Reality, Cambridge University Press. Disponible en bit.ly/35E1vM2 [consulta: 5/8/2018].

Levis, Diego (2014). La pantalla ubicua: televisores, computadoras y otras pantallas, Buenos Aires, La Crujía Ediciones.

Manovich, Lev (2006a). “The poetics of augmented space”, en Visual Communication, n.º 5. Disponible en bit.ly/3kuMhPX [consulta: 11/8/2018].

Manovich, Lev (2006b). El lenguaje de los nuevos medios de comunicación: la imagen en la era digital, Buenos Aires, Paidós. Edición original: 2001. The Language of New Media, Cambridge, Massachusetts, The MIT Press. Traducción de Òscar Fontrodona.

Márquez, Israel (2015). Una genealogía de la pantalla. Del cine al teléfono móvil, Barcelona, Anagrama.

Maté, Diego (2016). “Interfaces del videojuego: recorrido conceptual y propuesta teórica”, en revista Letra. Imagen. Sonido. L.I.S. Ciudad mediatizada, año VIII, n.º 15, 89-108, primer semestre de 2016, Buenos Aires. Disponible en bit.ly/3jvJp43 [consulta: 26/10/2020].

Metz, Christian (1973). “II. Historia/Discurso. Nota sobre dos voyeurismos”, en Metz, Chrisitian (2001). El significante imaginario. Psicoanálisis y cine, Barcelona, Paidós. Edición original: 1993. Le signifiant imaginaire, París, Christian Bourgois Éditeur. Traducción de Josep Elías.

Metz, Christian (1991). “Cuatro pasos en las nubes: sobrevuelo teórico”, en Lenonciation impersonelle ou le site du filme, París, Klincksieck.

Molina Ahumada, Ernesto Pablo (2014). “Héroes en juego: performance, mito y videojuego”. Ponencia presentada en las Segundas Jornadas de Estudios de la Performance, realizadas en la Universidad Nacional de Córdoba en octubre de 2014. Disponible en bit.ly/2TsxjOg [consulta: 13/7/2017].

Molina Ahumada, Ernesto Pablo (2015). “Lo heroico en clave digital: mito, literatura y videojuego”, en Espéculo. Revista de Estudios Literarios, n.º 54, 80-92, enero-junio de 2015, Madrid, Universidad Complutense de Madrid. Disponible en bit.ly/2HCUyT6 [consulta: 7/6/2017].

Murray, Janet H. (1999). Hamlet en la holocubierta, Barcelona, Paidós Ibérica. Edición original: 1997. Hamlet on the Holodeck, Nueva York, The Free Press. Traducción de Susana Pajares.

Peirce, Charles Sanders (1986). La ciencia de la semiótica, Buenos Aires, Nueva Visión. Edición original: Hartshorne, Charles y Weiss, Paul (comp.) (1965). Collected Papers of Charles Sanders Peirce, Cambridge-Massachusetts, Harvard University Press. Volumen II, Elements of Logic, libro II, “Speculative Grammar”, caps. 1, 2 y 3.

Perillán Torre, Luis (2015). “Evolución del concepto de 3D en los videojuegos”, en revista deSignis, n.º 23, enero-junio de 2015, FELS-UNR Editora.

Quéau, Philippe (1995). Lo virtual. Virtudes y vértigos, Barcelona, Ediciones Paidós Ibérica. Edición original: 1993. Le virtuel. Vertus et vertiges, Ceyzérieu, Éditions Champ Vallon et INA. Traducción de Patrick Ducher.

Reinhold, Stadler (2016). “The decline of virtual reality and the rise of augmented reality – a digital reshape of public spaces”, JULP Journal of Urban and Landscape Planning, n.º 1, Ion Mincu Publishing House, junio de 2016. Disponible en bit.ly/2Hz6Iwo [consulta: 15/1/2019].

Runcan, Miruna (2011). “Spectator vs. Video-gamer: Pleasures, Practices, Values”, en Runcan, Miruna y Pedestru, Mihai (eds.) (2011). Proceedings of the digital generation self-representation, urban mythology and cultural practices, Cluj-Napoca, Editura Limes, pp. 89-96.

Schaeffer, Jean-Marie (2002). ¿Por qué la ficción?, Toledo, Ediciones Lengua de Trapo. Edición original: 1999. Pourquoi la ficition?, París, Éditions du Seuil. Traducción de José Luis Sánchez-Silva.

Scolari, Carlos (2004). Hacer clic, Barcelona, Gedisa.

Scolari, Carlos (2018). Las leyes de la interfaz, Barcelona, Gedisa.

Sibilia, Paula (2009). El hombre postorgánico, Buenos Aires, Fondo de Cultura Económica. Edición original: 2005.

Soto, Marita (2014). La puesta en escena de todos los días. Prácticas estéticas de la vida cotidiana, Buenos Aires, Eudeba.

Verón, Eliseo (1999). Esto no es un libro, Barcelona, Gedisa.

Zelcer, Mariano (2006). “Nuevos sitios web: variaciones en las instancias productivas”. Trabajo presentado en las X Jornadas Nacionales de Investigadores en Comunicación, organizadas por la Red Nacional de Investigadores en Comunicación, ciudad de San Juan, provincia de San Juan, Argentina.

Zelcer, Mariano (2007). “Juegos interactivos en sitios web: una aproximación”. Ponencia presentada en la VI Bienal Iberoamericana de Comunicación, realizada del 26 al 28 de septiembre en la ciudad de Córdoba, provincia de Córdoba, Argentina.

Zelcer, Mariano (2014). “Interfaces intuitivas en dispositivos móviles de pantalla táctil”, en revista Faz, n.º 6. Disponible en bit.ly/37Gvqpx [consulta: 16/7/2017].

Zelcer, Mariano (2018). “Pantalla, imágenes y cámara en la realidad virtual: una aproximación”, en revista Imagofagia, n.º 18, 322-343, octubre de 2018. Disponible en bit.ly/3j7p2K4 [consulta: 15/1/2019].

Zelcer, Mariano (2019). “Realidad virtual: algunas observaciones acerca de sus pantallas”, en revista Hypertext.net, n.º 18, 23-34, mayo de 2019. Disponible en bit.ly/37fmDuH [consulta: 17/10/2020].


  1. Una selección de este capítulo fue publicada en Zelcer (2018). Además, un adelanto parcial fue presentado como ponencia bajo el título “Dispositivos de realidad virtual: acerca de la ‘desaparición de la pantalla’” en el III Congreso Internacional de la Asociación Argentina de Humanidades Digitales “La cultura de los datos” organizado por la Asociación Argentina de Humanidades Digitales, realizado en la Universidad Nacional de Rosario entre el 7 y el 9 de noviembre de 2018. Finalmente, otra selección fue publicada en Zelcer (2019).
  2. El Panorama Museum de la ciudad de Bad Frankenhausen, Alemania, posee varias pinturas de este tipo, en particular del artista Werner Tübke. En el sitio web del museo, se pueden apreciar algunas de ellas. Ver bit.ly/35bm16t [consulta: 18/2/2020].
  3. Sobre los HMD, consultar Spitzer, Cary et al. (2017). Digital Avionics Handbook (tercera edición), Boca Ratón, CRC Press.
  4. Estas referencias fueron extraídas de Manovich (2001[2006]: 155). El libro citado por Manovich es Rheingold, Howard (1992). Virtual Reality, Nueva York, Simon & Schuster.
  5. En todas las citas de Kelly presentes en este capítulo, la traducción es nuestra.
  6. Un antecedente más osado aún, anterior incluso a la pintura de caballete, lo constituyen los murales pompeyanos realizados entre los siglos I a. C y I d. C. En varios de ellos, la totalidad del muro era ocupada por una pintura en la que estaban figuradas tanto las aberturas (ventanas, marcos, columnas), como las vistas del paisaje exterior. Aun sin que hubiera marco, se trata de un lejano ejercicio en el que, al decir de Soto, ya se trabajaba metafóricamente la superficie de los muros.
  7. El autor describe también otros tipos de pantalla, como la pantalla en tiempo real (como la del radar, o la televisión en vivo), y la pantalla en tiempo real interactiva, con los dispositivos táctiles.
  8. La cita corresponde a Barthes, Roland (1977). “Diderot, Brecht, Eisenstein”, en Image/Music/Text, Nueva York, Farrar, Straus and Giroux, pp. 69-70. Citado en Manovich (2001[2006b]: 156).
  9. Bailblé toma la denominación de “2,5 D” de Marr, David (1982). Vision, San Francisco, W. H. Freeman & Co.
  10. Como veremos más adelante, existen experiencias en las cuales se prevé el movimiento del usuario, en espacios acondicionados para tal fin.
  11. La traducción es nuestra.
  12. La traducción es nuestra.
  13. Un ejemplo de este tipo de producciones lo constituye “The displaced”, un documental realizado en video de realidad virtual por el diario New York Times en 2015. Puede verse en el formato de video 360º en bit.ly/3k5VFcq [consulta: 11/8/2018].
  14. Nos ocuparemos de discutir los modos en que funciona esta particular “cámara subjetiva” más adelante en este mismo capítulo.
  15. Manovich elabora estas reflexiones retomando a su vez proposiciones de críticos y cineastas de los años 20 del siglo pasado, entre los que debe citarse Dziga Vertov.
  16. Desde luego, el empleo de pantallas de distinto tipo está muy extendido en las representaciones en vivo; sin embargo, no es eso lo que las define. Acerca de algunos casos y modos de articulación posible del empleo de pantallas en representaciones teatrales, se puede consultar Klaic, Dragan (2005). “El teatro mix media: simultaneidad y secuencialidad”, en Assaig de teatre, n.º 47, revista de l’Associació d’Investigació i Experimentació Teatral, Universitat de Barcelona, Barcelona. Disponible en bit.ly/3jaN47d [consulta: 11/7/2017].
  17. Nos referiremos a estas posibilidades de interacción más adelante.
  18. Estamos empleando aquí la clasificación de Peirce, ya presentada en el capítulo 1, que distingue los índices genuinos, que guardan relación empírica con sus objetos, de los degenerados, que solo los señalan. Recordamos la definición de este autor: “Un Índice […] es un Representamen cuyo carácter Representativo consiste en ser un segundo individual. Si la Segundidad es una relación existencial, el Índice es genuino. Si la Segundidad es una referencia, el Índice es degenerado” (Peirce, 1965[1986]: 49). Así, el clásico ejemplo del humo como signo del fuego sería un caso de índice genuino, puesto que el humo emana de él (relación existencial), mientras que un letrero junto a una puerta que la señala como salida de un ambiente sería degenerado (comparten una experiencia en términos de proximidad, pero ese cartel podría existir sin la puerta, cosa que no podría ocurrir con el humo en relación con el fuego).
  19. Dice el autor al respecto: “Ya no se trata de representaciones propiamente dichas, sino más bien de simulaciones. Las imágenes tridimensionales ‘virtuales’ no son representaciones analógicas de una realidad ya existente, sino simulaciones numéricas de realidades nuevas” (Quéau, 1993[1995]: 19).
  20. Ver bit.ly/2H6hXg5 [consulta: 14/7/2017]. Se puede ver uno de los videos en 360º en bit.ly/3kcvXmM [consulta: 14/7/2017].
  21. Algunos autores, de hecho, ya imaginan cómo combinar tecnologías existentes para realizar turismo a la distancia empleando realidad virtual, comandando con sensores hápticos un robot a la distancia que recorra los espacios que se desea visitar. Ver bit.ly/349Hu0u [consulta: 14/7/2017].
  22. Enseguida precisaremos en qué sentido empleamos el término “intervención” aquí.
  23. Se puede ver, por ejemplo, “Kakamora Orchestra” una experiencia de realidad virtual de Disney Movies VR para Oculus que es ostensiblemente no indicial. Ver ocul.us/3lVadMC [consulta: 14/7/2017].
  24. Como se ve en la experiencia “Jurassic World: Apatosaurus” de Oculus. Ver bit.ly/2UUJjsO [consulta: 16/7/2017].
  25. Esta experiencia está disponible en la aplicación de realidad virtual Within. Ver bit.ly/2H6etu3 [consulta: 12/7/2017].
  26. Deberíamos sumar a esta enumeración también las distintas técnicas de generación y proyección de hologramas, que permiten generar imágenes en tres dimensiones tanto estáticas como en movimiento; no nos detendremos en ellas, dado que mantenemos nuestra indagación acotada a distintos tipos de dispositivos que trabajan con pantallas.
  27. Al respecto, obsérvese, por ejemplo, el trabajo del sonido en el documental “Valen’s Reef”, dentro de la aplicación de realidad virtual Within: bit.ly/3dH3N0v [consulta: 12/7/2017].
  28. A menos que haya componentes de interacción o que se trate de un videojuego que emplea la realidad virtual. Nos ocuparemos de esto enseguida. Estamos empleando las categorías de historia y discurso en el sentido en que lo hace Todorov. Ver Todorov, Tzvetan (1999). “Las categorías del análisis literario”, en AA. VV. Análisis estructural del relato, Ciudad de México, Ediciones Coyacán. Edición original: 1966. En revista Communications, n.º 8, “L’analyse structurale du récit”.
  29. En algunos casos, la experiencia ingresa en una suerte de bucle o loop, como en el caso de “Kakamora Orchestra” de Disney Movies VR, en Oculus. Ver ocul.us/3lVadMC [consulta: 26/10/2020].
  30. Como veremos a continuación, esta marca no está siempre presente: es más habitual en las “experiencias” que en otros productos que emplean las imágenes de realidad virtual. Por ejemplo, en los juegos basados sobre RV (en los que habitualmente se emplea algún dispositivo adicional, que funciona como sensor háptico), es habitual ver la figura del avatar de espaldas, así como también el movimiento de sus brazos, que es controlable por el usuario. Desarrollaremos esto enseguida.
  31. El autor está citando a Slater, Mel (2009). “Place Illusion and Plausability Can Lead to Realistic Behaviour in Immersive Virtual Environments”, en Philosophical Transactions of the Royal Society, 364.
  32. Existe, además, un área de intersección relevante: los videojuegos que trabajan con imágenes de realidad virtual. Diremos algunas palabras sobre ellos más adelante.
  33. Véanse, por ejemplo, el documental “Notes to my father”, de My Choices Foundation, con dirección de Jayisha Patel en Oculus Video: ocul.us/3jr4MDh [consulta: 13/7/2017].
  34. En todas las citas textuales de Aarseth que se encuentran en este capítulo, la traducción es nuestra.
  35. Molina Ahumada señala que el término original en inglés correspondiente al traducido “actuación” es agency, es decir, “agencia” o “agenciamiento”. El término empleado en la versión inglesa subraya “que es la acción ejercida y la propia posibilidad del sistema programado de la narración quienes confieren su condición de agente al lector/jugador/receptor”, dice Molina, y concluye: “La traducción como ‘actuación’ opaca este efecto del texto sobre el receptor, reconduciendo la interpretación hacia una idea teatral del proceso” (Molina, 2015: 86).
  36. Con algunas excepciones, como veremos enseguida.
  37. La indagación podría continuar un paso más, para preguntarse por el tipo de cibertexto que constituyen las experiencias de realidad virtual. Sin embargo, esa pregunta encontrará una respuesta diferente cada vez, puesto que las variables que permiten caracterizar el tipo de cibertexto del que se trata en cada caso, como su transitoriedad (Aarseth, 1997: 63) o no, dependerán de las estructuras y dinámicas en las que se inserta la imagen de RV en cada texto en particular.
  38. Esto siempre que nos restrinjamos al tipo de experiencia de realidad virtual al que nos estamos refiriendo, que se observa con unos anteojos o cascos, sin ningún otro dispositivo técnico. Como veremos al final del capítulo, existen ya otros dispositivos adicionales que permiten tener una experiencia táctil, junto con propuestas de VR pensadas para que el usuario se desplace efectivamente dentro de un espacio, teniendo un grado de interacción con los objetos (reales o virtuales del espacio) mucho mayor; en estas experiencias, el avatar del usuario también aparece figurado.
  39. Como veremos luego, lo que en verdad está desdibujado es la idea de cámara (en particular, la de puesta de cámara).
  40. Esta caracterización de la inmersión tiene puntos de contacto con la inmersión ficcional, que Schaeffer caracteriza fenomenológicamente a partir de cuatro puntos: “[1] La inversión de las relaciones jerárquicas entre percepción […] intramundana y actividad imaginativa,[…] [2] la coexistencia de dos mundos, el del entorno real y el del universo imaginado (aunque sea imaginado a través de actos perceptivos), cada uno con sus propias referencias […] [3] La inmersión ficcional es una actividad homeostática, es decir, que se regula a sí misma con ayuda de bucles retroactivos […] [4] Las representaciones vividas en estado de inmersión ficcional están en general saturadas desde el punto de vista afectivo” (Schaeffer, 1999[2002]: 164).
  41. El autor está citando aquí a Domínguez, Eva (2013). Periodismo inmersivo: fundamentos para una forma periodística basada en la interfaz y la acción. Tesis doctoral, Facultad de Comunicación Blanquerna, Universidad Ramón Llull.
  42. Aquí también el autor está citando a Domínguez (2013).
  43. Existen ya desde hace años dispositivos adicionales que involucran otros sentidos. Entre ellos, deben señalarse los de tipo háptico, que permiten el uso del tacto, que son empleados, por ejemplo, en los videojuegos hechos en RV. Por estar centrados en la pregunta por la pantalla, las imágenes y la cámara, los dejamos fuera de nuestras indagaciones, aunque diremos algunas palabras acerca de ellos hacia el final de este capítulo.
  44. Maté señala como elemento en común sus propiedades vinculares: “A pesar de las diferencias, la mayoría de los autores parecen coincidir en el carácter vincular de la interfaz, es decir, en su rol de articulación-mediación entre dos instancias separadas y cualitativamente distintas, y en su función informativa” (Maté, 2016: 91). Dentro del sistema clasificatorio de Maté, la definición de Manovich es típica del tipo amplio, en cuanto “supone tanto una materia discursiva como un conjunto de técnicas y sus respectivos usos” (Maté, 2016: 93). Maté señala que es habitual que los autores que suscriben a las definiciones amplias finalmente opten por definiciones restringidas cuando describen metodológicamente su abordaje analítico; el movimiento que hace Manovich en su capítulo acerca de la interfaz ilustra uno de esos casos.
  45. Decíamos en aquel trabajo: “Optamos por hablar de intuitividad, y no de intuición. La intuición sería una facultad humana puesta en juego frente a un objeto cualquiera –entre los que se puede contar un diseño digital– gracias a la cual se puede lograr la comprensión ‘instantáneamente, sin necesidad de razonamiento’, tal como la define el DRAE. En cambio, la intuitividad –una noción más semiótica, ligada a los efectos de sentido– sería una propiedad predicable de ese objeto, que consistiría en habilitar, e incluso interpelar, […] la intuición de sus usuarios” (Zelcer, 2014: 44).
  46. El fenómeno de la intuitividad que estamos señalando aquí no es del orden de lo perceptual, sino del orden de los hábitos, y está vinculado con los aprendizajes y la experiencia. Esto no quita que en los sistemas perceptuales puedan producirse, en algunas personas, ciertos desórdenes al emplear dispositivos de realidad virtual, como los cuadros de malestar conocidos como VR sickness, que han sido explicados justamente como un conflicto sensorial entre la percepción de automovimiento y las entradas (inputs) del sistema visual.
  47. El trabajo citado es Juul, Jesper (2010). A casual revolution. Reinventing games and their players, Cambridge, MIT Press.
  48. La traducción es nuestra. El artículo referido se encuentra en bit.ly/3e08aUS [Consulta: 25/10/2020].
  49. En verdad, lo que se detecta es el movimiento y la posición de la cabeza, en relación con el punto que se ve en pantalla como referencia, pero el efecto es el de detectar la direccionalidad de la mirada.
  50. La idea de “enunciación transparente”, trabajada por múltiples autores, fue resumida y discutida por Christian Metz para el caso del cine en un valioso artículo de 1991, donde la definía como “el enunciado […] sin enunciación, que se enuncia a sí mismo” (Metz, 1991: 1). Señalaba allí ese autor que el efecto de transparencia en los films es el resultado de “un régimen enunciativo, activamente fabricado por el trabajo de un significante muy ocupado en simular la ausencia” (Metz, 1991: 3). El efecto de transparencia se opone al de opacidad o enunciación marcada, en el cual el enunciado exhibe sus recursos enunciativos. Independientemente de la transparencia o de la opacidad de la enunciación, dirá Metz: “Hay siempre enunciación […] ya que lo que se dice nunca agota el hecho de que sea dicho” (Metz, 1991: 3).
  51. El mismo Scolari señala más adelante cómo esta transparencia es solo un efecto, que en verdad es el resultado del ocultamiento de los procesos de los niveles inferiores de funcionamiento informático: “[…] que la interacción con las máquinas digitales parezca transparente no quiere decir que efectivamente lo sea. Desde una perspectiva evolutiva, la aparente transparencia de las interfaces se nos presenta como la fase digital de un proceso de ocultación iniciado con la misma Revolución Industrial […] la máquina fue ocultando sus dispositivos hasta dar una imagen de sí misma de autonomía y autosuficiencia” (Scolari, 2004: 64). La similitud entre estas observaciones y las realizadas por Metz acerca del cine, resumidas en la nota anterior, es notable, y llama la atención sobre cómo los efectos de borramiento y de transparencia –allí de la enunciación, aquí de la interfaz– son el resultado de procedimientos activos, que, además, se han ido construyendo históricamente. En su libro Las leyes de la interfaz, el autor regresa sobre esta idea de la transparencia como un efecto: “Como cualquier otro lugar donde se dan procesos de construcción de sentido e interpretación, la interfaz nunca es neutral o transparente” (Scolari, 2018: 35).
  52. Según dice Kelly, existen investigaciones que han demostrado que este tipo de visión es tan intenso que es emocionalmente agotador, y, luego de un determinado tiempo –de alrededor de una hora–, los usuarios necesitan un descanso con un regreso a la visión normal, sin ningún tipo de casco delante de sus ojos.
  53. Ver bit.ly/3jvKkkR [consulta: 21/7/2017].
  54. Ver, por ejemplo, “360º attractions – Hollywood rip ride rock it Universal Orlando Resort”. El video 360º de esa experiencia puede verse en bit.ly/3juYK4A [consulta: 23/7/2017].
  55. Y que las acerca eventualmente a otros universos como el de los videojuegos, como hemos visto.
  56. Dice Peirce; “Un Sinsigno (la sílaba sin se toma para significar ‘que es una única vez’, como en las palabras inglesas single, simple, o en la latina semel, etc.) es una cosa o evento real y verdaderamente existente que es un signo” (Peirce, 1965[1986]: 29).
  57. Por esa razón, propusimos que el corte directo tiende a la construcción de films en RV, más que de experiencias.
  58. Cuando caracterizamos las figuras en el plano de la enunciación, estamos pensando en el enunciador y el destinatario, tal como los define Eliseo Verón: “El plano de la enunciación es aquél en el cual, en el discurso mismo, se construyen las posiciones del que comunica (enunciador) y de aquél a quien el acto de discurso está dirigido (destinatario) […]. Enunciador y destinatario son entidades discursivas o, si se prefiere, entidades del imaginario de la comunicación” (Verón, 1999: 95). Nuestro foco aquí está en la caracterización de la figura del destinatario.
  59. Como señalamos, existen experiencias de transmisiones de realidad virtual en vivo; en esos casos, el usuario es tan testigo de los hechos como el espectador del vivo televisivo (o aún más), en la medida en que se encuentra expuesto a lo imprevisible de la vida, y además, accede a la experiencia de forma inmersiva.
  60. Levis toma la cita entrecomillada de De Diego, Estrella (1994). “Transrrealidad: ver, oír, tocar”, en Revista de Occidente, n.º 153, 7-24, Madrid.
  61. Puede pensarse que la construcción de la figura de testigo se produce con mayor intensidad en producciones de RV realizadas con cámara de video, o que aparentan serlo, que en aquellas que resultan de imágenes ostensiblemente sintetizadas. En las primeras, la mayor semejanza perceptual con los objetos del mundo acentuaría el efecto de borramiento del dispositivo, mientras que en las segundas, incluso cuando hay un efecto de desaparición de la pantalla, las particularidades de las imágenes tienden a acentuar esos espacios como construidos.
  62. Sean o no de realidad virtual.
  63. El par relato/videojuego lo tomamos de Henry Jenkins, quien reseña la discusión entre los ludólogos, que suelen tener el foco en las mecánicas de los juegos (mechanics of gameplay), y los narratólogos, que los abordan como un caso más de medios que trabajan sobre el relato (storytelling) (ver Jenkins, 2004). El mismo Jenkins señala que este par, que nosotros tomamos aquí para reflexionar sobre la realidad virtual, excede el ámbito de los juegos: “The tension between performance (or gameplay) and exposition (or story) is far from unique to games” (Jenkins, 2004).
  64. Miruna Runcan distingue la figura del espectador de la del jugador de este modo: “[…] el espectador de la narrativa ‘tradicional’ […] de cine/teatro solo necesita concentrarse, identificar e interpretar construcciones de texto lineales, y usar algunas habilidades cognitivas generales, basadas en un horizonte de expectativas siempre ‘en progreso’. Sin embargo, la historia podría continuar –y de hecho lo hará– incluso si tal horizonte no existiera. Frente a esta condición, la experiencia del juego de computadora está basada sobre la participación activa del jugador y surge de ella: el jugador tiene que desarrollar varias series de habilidades específicas para construir la ‘historia’, que casi nunca es lineal y depende de sus acciones” (Runcan, 2011: 92; la traducción es nuestra).
  65. La noción de “activación” es de Nelson Goodman. Marita Soto la explica de este modo: “Vale la pena tener en cuenta las nociones de activación/realización de Nelson Goodman cuando incluye la iluminación como una acción clave en la puesta en funcionamiento de las obras de arte […] [Goodman] se centra en aquellas acciones y prácticas relacionadas con la publicación, la exhibición o la presentación de los hechos artísticos, entendiendo que la implementación es de importancia similar a la de la ejecución […] la noción de activación, se refiere a una activación directa, es decir a aquella acción –la de iluminar– en la exhibición de la obra de arte que la deja disponible para la situación de expectación” (Soto, 2014: 133). El artículo citado es Goodman, Nelson (1992). “L’art en action”, en Cometti, Jean Pierre, Morizot, Jacques y Pouviet, Roger (2005). Esthétique contemporaine, París, Libraire Philosophique J. Vrin.
  66. El término “aumentado” fue creado por Lev Manovich en 2006. Luego de describir en uno de sus artículos las características de estos espacios singulares que aún no tenían una denominación, este autor propuso llamarlos de ese modo: “Dado que los tipos de ambientes que mencioné en mis ejemplos no tienen aún una denominación establecida, voy a darles un nuevo nombre: un ‘espacio aumentado’ [an augmented space]. Explicaré el término con más detalle luego, pero, en pocas palabras, puede definirse como sigue: un espacio aumentado es el espacio físico sobre el cual se superpone una capa de información que cambia dinámicamente” (Manovich, 2006a: 220; la traducción es nuestra).
  67. Reinhold Stadler es uno de los autores que pondera positivamente este último tipo de “realidad”, por su capacidad de conectar y combinar las imágenes virtuales con las de la realidad física, y desarrolla cómo puede ser empleada para un mejor aprovechamiento del espacio público, para así facilitar el acceso a la información, el esparcimiento y la accesibilidad (Reinhold, 2016).
  68. Kelly lo ilustra con una experiencia personal: “Asistí a una demostración de Oculus en el campus de Facebook, de la que participó Palmer Luckey, su creador. En esa experiencia, tuve la oportunidad de estar en un patio virtual junto con él. En la vida real, Luckey es exuberante y le gusta brincar. Él gesticula con sus brazos, no sólo con sus manos, mientras habla. Ese lenguaje corporal cruzó del mundo real al de la síntesis y se hizo presente en la realidad virtual” (Kelly, 2016).


Deja un comentario