El cruce del valle misterioso

Mariano Zelcer

doi:10.55778/ts877232738

4.1. Introducción

Un conjunto de avances tecnológicos que tuvo lugar a principios del siglo XXI podría cambiar nuestra relación con las imágenes audiovisuales; si no ha comenzado ya a hacerlo. En 2011, el estudio Image Metrics logró generar una animación con una imagen de síntesis de un ser humano con una fidelidad tal que no podía distinguirse perceptualmente de un registro de video ordinario. En esta animación se ve a la actriz Emily O’Brien brindar una entrevista; sin embargo, esa entrevista nunca existió en la realidad: la imagen fue generada y animada por un sofisticado sistema informático (ver figura 4.1). Este sistema había analizado anteriormente imágenes fotográficas de la actriz, de modo tal de registrar sus rasgos con un alto nivel de detalle. Luego, el resto fue cuestión de síntesis: en la animación, sus movimientos, sus expresiones y su mirada han sido generados por computadora. En una entrevista, Pete Busch –entonces director de producción Image Metrics– afirmó que finalmente habían logrado atravesar el valle misterioso.^[2] Al hablar del “valle misterioso” (en inglés, “uncanny valley”), Busch estaba refiriéndose a una formulación del especialista en robótica japonés Masahiro Mori (1970), que Mariano Blejman reseña del siguiente modo:

La tesis del japonés Mori era que los robots provocan una sensación de repulsión en los humanos cuanto más reales son. Mientras que Arturito de La Guerra de las Galaxias era digerible básicamente por parecerse a un robot, las primeras animaciones de Terminator generaban algo de miedo y una cierta repulsión. La tesis de Mori es que existe un Valle Misterioso en la animación, una curva de “agrado” que va en ascenso pero cae abruptamente cuando el parecido se acerca cada vez más al ser humano (Blejman, 2011).

Figura 4.1. Una captura de la “falsa” entrevista a la actriz Emily O’Brien, generada por imagen de síntesis. El video completo puede verse en https://bit.ly/3k2QfyI [Consulta: 14/1/2019]. Imagen: Image Metrics.

Mori explica lo “misterioso” del valle a partir de una sensación de extrañeza que se produciría al descubrir que ciertas prótesis o robots que parecían humanos no eran tales:

Recientemente las prótesis de manos han mejorado enormemente, y ya no se pueden distinguir de una mano real a simple vista. Incluso algunas de ellas han logrado simular las venas, los músculos, tendones y uñas […]. Sin embargo […] cuando notamos que se trata efectivamente de una prótesis, una sensación de extrañeza nos invade. Si le estrechamos la mano a alguien que emplea una de estas prótesis, nos llamará la atención la falta de tejidos blandos y su baja temperatura. En este caso, ya no habrá más sensación de familiaridad: todo se volverá misterioso (Mori, 1970[2011]).^[3]

Mori realiza un gráfico en el cual coloca el parecido humano en el eje horizontal y la familiaridad en el eje vertical. La extrañeza la concibe como una forma negativa de la familiaridad; así –según su observación–, las manos protésicas se encontrarían hundidas en el valle “misterioso” (ver figura 4.2.).

Figura 4.2. Una versión simplificada del “valle misterioso”: la familiaridad aumenta con el parecido humano, pero, cuando se está próximo a alcanzar el 100 %, se produce una gran depresión: el “valle misterioso” –tomado de Blejman (2011), quien a su vez lo toma de Mori (1970)–.

En el año 1970, cuando escribió su trabajo, Mori les recomendaba a los diseñadores de prótesis humanas y de robots acercarse al valle misterioso, pero no intentar cruzarlo, puesto que había una gran probabilidad de que cayeran en él, con la consecuente generación de la impresión de rechazo y desagrado:

Esperamos diseñar robots o prótesis de manos que no caigan en el valle misterioso. Por ello, les recomiendo a los diseñadores que apunten a la primera cima como objetivo cuando estén construyendo robots, antes que a la segunda. Si bien la segunda cima es más alta, hay un riesgo muchísimo mayor [para quien trate de alcanzarla] de caer en el valle misterioso (Mori, 1970[2011]).^[4]

La presunción de Mori, como bien señala Blejman, es que, si se lograra atravesar ese valle, tal animación “perfecta” no podría distinguirse de una imagen de registro audiovisual, como la que se obtiene con una cámara cinematográfica o de video:

Atravesado ese “valle” de desagrado, entonces, el ojo humano ya no podrá notar la diferencia entre lo real y lo animado. Según estudios psicológicos posteriores, el motivo de esa sensación de desagrado de la animación digital tiene que ver con la imposibilidad de replicar la exactitud de los movimientos de los ojos de los seres humanos, y, además, provoca un cierto parecido con las personas que sufren síndrome de Down (Blejman, 2011).

El cruce del valle misterioso nos presenta por primera vez un caso en el cual cierta imagen de síntesis de la figura humana no puede distinguirse perceptualmente de la de registro audiovisual, con la que tiende a confundirse.^[5] ¿Qué implicancias semióticas tiene esto? ¿Cómo puede incidir en nuestra relación con las imágenes audiovisuales?

4.2. Primera aproximación: el estatuto semiótico

Comencemos por caracterizar semióticamente el estatuto de la imagen de síntesis que nos está ocupando. A pesar de su similitud perceptual con otros tipos de imágenes que nos son familiares (de cine, de video), es evidente que estamos ante una nueva materia de la expresión, al decir de Louis Hjelmslev (1959[1972]) o materia significante, al decir de Eliseo Verón (1974). Estas dos nociones, que ya hemos presentado en el capítulo 1, persiguen una misma preocupación: atender a la especificidad de las materias que intervienen, en cada caso, en la producción de sentido. Como se recordará, mientras que Hjelmslev –en palabras de Christian Metz– entiende la materia de la expresión como la “naturaleza física del significante” (Metz, 1974), Verón define la materia significante como aquella que ya ha sido investida por reglas constitutivas, que son del orden de las hipótesis perceptuales,^[6] y por tanto se encuentra disponible para la producción de sentido (Verón, 1974). De distintos modos, estos autores llaman la atención sobre lo inadecuado de considerar la “imagen” en forma unívoca como una materialidad sobre la cual se pudiera predicar algo, como si fuera posible hablar genéricamente de lo “visual”. En este sentido, coinciden con las observaciones que ya había realizado Cristian Metz: “En verdad, la noción de ‘visual’, en el sentido totalitario y monolítico que le otorgan algunas discusiones actuales, es una fantasía o una ideología, y la imagen (por lo menos en este sentido), es algo que no existe” (Metz, 1970[1982]: 16).

Se trata, entonces, de distinguir entre los distintos tipos de imágenes. Al decir de Raymond Bellour, un autor que se ocupa precisamente de estudiar las imágenes de síntesis, “es la diversidad de modos de ser de la imagen lo que constituye nuestro problema” (Bellour, 2008: 149). ¿Cómo caracterizar, entonces, la especificidad de esta imagen de síntesis? Volvemos una vez más a Jean-Marie Schaeffer y su libro La imagen precaria (1987). Como hemos visto, Schaeffer parte allí de un análisis y comprensión del dispositivo que crea las imágenes fotográficas para entender y caracterizar su especificidad.^[7] Siguiendo este modelo, buscaremos reconstruir el funcionamiento de los dispositivos que generan las imágenes que nos ocupan.^[8]

La técnica que da lugar a este tipo de imágenes parte de un primer momento en el cual un sistema informático analiza imágenes fotográficas o de video de la figura humana (fundamentalmente, del rostro) que luego se recreará por síntesis. Estas imágenes pueden ser previamente existentes, o pueden ser creadas específicamente para tal fin. El análisis da lugar a un procesamiento informático sofisticado, en un sistema que adquiere –de ese modo– la capacidad de generar imágenes animadas con los mismos rasgos de la figura humana que ha registrado en un principio. La generación de la imagen animada involucra usualmente el registro de un nuevo video de otra persona, de la cual se detectan todos sus movimientos y expresiones faciales. A partir de esta segunda instancia de registro, el sistema genera una animación en la cual se ve a la primera figura humana hablar, gesticular y realizar los movimientos y expresiones que realizó la segunda (ver figura 4.3.).

Figura 4.3. Generación de una imagen de síntesis del tipo que nos ocupa. En un primer momento, se han registrado los rasgos del rostro más grande, que vemos abajo a la derecha. La imagen de síntesis se genera capturando un nuevo rostro en movimiento: la imagen más pequeña, arriba a la izquierda, corresponde a un registro de video. El sistema detecta los movimientos a la perfección y genera una animación del rostro registrado inicialmente, imitando los movimientos del segundo. El video completo puede verse en bit.ly/36T70c8 [consulta: 2/9/2011]. Imagen: Image Metrics.

Si se observan las dos imágenes animadas (la que se registró en segunda instancia y la producida por síntesis), el efecto parece ser el de una máscara: vemos los gestos y movimientos de la segunda persona reproducirse con el rostro de la primera. Sin embargo, socialmente la imagen de síntesis tiene vida autónoma y no está nunca acompañada de la primera, a la que no accedemos.^[9]

La misma técnica puede emplearse para generar una imagen animada de alguien que haya fallecido. Por ejemplo, se puede generar un video de Albert Einstein hablando a cámara a partir de un nuevo registro. Desde luego, Einstein nunca se sometió a una sesión de registro para que pudiera crearse por síntesis una imagen animada suya; sin embargo, el análisis de imágenes preexistentes habilita el funcionamiento del sistema (ver figura 4.4.).

Figura 4.4. Una imagen animada de síntesis de Albert Einstein, a partir de una imagen de registro de video de otra persona. La imagen de Einstein habla y repite exactamente los mismos gestos que hace el hombre en el video de la izquierda (el video puede verse completo en bit.ly/3dkJ1no) [consulta: 2/9/2011].

¿Qué podemos decir acerca del arché, es decir, de las “modalidades de génesis” (Schaeffer, 1987[1990]: 44) de este tipo de imagen? En principio, su generación parece comprender tres etapas lógicas: una primera de análisis de imágenes anteriores, una segunda en la cual se registra una nueva imagen de video, y una tercera en la cual se genera una imagen de síntesis animada que conjuga los rasgos de las imágenes anteriores con los movimientos del registro de video realizado. Las etapas 2 y 3 pueden coincidir en el tiempo. El esquema de generación de estas imágenes se ve resumido en la figura 4.5.

Figura 4.5. Génesis de este tipo de imágenes de síntesis.

Como se hace evidente, estas imágenes no son de síntesis “pura”, si se entiende por síntesis la generación de la imagen exclusivamente por datos y modelos matemáticos. De hecho, Philippe Quéau define las imágenes de síntesis excluyendo explícitamente cualquier conexión con el mundo real:

Las imágenes de síntesis se calculan con un ordenador a partir de modelos matemáticos y de diversos datos. Se dice “sintetizar una imagen” porque toda la información necesaria para su creación, e incluso para la de una serie de imágenes animadas, está disponible en forma simbólica en la memoria del ordenador y, por lo tanto, no hace falta recurrir al mundo “real” para crearlas (Quéau, 1993[1995]: 30).

En las imágenes que nos ocupan, hay desde luego procesamiento informático –y por tanto síntesis–, pero intervienen en la generación de cada una de ellas no una, sino dos imágenes de registro: la que registra los rasgos en la primera etapa, y la que registra los movimientos en la segunda.

Para reflexionar acerca del estatuto semiótico de este tipo de imágenes, podemos partir de las observaciones que Schaeffer realiza sobre la fotografía. Recordemos brevemente las proposiciones de este autor, que ya revisamos en el primer capítulo: Schaeffer trabaja con las clasificaciones del signo de Peirce y, siguiendo la segunda tricotomía, caracteriza la imagen fotográfica como un ícono indicial. Según explica, se trata de un ícono porque guarda semejanza con lo fotografiado, al tiempo que es indicial porque posee con lo fotografiado una relación existencial: en la génesis de esa imagen, los fotones han impregnado la película fotográfica (o los sensores de la cámara digital, agregamos hoy) y “han dejado su huella” allí. La aproximación de Schaeffer puede guiarnos para abordar la imagen de síntesis que nos ocupa: ¿qué implicancias tiene el arché que acabamos de esquematizar sobre su estatuto semiótico, en términos de la segunda tricotomía peirciana? Específicamente, ¿nos encontramos aquí con un tipo de imagen que opera solo por similitud (y entonces es solamente un ícono), o hay también algún tipo de vínculo existencial (y por tanto es también indicial)? Lo que parece comenzar a perderse en el trayecto que va de la etapa 1 a la 3 de nuestro esquema –con la intervención del sistema informático que primero analiza, luego registra y finalmente sintetiza– es precisamente una conexión empírica entre las instancias. Dicho de otro modo, la imagen resultante es icónica (en dos sentidos: los rasgos se parecen a los de las primeras imágenes, los movimientos se parecen a los de la segunda), pero solo débilmente indicial. En el proceso de síntesis de la nueva imagen, la conjugación de rasgos de un origen con movimientos de otro conserva la iconicidad, pero termina por atenuar radicalmente la indicialidad: esa imagen de síntesis que vemos, con esos rasgos y esos movimientos, no tiene conexión física con una experiencia de la que sea su registro, como sí ocurriría si se tratara de una imagen de video ordinaria. Lo indicial resulta aquí marginal: solo subsiste en el hecho de que esa imagen es índice de que alguien tiene o tuvo esos rasgos (por un lado) y de que alguien en algún momento ha realizado esos movimientos (por el otro). La indicialidad atenuada se hace patente en el hecho de que, por oposición a la imagen de video, una imagen de síntesis no puede funcionar como prueba de nada.

Ahora bien: si nos situamos en el plano de la segunda tricotomía peirciana, ¿podemos pensar que estas imágenes son reconocidas predominantemente como íconos, y no como índices? En este punto, regresamos a las reflexiones de Schaeffer: el hecho de que la fotografía sea socialmente reconocida como un signo icónico-indicial, dice este autor, depende de que socialmente se conozca cómo funciona su dispositivo. Dicho de otro modo, es el saber del arché el que habilita la lectura de la imagen fotográfica como un ícono indicial. Este funcionamiento de los saberes del arché como interpretantes no es exclusividad de la fotografía: a pesar de que parezca haberse vuelto transparente, los saberes sobre la génesis de los distintos tipos de imágenes (televisiva, cinematográfica, etc.), así como también los correspondientes a otras materialidades (el sonido radiofónico, por ejemplo), están operando permanentemente en las lecturas que se realizan de los distintos textos que circulan socialmente a través de estos medios. He allí el lugar central de los metadiscursos que explican y difunden el funcionamiento de las técnicas que dan origen a las distintas materias de la expresión: operando como interpretantes, permiten el reconocimiento de un determinado texto como producido por una cierta técnica.^[10]

¿Qué ocurre, al respecto, con las imágenes de síntesis que estamos observando? En el momento de su surgimiento, la circulación de los metadiscursos acerca de esta técnica, así como también la de los textos producidos por ella, fue más bien restringida.^[11] Hoy probablemente haya algo más de conocimiento social acerca de su existencia, por lo que puede pensarse que gradualmente se están instalando socialmente interpretantes que permiten leerlas como tales. Ahora bien: por ser perceptualmente indistinguibles de las imágenes generadas con otros dispositivos de altísimo conocimiento social (como el cine, el video o la televisión), podría pensarse, como hipótesis, que probablemente serán confundidas con ellas, y, por tanto, leídas con los interpretantes que operan en sus lecturas. Dicho de otro modo, estas imágenes de síntesis pueden fácilmente ser tomadas por imágenes de cine o de video. ¿Qué implicancias tiene esto?

Los dos dispositivos mencionados se caracterizan por generar imágenes de registro; en ese sentido, funcionan como pruebas de que hay o hubo un existente en una situación similar a aquella que se ve en la imagen en movimiento. El estatuto semiótico, entonces, es de tipo icónico-indicial: no se proponen solo como similares a lo representado, sino que también guardan con ello una relación empírica. Desde luego, existen distintos funcionamientos según los diversos tipos de imagen audiovisual: en el modo canónico del cine, la narración ficcional enfatiza mucho más los funcionamientos miméticos, ergo icónicos, que los indiciales. Sin embargo, el funcionamiento indicial nunca deja de estar presente, en cuanto la imagen es registro de esos espacios, objetos y actores que estuvieron frente a la cámara. El mismo Schaeffer nos llama la atención sobre cierto consumo predominantemente indicial del cine: “Volvemos a ver Key Largo entre otras [cosas] para volver a ver a Humphrey Bogart o Lauren Bacall, luego, con una meta indicial” (Schaeffer, 1987[1990]: 49). En el otro extremo, los films documentales, así como todos los géneros no ficcionales televisivos, despliegan plenamente los funcionamientos icónico-indiciales.

En suma: imágenes que son –por su arché– predominantemente icónicas son leídas como íconos indiciales plenos. De este modo, una imagen de síntesis como la que nos ocupa podría ser leída como registro empírico de una situación que, en rigor, nunca tuvo lugar.

4.3. Segunda aproximación: la duda

El funcionamiento de los saberes del arché de las imágenes audiovisuales clásicas como interpretantes en la lectura de las imágenes de síntesis está habilitado, como vimos recién, porque estas imágenes son perceptualmente indistinguibles de las primeras. El hecho de que sean puestos en juego –o no– en cada interpretación no puede adivinarse; esto dependerá, entre otros factores, del conocimiento de la existencia de estas nuevas imágenes de síntesis y de la posesión de los interpretantes para leerlas como tales. Sin embargo, aun cuando se posean esos interpretantes, permanecerá la imposibilidad de la distinción perceptual. Y esto por una simple razón: no hay rasgos textuales perceptibles por los sentidos humanos que permitan diferenciar una imagen de síntesis (del tipo de las que estamos examinando) de una imagen de registro audiovisual. Entonces, por efecto de la historia y de una cierta habitualidad en relación con el tipo de imágenes que circulan socialmente, el riesgo de leer estas nuevas imágenes como si fueran íconos indiciales plenos estará siempre presente. Decimos que se trata de un efecto histórico porque, desde fines del siglo XIX –con la invención del cinematógrafo–, vivimos rodeados de imágenes móviles de un alto nivel de iconicidad cuya génesis es indicial, y vivimos también en sociedades que han aprendido a interpretarlas de ese modo. Los dispositivos de generación de imágenes móviles de registro, además, se han expandido con los años hasta el uso doméstico, y hoy día está al alcance de la mano de cualquier individuo la posibilidad de generar su propia grabación de video. Antes que características propias de las imágenes, puede pensarse que son estas experiencias y estos saberes los que nos hacen leer las imágenes de cine, de video o de televisión como indiciales: se trata de un efecto de la frecuentación, un hábito que termina operando como regla de lectura. Y es porque así ha sido la historia de las imágenes audiovisuales y no de otro modo por lo cual tenderemos a leer estas imágenes de síntesis como íconos indiciales plenos. La afirmación puede sonar extraña por efecto de una cierta naturalización (las imágenes cinematográficas se nos aparecen como índices evidentes), pero se hace patente cuando se realiza el razonamiento inverso: si –imaginariamente– este tipo de imagen de síntesis hubiera sido creado antes que la imagen de cine, de televisión o de video, y hubiera tenido tanta circulación como aquellas, no tenderíamos a leer estas últimas como plenamente indiciales; por tanto, no pensaríamos que hubo alguien delante de la cámara haciendo lo que vemos en la imagen: creeríamos que se trata del resultado de una síntesis.^[12]

Este riesgo de confusión basado en una indistinción perceptual, sin embargo, no es del todo novedoso: no sería la primera vez que se observa la existencia de materias de la expresión de distinto estatuto semiótico y de idéntica apariencia. La proliferación de dispositivos de generación o reproducción de imágenes o sonidos en las últimas décadas del siglo pasado y en lo que va del presente siglo ya nos ha enfrentado a situaciones similares, con las que convivimos a diario. Dos casos que nos son familiares los encontramos en la televisión (con las posibilidades del directo y el grabado) y en la circulación social de las fotografías insertas en publicaciones periódicas, que pueden estar o no “retocadas” digitalmente.

Como hemos visto en el capítulo 1, la televisión puede tener dos grandes regímenes de funcionamiento: el directo y el grabado. Decíamos allí que Mario Carlón, uno de los autores que más ha profundizado en estas dos modalidades y sus implicancias, identifica en cada uno de estos regímenes sendos dispositivos (ver Carlón, 2004: 94). Mientras que el directo presenta un dispositivo en el cual la producción y la recepción se dan en forma simultánea, el grabado genera una distancia temporal entre estas dos instancias.

En el caso de las fotografías, la expansión de las posibilidades de alteración digital (o “retoque fotográfico”), junto con los saberes acerca de estas posibilidades, ha instaurado en el horizonte de expectativas sociales la posibilidad de que una fotografía haya sido intervenida, al menos, cuando se encuentra en ciertos emplazamientos (volveremos sobre ello enseguida).

Tanto en uno como en otro caso, no es posible distinguir perceptualmente entre ambas modalidades de la imagen (sea televisiva, sea fotográfica): en su materialidad y para nuestros sentidos, una imagen de televisión registrada en directo no tiene diferencias con una grabada, y una fotografía (bien) retocada no guarda diferencias con una que no ha sido intervenida después de su generación.

¿Cómo se ha resuelto, en estos dos casos, la distinción entre un caso y el otro, es decir, entre las transmisiones en directo y las imágenes grabadas, entre las fotografías presentadas tal como resultaron en el momento de la impresión y aquellas que fueron alteradas con posterioridad? Existen fundamentalmente tres mecanismos, que reseñamos a continuación:

Paratextos. Sobreimpreso en la pantalla televisiva, leemos “En vivo”, o “Directo”: una indicación textual ancla el sentido y habilita a leer las imágenes como las de un acontecimiento que está ocurriendo simultáneamente al momento de la recepción. Por el contrario, la leyenda podría indicar “Programa emitido originalmente en X fecha”, o simplemente “Programa grabado”, para indicar que es esta su naturaleza. En el caso de las fotografías, este procedimiento suele aparecer en el caso de los fotomontajes,^[13] como un pequeño texto aclaratorio junto a las imágenes. De no estar presente, tenderemos a pensar que se trata de fotografías sin alteración.
Tematización en el propio texto. En el caso de la televisión, por tratarse de un lenguaje audiovisual, la explicitación puede encontrarse también en el mismo texto. Por ejemplo, para el caso del directo, un conductor de un ciclo televisivo puede decir la hora del momento, o directamente explicitar que el programa está siendo emitido “en vivo”. Otros procedimientos, como la posibilidad de comunicarse telefónicamente con el conductor del programa en el marco de algún concurso, también evidencian que un programa televisivo emplea esta modalidad.
Verosímil, rasgos de género, emplazamiento. El género en el que están incluidas las imágenes establece también expectativas en relación con su estatuto semiótico. En televisión, los noticieros suelen trabajar la conducción y presentación de las notas con la modalidad del directo, mientras que los programas de narración ficcional, como las telenovelas o las telecomedias –en general– no lo hacen. En casos como estos, las expectativas del género en relación con el dispositivo televisivo puesto en juego pueden hacer prescindir del anclaje verbal. En el caso de las fotografías emplazadas en medios gráficos, el género o el estilo de la publicación ya pueden definir las expectativas en relación con el tratamiento de las imágenes. Por ejemplo, por su promesa de género, no se espera que un periódico altere las fotografías, dado que deberían funcionar en él como registros informativos de una actualidad de la que busca dar cuenta; en caso de hacerlo, debería aclararlo explícitamente. En cambio, nadie se inquietaría por enterarse de que la foto de una actriz famosa publicada en una revista de actualidad ha sido alterada para quitarle algunas arrugas y hacer que aparente más joven; o por encontrar que una revista femenina ha empleado el retoque fotográfico para mejorar la apariencia del cutis de una mujer retratada en su tapa. El texto también puede hacer evidente la operación de fotomontaje y así prescindir de su explicitación verbal (esto es habitual, por ejemplo, en ciertas publicaciones humorísticas satíricas) (ver figura 4.6.).

Figura 4.6. Las primeras dos imágenes ilustran sendos casos de alteración de imágenes que involucran fotografías de la entonces presidenta argentina. En la portada del diario Página|12, se la muestra triunfante junto a una acumulación de papel picado. Se trata de un fotomontaje, y esto está explicitado en un pequeño texto al pie de la imagen fotográfica: incluso cuando esta publicación tiene un estilo reconocible en el cual sus tapas juegan muchas veces más al comentario que a la información, un periódico no debería alterar las fotos, a menos que lo aclare. En la portada de la revista humorística Barcelona, se la muestra vestida muy sensual y rodeada de dos funcionarios con el torso descubierto. La figuración de la imagen, la factura tosca del fotomontaje, el estilo y el género de la publicación bastan para hacer evidente que se trata de una imagen alterada: no es necesaria una aclaración que recurra al lenguaje verbal. En la tercera imagen, en una portada de la revista femenina Ohlalá!, se observa el retrato de una conocida actriz con el cutis “retocado”: no hay ninguna aclaración sobre esta alteración, puesto que es parte de las expectativas contemporáneas del género “revistas femeninas” que las fotos sean intervenidas de ese modo. Portadas del diario Página|12 del 15 de agosto de 2011, de la revista Barcelona del 22 de abril de 2011 y de la revista Ohlalá!, n.º 56, de noviembre de 2012.

Estos mismos procedimientos podrían emplearse, y de hecho ya se emplean, en las producciones realizadas con imagen de síntesis: mostraciones del uso de la técnica en la misma imagen y explicitaciones verbales dentro de la animación se hallan en numerosas animaciones de este tipo, sobre todo en un momento como el actual, en el cual socialmente se están expandiendo los saberes sobre esta nueva materia de la expresión y sus técnicas de producción (ver figura 4.7.).

Figura 4.7. Un rostro de síntesis animado. En el parlamento, se lo escucha decir “Ud. ve una imagen de mí; sin embargo, esta imagen nunca fue filmada; se ve como si fuera yo, pero no soy yo –y aun así, yo controlo lo que digo, y cómo lo digo, y mi apariencia”. La animación completa puede verse en bit.ly/3lAYeUc [consulta: 14/1/2019]. Imagen: Agence de Doublures Numériques (ADN).

Como se observará, a pesar de la existencia de estos tres mecanismos, en todos estos casos la dilucidación acerca del estatuto semiótico de las imágenes termina resolviéndose en el nivel de las creencias: ¿realmente creemos que ese programa que, según dice un texto sobreimpreso en pantalla, es “en vivo”, efectivamente está siendo transmitido con la modalidad del directo? ¿Tomamos por reproducciones fieles de los acontecimientos las imágenes fotográficas de un evento de política nacional que encontramos en la portada de un periódico, dado que se trata de una publicación de la que se espera una cierta objetividad informativa, y puesto que ningún texto junto a la imagen indica lo contrario? ¿Verdaderamente creemos que ese rostro que nos habla y nos dice ser solo una síntesis digital no es un registro de video ordinario? En ninguno de estos casos hay rasgos materiales que nos permitan distinguir un tipo de imagen del otro.

Los interrogantes recién enumerados rondan acerca de lo efectivo, lo verdadero, lo real: implican una pregunta por la relación de las imágenes con hechos o entidades existentes (fenómenos del orden de la segundidad, según Peirce); presuponen, en su formulación, que tienen una única respuesta correcta; es decir, que existe una verdad. Sin embargo, la coexistencia de múltiples narrativas no coincidentes acerca de la realidad –fundamentalmente en el campo de la política electoral (Vincens, 2018; Manrique, 2019),^[14] pero observable también en otras esferas de la vida social– ha dado lugar a un fenómeno conocido como “posverdad”. La posverdad implica, según Álvarez Rufs, la existencia de “diferentes versiones de la realidad que corresponden a verdades distintas que encajan de forma diversa en la propia red personal de creencias y emociones” (Álvarez Rufs, 2019: 3). Estas “versiones” de la realidad tendrían al menos dos características centrales: por un lado, no competirían ya contra la mentira, sino contra otras verdades;^[15] por el otro, cada una de estas verdades no podría ser sometida a prueba de falsación.^[16] En los funcionamientos de la posverdad, un enunciado fáctico no se aceptaría ya como válido realizando una contrastación efectiva de los dichos con los hechos, como cuando se busca una verdad a secas, puesto que la posverdad tiene lugar a través de estados mentales que configuran “ficciones basadas en las propias creencias y emociones, a fin de provocar una reacción en el escenario de la acción que desdeña la verdad” (Álvarez Rufs, 2019: 2). Si los argumentos basados en hechos objetivos no son ya tenidos en cuenta a la hora de adherir a una versión de la realidad, las preguntas que nos hacíamos recién podrían tener más de una respuesta.^[17]

¿De qué modo se puede pensar la posverdad desde una perspectiva semiótica? Coinciden múltiples autores^[18] que estudian este fenómeno en el lugar relevante que tienen en la construcción de estas distintas versiones de la realidad los medios de comunicación (dentro de los que incluyen también las redes sociales, a las que nos hemos referido en los dos capítulos anteriores). Los estudios semióticos se habían dedicado hace tiempo a estudiar la construcción de la realidad social en los medios masivos de comunicación. En nuestro ámbito, nuevamente tuvo un lugar pionero en el abordaje de esta problemática Eliseo Verón, cuando señaló, en la década de 1980, cómo lo real social se construía centralmente en los medios masivos de comunicación:

Ese objeto cultural que llamamos la actualidad –tal como nos la presenta, por ejemplo, el noticiero de un canal de televisión en un día cualquiera– tiene el mismo status que un automóvil: es un producto, un objeto fabricado que sale de esa fábrica que es un medio informativo. Los medios no “copian” nada (más o menos bien o más o menos mal): producen realidad social (Verón, 1981[1987]: III).

Como adelantamos, junto con los medios masivos tradicionales, deberíamos considerar también hoy las redes sociales de Internet, dispositivos que –por las particularidades de sus funcionamientos, alejados del modelo de la emisión centralizada– contribuyen particularmente a la coexistencia de diversas “realidades” sociales. Estas múltiples versiones de la realidad existían ya en los funcionamientos mediáticos de las sociedades que analizaba Verón en el citado texto. Proseguía en su cita: “Naturalmente, medios hay muchos (diarios, canales de televisión, radios). De modo que hay muchos ‘modelos’ de la actualidad. Como hay muchos modelos de automóviles. Los distintos ‘modelos’ de la actualidad están construidos para distintas audiencias” (Verón, 1981[1987]: III). Desde esta mirada centrada en las construcciones de sentido podemos comprender el fenómeno de las distintas “verdades” que coexisten en un mismo momento histórico.

El concepto de “posverdad” tiene, sin embargo, una vida social muy diferente de la que tuvo en su momento (y aún tiene) el de “la producción de la realidad social” trabajado por Verón. Mientras que este último estuvo siempre más o menos restringido al ámbito de la semiótica, la “posverdad” se ha expandido a una conversación social más amplia, como si se hubieran expandido también ciertos saberes semióticos acerca del carácter constructivo del sentido en los discursos sociales. Estos saberes, acompañados por una metadiscursividad permanente acerca de las posibilidades de generación y de manipulación de las imágenes contemporáneas, sugieren otra hipótesis acerca de la recepción de las imágenes que nos están ocupando en este capítulo: probablemente los saberes acerca del carácter constructivo de las imágenes estén mucho más extendidos de lo que creemos, y su estatuto semiótico sea descubierto o reconocido con más asiduidad de la que podríamos pensar.

4.4. Tercera aproximación: el engaño

La existencia de materias de la expresión de distinta naturaleza que se presentan idénticamente a la percepción habilita también la realización de engaños. Si a fin de cuentas –como decíamos recién– todo es una cuestión de creencias, un texto podría hacerse pasar por lo que no es, fingiendo su estatuto semiótico. Para ello, podría valerse, precisamente, de los tres mecanismos que repasamos en el apartado anterior. De ser así, a menos que algún texto externo (metadiscurso) desenmascare el procedimiento, la vida social del texto permanecería en el engaño. Dos casos de los medios argentinos, uno referido a la televisión y otro vinculado al retoque de fotografías digitales, ilustran cómo pueden tener lugar estos fingimientos textuales.^[19]

El caso de la televisión se produjo en 2008 en la competencia “Bailando por un sueño”, que tenía lugar en el programa ShowMatch, uno de los más vistos de la televisión argentina por aquel entonces. En esta contienda, distintas parejas de famosos danzaban coreografías de diversos géneros musicales a lo largo de las semanas. Un “jurado” en el estudio calificaba sus desempeños luego de cada número, hasta que, al final del ciclo, una pareja resultaba la ganadora y ayudaba a cumplir un “sueño” vinculado con alguna obra de bien. El viernes 8 de agosto de ese año, la modelo Karina Jelinek –una de las participantes de la competencia– tuvo un desvanecimiento momentáneo mientras bailaba su coreografía, cayó pesadamente al suelo y se golpeó con fuerza la cabeza. Un médico acudió en el estudio a auxiliarla, y, después de que la atendiera, Marcelo Tinelli, conductor del ciclo, comentó que estas eran “cosas que ocurrían en un programa en vivo”, para luego –una vez que se supo que la participante estaba fuera de peligro– agregar: “Queremos llevar tranquilidad a la familia de Karina”. Hasta allí, nada fuera de lo esperable. Sin embargo, dos días después algunos periódicos desenmascaraban el engaño:^[20] el programa no estaba siendo emitido en directo, sino que había sido grabado más de dos días antes. No solo dejaba de ser cierta la frase sobre el “vivo” que había mencionado el animador, sino que, además, el mensaje que le había enviado a la familia de la participante no tenía ningún sentido (dado que, para el momento de la emisión del programa, la familia ya tendría conocimiento de lo ocurrido), más que sostener la puesta en escena de una simulación del dispositivo. Como resultado, en el momento de la recepción, esta emisión seguramente ha sido leída por el gran público como inscripta en la modalidad del directo. Este ocultamiento del dispositivo del grabado está posibilitado justamente por lo que señalábamos anteriormente: la imposibilidad de distinguir perceptualmente una imagen televisiva grabada de una en directo. El conductor recurrió aquí a uno de los mecanismos que reseñamos para precisar el estatuto semiótico de la imagen, y lo hizo engañosamente, haciéndola pasar por una transmisión en directo. Y efectivamente, si los diarios de los días siguientes no hubieran desenmascarado la operatoria, nuestra recepción habría sido la propuesta por el texto (como seguramente siguió siéndola para quienes no leyeron esos periódicos).

El caso que involucra la fotografía tuvo lugar en el diario Perfil, publicado en la Ciudad de Buenos Aires. El día 11 de junio de 2011, ese periódico publicaba en su portada una noticia vinculada al llamado “Caso Schoklender”. Sergio Schoklender fue, durante muchos años, un apoderado de la Asociación Madres de Plaza de Mayo, conformada por madres de desaparecidos durante la última dictadura militar argentina (1976-1983). Luego de varios años de servicio, se descubrieron operaciones económicas sospechosas, que parecían indicar que Schoklender desviaba fondos para su propio beneficio. La prensa opositora al gobierno de turno buscó vincular a la titular de la Asociación Madres de Plaza de Mayo –presunta víctima de estas supuestas operaciones– con Schoklender, sugiriendo una cierta complicidad, y a ambos, a su vez, con la presidenta de la nación de ese momento, abierta defensora de las luchas por los derechos humanos en Argentina, de las cuales las “Madres…” son una de las organizaciones emblemáticas. En este contexto, Perfil publicó como noticia principal en su primera plana una noticia acerca de una supuesta vinculación de un primo político de la presidenta con el acusado. El titular fue acompañado de una fotografía en la cual se veía a las primeras mandatarias de Argentina y de Brasil junto a Hebe de Bonafini, titular de la Asociación “Madres…”. No parecía haber, en principio, nada extraño: la foto no buscaba mostrar ningún hecho concreto, sino solo presentar algunos personajes relacionados directa o indirectamente con la noticia que se estaba publicando. Nuevamente (y no podría haber sido de otro modo) fue un texto posterior y exterior el que puso en evidencia el engaño. Según publicó al día siguiente el diario El Argentino, en la foto publicada –que había sido tomada por la Presidencia de la Nación– había una persona más que había sido eliminada digitalmente: se trata de Estela de Carlotto, titular de Abuelas de Plaza de Mayo, otra organización prestigiosa de lucha por los derechos humanos vinculada a las atrocidades cometidas durante la dictadura militar. La elisión visual fue denunciada por esta última publicación, de abierto apoyo al gobierno de turno, como un intento de quitar una persona de alto prestigio social, y libre de toda sospecha, que debilitaría la construcción negativa que Perfil buscaba realizar de la presidenta argentina y de De Bonafini (ver figura 4.8.). En este caso, Perfil no había incluido ninguna aclaración acerca de la alteración realizada en la fotografía, y su emplazamiento en un periódico hacía suponer que se trataba de una imagen de registro sin modificaciones. De allí que se considere un engaño: no está en las expectativas del género “periódico de información” que las imágenes sean retocadas sin aviso. Al igual que en el caso anterior, el engaño estuvo habilitado por el hecho de que, perceptualmente, una fotografía original y una retocada adecuadamente no pueden distinguirse.

Figura 4.8. La fotografía original tomada por Presidencia de la Nación. Cuando el diario Perfil la publicó en su portada, Estela de Carlotto, la mujer que está a la izquierda en la imagen, había sido eliminada digitalmente, y, en cambio, se veían las celosías que están detrás de ella, como si no hubiera nadie a la derecha de la entonces presidenta argentina.

Del mismo modo que en los casos anteriores, la imagen audiovisual de síntesis que nos ocupa aquí podría ser empleada para engañar, si, a través de algunos de los mecanismos reseñados anteriormente, se hace pasar por un registro audiovisual. En otras palabras, puede presentarse como un registro de video algo que en verdad es el resultado de una síntesis. Lo que está en juego aquí, al igual que en las fotos retocadas, es la cuestión de la indicialidad: ¿verdaderamente esa imagen guarda relación empírica con un existente? La posibilidad de emplear en forma engañosa las imágenes de síntesis abre la puerta a la construcción de falsas pruebas: testimonios, declaraciones, alocuciones de personas que hablan mirando a cámara diciendo lo que, en verdad, nunca han dicho. De hecho, uno de los empleos más difundidos de estas imágenes de síntesis se ha producido con videos de este tipo, que se han dado a conocer como deep fake. Esta denominación retoma la categoría de fake (falso) de las fake news (noticias falsas), uno de los fenómenos que se han expandido en conjunto con el crecimiento de las redes sociales de Internet y sus funcionamientos de networking, sin centralidad en la emisión. La proliferación de noticias falsas ha sido entendida, a su vez, como parte del fenómeno más amplio conocido como “posverdad”, que ya hemos reseñado.^[21] De hecho, Álvarez Rufs vincula la posverdad con el engaño, y ambos con los avances tecnológicos, dentro de los cuales podemos incluir las imágenes que aquí nos ocupan:

La posverdad también se relaciona con la mentira, la falsedad, el engaño, y el autoengaño. Los diferentes contextos y narrativas también se han visto tremendamente afectados por el aumento cada vez mayor de la mendacidad que se viene produciendo desde mediados del siglo pasado de la mano de los profundos avances tecnológicos, los cuales han propiciado, y siguen propiciando, nuevas posibilidades y formas de mentira y engaño (Álvarez Rufs, 2019: 4).

El término deep fake para designar videos realizados con esta tecnología de imágenes en los cuales se observa cierta voluntad textual de fingimiento o engaño ganó cierta popularidad en los medios masivos,^[22] y ha funcionado en varios casos como categoría clasificatoria de estas producciones audiovisuales. Volveremos sobre las implicancias de estas posibilidades de engaño hacia el final del trabajo.

4.5. Cuarta aproximación: el trompe–l’œil

La capacidad de engañar de una imagen, sin embargo, no siempre fue vista con un sentido negativo, como el que señalábamos recién. La obtención de una imagen “que fuera una imitación tan perfecta que tuviera la capacidad de engañar”, en el sentido de hacerse pasar por otra cosa, ha sido positivamente valorada en numerosas ocasiones. Lévi-Strauss nos recuerda que la imitación de la realidad ha constituido históricamente un lugar común positivo en el juicio estético:

Que el supremo talento para el artista consista en imitar la realidad hasta el punto de confundirse, es sin embargo un lugar común del juicio estético que ha prevalecido durante mucho tiempo, incluso entre nosotros, hasta una época reciente. Para alabar a sus pintores, los griegos acumulaban las anécdotas: uvas pintadas que los pájaros acudían a picotear, imágenes de caballos que sus congéneres creen vivos, cortina pintada que un rival pedía al autor que levantase para poder contemplar el cuadro disimulado detrás (Lévi-Strauss, 1993[1994]: 29).

Este arte del engaño al ojo –o trompe–l’œil– no procede, según nos señala Lévi-Strauss, como el realismo fotográfico. A diferencia de este, que está centrado en la reproducción y en el mostrar, el trompe–l’œil opera una reconstrucción, en la que hay un proceso de selección: “Elige el polvillo de la uva antes que tal o cual otro aspecto, porque le servirá para construir un sistema de cualidades sensibles con lo graso (también escogido entre otras cualidades)” (Lévi-Strauss, 1993[1994]: 32).

Procedimientos de selección y jerarquización, entonces, junto con un cuidado ejercicio técnico, dan lugar a estas imágenes con voluntad de imitación.^[23] Frente a ellas, las imágenes fotográficas –también al decir de Lévi-Strauss– no distinguen los accidentes de la naturaleza de las cosas, y operan una mostración de lo instantáneo. Aun así, Schaeffer (1987[1990]: 18) nos recuerda cómo la industria fotográfica fue modelando progresivamente las impresiones fotográficas con una finalidad analógica. Es decir, incluso allí donde parece haber un dispositivo que naturalmente genera una imagen que opera por similitud, tiene lugar también un ejercicio técnico.

Regresando al tipo de imagen de síntesis que nos ocupa, el cruce del valle misterioso también puede entenderse como “una imitación tan perfecta que tiene la capacidad de engañar”. Sin embargo, a diferencia del trompe–l’œil pictórico, lo que se busca imitar ahora no es la percepción del objeto real; es decir: no se trata de una imagen que quiere hacerse pasar por la visión de un objeto. Por el contrario, estamos aquí ante un tipo de imagen que se hace pasar otro tipo de imagen. Basado en una alta iconicidad y en los procedimientos antes descriptos, el trompe–l’œil en la pintura buscaba generar la ilusión de que una representación no era tal, sino que era –por así decirlo– el referente, el existente: no era una pintura de las uvas, sino las uvas mismas. En cambio, la imagen de síntesis que estamos estudiando no pretende pasar por lo real: su ejercicio técnico está orientado a ser confundida perceptualmente con una imagen de cine o de video, es decir, con un registro audiovisual empírico/indicial. No podríamos ejemplificar aquí, como ha hecho la literatura sobre el tema, con animales confundidos ante las imágenes como prueba de lo efectivo del engaño, porque la cuestión no se agota en una supuesta percepción de lo real, sino que comprende también un proceso interpretativo que supone el conocimiento de las imágenes producidas por otros medios: estas imágenes no juegan a una supuesta ausencia del dispositivo, sino a haber sido producidas por un dispositivo diferente del que realmente las produjo. En otros términos: si este engaño funciona es porque –como ya señalamos– socialmente están instalados los interpretantes requeridos para la lectura de la imagen de video y de cine, pero no los correspondientes a estas imágenes de síntesis. Un ejercicio técnico que logre cruzar el valle misterioso habilitará este particular trompe–l’œil, en el que una imagen se hace pasar por otra de distinta naturaleza.

Visto desde este lugar, el fenómeno no es completamente novedoso: la historia de las imágenes de síntesis señala que en el pasado ya se había logrado obtener productos que emulaban ser imágenes de otra naturaleza. Refiriéndose a la imagen de síntesis, Bellour señala justamente que uno de sus gestos ha sido la transformación y el reciclaje de imágenes anteriores (Bellour 2008: 157).

Dos tipos de imagen de síntesis creadas con anterioridad a la que estamos estudiando aquí ilustran casos en los cuales la imagen parece ser de otra naturaleza. El primero es señalado por el mismo Bellour, quien llama la atención sobre ciertos dibujos animados producidos con imágenes de síntesis que no pueden distinguirse de los creados con las técnicas tradicionales: “La síntesis puede capturar el dibujo y […] el ojo puede, en adelante, confundirlos” (Bellour 2008: 157). Allí donde se supone que observamos el resultado del trazo humano, de una corporalidad que ha estado en contacto con la imagen y la ha generado, de una cierta habilidad para la ilustración, estamos viendo en verdad el resultado de una síntesis generada por computadora, en la cual no hubo contacto empírico alguno entre la imagen y una corporalidad creadora. El segundo ejemplo lo constituyen ciertas producciones realizadas con modelado 3D digital. Cuando se trabajan en forma realista, las imágenes 3D permiten crear objetos y espacios que –al igual que las imágenes que hemos estado observando– pueden confundirse con un registro fotográfico o de video. A diferencia de lo que ha ocurrido con la figura humana, la tecnología para generar imágenes y animaciones de espacios y objetos indistinguibles perceptualmente de los registros de video había sido desarrollada varios años antes (ver figura 4.9.). Este tipo de imagen presenta las mismas características en relación con su estatuto semiótico y la posibilidad de engaño que señalamos para las imágenes que nos están ocupando: esos espacios, esos objetos que estamos viendo o incluso recorriendo visualmente podrían no existir.^[24]

Figura 4.9. Un espacio modelado enteramente a través de tecnología 3D, en un sitio web creado en 2005. Varios años antes de que se cruzara el “valle misterioso”, ya se podían generar imágenes animadas de espacios y objetos 3D a través de síntesis que fueran indistinguibles perceptualmente de imágenes de registro de video. Imagen: WebAr Interactive.

Por diferencia, las imágenes 3D parecen indicarnos qué es lo novedoso y singular de la imagen que estamos estudiando: por primera vez, se logra a través de la síntesis emular una imagen de registro de la figura humana en movimiento. De aquí se desprenden nuevas implicancias, de las que nos ocuparemos en el próximo apartado.

4.6. Quinta aproximación: la temporalidad del cuerpo, la vida, la muerte

En el marco de sus estudios acerca de la televisión, Mario Carlón se ocupó en un artículo precisamente de la cuestión de la representación de la figura humana en las imágenes producidas a través de distintos dispositivos.^[25] Recorriendo las formulaciones de varios autores –entre los que se cuentan Metz, Dubois, Barthes y Schaeffer– y aportando también su propia perspectiva sobre el tema, Carlón logró en ese escrito caracterizar comparativamente las imágenes de los cuerpos generadas por la fotografía, el cine y la televisión. Su enfoque nos resulta sumamente relevante, puesto que –como vimos– la imagen de síntesis que estamos estudiando juega constantemente a confundirse con ellas, a pesar de que tiene una génesis –y por tanto un estatuto semiótico– de otra naturaleza. Repasaremos aquí brevemente las formulaciones de este autor, para luego preguntarnos qué ocurre con las imágenes que estamos estudiando.

Como señala Carlón, “todos los autores que avanzaron en el estudio de la especificidad de las imágenes generadas por el dispositivo fotográfico escribieron sobre la muerte” (Carlón, 2004: 125). Pensamos enseguida, junto con Carlón, en La cámara lúcida de Roland Barthes. Como vimos en el capítulo 1, este autor escribe acerca del momento de ser fotografiado como una “microexperiencia de la muerte”. Recordamos aquí sus formulaciones:

Imaginariamente, la Fotografía (aquella que está en mi intención) representa ese momento tan sutil en que, a decir verdad, no soy ni sujeto ni objeto, sino más bien un sujeto que se siente devenir objeto: vivo entonces una microexperiencia de la muerte (del paréntesis): me convierto verdaderamente en espectro. El Fotógrafo lo sabe perfectamente, y él mismo tiene miedo (aunque sólo sea por razones comerciales) de esta muerte en la cual su gesto va a embalsamarme (Barthes, 1980[2004]: 42, citado en Carlón, 2004: 125).

Carlón también cita a otro autor que hemos revisado, Philippe Dubois, quien hace un señalamiento en el mismo sentido:

El acto fotográfico implica pues no sólo un gesto de corte en la continuidad de lo real sino también la idea de un paso, de un salto irreductible. El acto fotográfico, al cortar, hace pasar al otro lado (del corte): de un tiempo evolutivo a un tiempo fijado, del instante a la perpetuación (Dubois, 1983[1994]: 148, citado en Carlón, 2004: 126).^[26]

Como se ve, estos autores están convocando –para el caso de las imágenes obtenidas con el dispositivo fotográfico– la figura del muerto. Carlón nos recuerda que también Metz, retomando formulaciones de Dubois, apeló a esta figura:

Aun cuando la persona fotografiada viva todavía, aquel momento en que él o ella era se ha desvanecido para siempre. Estrictamente hablando, la persona que ha sido fotografiada –no la persona total, que es un efecto del tiempo– está muerta: muerta por haber sido vista, como dice Dubois, en otro contexto (Metz, 1984, citado en Carlón, 2004: 127).^[27]

Carlón señala, finalmente, que el muerto fotográfico –a diferencia del real– tiende a ser perpetuo:

[…] entre el muerto real y el Muerto Fotográfico hay una gran diferencia: si el muerto real está destinado, físicamente, a desaparecer (o a mutar) el muerto fotográfico accede, en el mismo instante en que es fotografiado, a la perpetuidad (Carlón, 2004: 127).

Podemos añadir a estos autores citados por Carlón a Henri Van Lier, quien postuló:

Como huella luminosa, la foto es la presencia íntima de algo de una persona […]. Al mismo tiempo, deja la sensación más fuerte del una-vez-y-nunca-más. […]. Funciona como relicario, transformando la foto en reliquia, talismán o amuleto. En todo caso en mortaja o tumba, que no necesita inscripción, porque él mismo es inscripción (Van Lier, 1981: 53).^[28]

Estas reflexiones versan acerca de una corporalidad atravesada por la dimensión de la temporalidad. Por un lado, y a diferencia de lo que ocurre con los dispositivos que tienen la posibilidad de trabajar en directo, las imágenes fotográficas se presentan siempre como el registro de un momento pasado: la corporalidad figurada ya nunca volverá a ser aquella que se ve en la imagen.^[29] Por el otro, la naturaleza inmóvil de la imagen fotográfica genera un efecto de detención temporal. Se trata entonces de un momento cristalizado en un tiempo pasado. Señala Metz que justamente esta falta de movimiento constituye una supresión de una de las marcas primarias del “estar vivo” (Metz, 1984, citado en Carlón, 2004: 129).

Frente a estas descripciones que vinculan la imagen fotográfica con la muerte, Carlón encuentra una serie de reflexiones acerca de la imagen cinematográfica que la vinculan con su superación, aunque sea parcial:

[…] la presencia de las marcas del ser vivo, en la actualización de lo ya acontecido, que gracias a que contiene imágenes móviles y múltiples en movimiento ofrece el cine (y la imagen videográfica mientras sea emitida en grabado y no en directo) se presentan como una superación –aunque sea parcial– de la muerte (Carlón, 2004: 129).

Frente a la figura del muerto que caracterizaba las imágenes obtenidas a través del dispositivo fotográfico, Carlón rescata la figura del fantasma^[30] en relación con las imágenes audiovisuales grabadas (sean cinematográficas o de video). Nuevamente, es el conocimiento sobre el funcionamiento de los distintos dispositivos el que determina el estatuto de aquello en lo que va a ser convertido aquel que es capturado en una imagen de registro:

[…] el que va a ser fotografiado sabe que va a ser transformado en el Muerto; el que va a ser filmado o videograbado sabe que se va a convertir en un Fantasma […] el grabado introdujo una experiencia que, de entrada, se encuentra entre la vida y la muerte; la muerte no es absoluta, pero tampoco la vida es plena (Carlón, 2004: 131).

Schaeffer señala que, mientras que la imagen fotográfica hace surgir el tiempo como pasado, “la imagen fílmica, siempre una vez más, cierra el abismo y abre el tiempo como presencia” (Schaeffer, 1987[1990]: 49). Carlón añade al respecto que este efecto de presencia que otorga el movimiento está alejado, sin embargo, de las posibilidades de los dispositivos que habilitan la toma directa, como la televisión (cuando funciona en esa modalidad). En el caso del cine, señala este autor, siempre esa imagen en movimiento nos muestra lo que alguien, aunque más no sea la cámara, ya vio (Carlón, 2004: 134). En ese sentido, es con la imagen televisiva en su modalidad del directo –y no con el cine– con la cual podemos constituirnos en testigos.

Frente al muerto de la fotografía y al fantasma de la imagen grabada, Carlón propone la figura del vivo para el caso de la televisión, cuando esta opera en la modalidad del directo:

La toma directa nos enfrenta, parafraseando a Barthes, a la misma “intratable realidad” a la que nos enfrenta la fotografía, pero su estatuto es totalmente distinto […] el directo nos enfrenta a la previsibilidad e imprevisibilidad de la vida, de los que están vivos y de lo real, y a otra concepción, totalmente distinta, de nuestra experiencia, porque nos involucra en forma plena (Carlón, 2004: 132).

Es la simultaneidad entre el momento del registro, la transmisión y la recepción de las imágenes la que, en el caso del directo, habilita que estas imágenes icónico-indiciales construyan la figura del vivo. Al igual que en los casos anteriores, el saber del arché posibilita que sean leídas de ese modo:

[…] la toma directa […] afecta a la construcción de los sujetos en cuanto a su presencia y temporalidad: sabemos que son reales, que están haciendo algo en ese momento. ¿Cómo se lo sabe? A través del saber sobre el dispositivo, del saber del arché, que en el caso del dispositivo televisivo, que incluye la toma directa, presenta una singular manifestación de la tesis de existencia […] [que puede formularse como sigue]: A) “la imagen construye/representa a X”; B) “X existe en este momento” (Carlón, 2004: 94).

Frente al muerto, el fantasma y el vivo convocados por las imágenes de estos tres dispositivos, ¿qué tipo de figura se asocia con la imagen de síntesis que estamos estudiando? Para responder esto, debemos remitirnos nuevamente a la génesis de cada uno de estos tipos de imágenes. Los tres dispositivos que repasa Carlón tienen un funcionamiento icónico-indicial: en la medida en que todas las técnicas implican alguna instancia de registro, las imágenes generadas a través de ellos son a la vez un producto que guarda relaciones de similitud con lo capturado y una prueba de existencia de aquello que estuvo frente a la cámara. En el caso del cine y de la televisión, el hecho de que se trate de imágenes móviles que poseen una cierta duración hace que los textos producidos con estos dispositivos funcionen al mismo tiempo como prueba de que un determinado hecho o una determinada situación tuvo lugar. Es decir, a diferencia de la fotografía, que muestra un instante detenido en el tiempo (del cual los momentos anterior y posterior solo pueden, como mucho, suponerse, y en múltiples casos no están siquiera tematizados, como en los retratos fotográficos), los textos audiovisuales operan como registro del desenvolvimiento temporal de un cierto hecho o situación. En el nivel en el que estamos ubicándonos, esto vale incluso para los textos ficcionales: como decíamos anteriormente citando a Schaeffer, en cuanto dispositivo de registro audiovisual, el cine funciona también (indicialmente) como testimonio de que Humphrey Bogart actuó esas escenas de Key Largo que estamos observando, más allá de lo que suceda en la diégesis del film. Podríamos agregar ahora que, en relación con sus aspectos icónicos, el fantasma de la imagen grabada sigue siendo también un muerto, como en la fotografía. Esto ocurre más allá de que se trate de imágenes ficcionales o no ficcionales: sabemos que ese cuerpo figurado, inserto en la narratividad textual de la imagen audiovisual, ya no existe, o, por lo menos, no existe tal como se lo ve allí.^[31]

¿Qué ocurre con la génesis de las imágenes de síntesis que nos ocupan? En principio, debemos señalar que –por la distancia que se observa en su procedimiento de generación entre las instancias de emisión y recepción– nos ubicamos, al igual que el cine y la televisión grabada, alejados del vivo. ¿Se trata, entonces, de una nueva versión del fantasma? Algo así parece ocurrir con estas imágenes de síntesis. Sin embargo, en este punto resulta pertinente retomar la indicialidad atenuada o debilitada de la que hablábamos en nuestra primera aproximación. Repasando el modo en que son generadas estas imágenes, señalábamos algunas páginas atrás que su indicialidad es mucho menor que la observada en la imagen cinematográfica, pues tiene lugar en relación con ciertos rasgos de la figura humana que observamos –por un lado– y en relación con los movimientos que aparecen representados –por el otro–, pero no con esa conjunción de rasgos y movimientos que vemos en la pantalla. Puede decirse que, cuando se poseen los saberes acerca del arché de estas imágenes, es la primera de estas dos indicialidades la que termina por definir las características de este nuevo fantasma: la imagen no se presenta como el momento de un registro pasado, sino como la (re)animación de un cuerpo para hacerlo vivir aquello que no vivió. Un cuerpo que presenta las marcas indiciales de haber existido, pero que –lo vimos con el ejemplo de Einstein– podría ya no existir más. Este fantasma, entonces, tiene algo de autómata, de inyección de vida sobre un cuerpo a través de la animación. Si el cine operaba como una superación parcial de la muerte por la posibilidad de pervivir en imágenes de registro móviles más allá de los límites de la vida biológica, estas imágenes de síntesis constituyen una suerte de resurrección imaginaria: a través del movimiento, le hacen vivir a ese cuerpo lo que nunca vivió. En este punto, la indicialidad debilitada adquiere toda su fortaleza: las imágenes se alejan completamente de los funcionamientos exclusivamente icónicos (piénsese, por ejemplo, en el estatuto semiótico de los dibujos animados tradicionales), y presentan una figura que funciona indicialmente en relación con la iconicidad, pero no con la temporalidad: las representaciones son prueba de que alguien con esos rasgos existe o existió, pero no de que el hecho representado efectivamente haya tenido lugar.

El conocimiento del arché de estas imágenes, entonces, vuelve su referente un doble. Ese cuerpo gesticulando y hablando frente a la cámara nos es familiar, y, sin embargo, no se trata verdaderamente de los movimientos de ese cuerpo, ni ha existido allí una cámara que lo capturara. En la medida en que la percepción se confunde con la de un ícono indicial pleno, el doble instaura la duda acerca de su naturaleza: ¿se trata o no de la persona que creemos estar identificando? Dicho en otras palabras, esa imagen que debería ser conocida y familiar despierta una duda acerca del estatuto de su referente. Como resultado, termina por tornarse siniestra.

En su problematización del concepto de lo siniestro, Sigmund Freud hace referencia a las definiciones de E. Jentsch, que están orientadas justamente en el sentido de esta duda:

E. Jentsch destacó, como caso por excelencia de lo siniestro, la “duda de que un ser aparentemente animado, sea en efecto viviente: y a la inversa: de que un objeto sin vida esté en alguna forma animado”, aduciendo con tal fin, la impresión que despiertan las figuras de cera, las muñecas “sabias” y los autómatas (Freud, 1919[2014]: 5).

La dimensión de lo siniestro de estas imágenes reposa entonces justamente en la imposibilidad de distinguirlas perceptualmente de las imágenes de registro audiovisual. Es allí donde se origina esta incertidumbre intelectual acerca de si se trata o no de seres vivientes; y, por tanto, lo que debería ser familiar y cotidiano –una imagen en movimiento de un cuerpo humano– se nos vuelve espantoso. Es justamente lo cotidiano vuelto espantoso lo que se torna siniestro.

Como bien señala Freud, los efectos siniestros tienden a tener lugar cuando las imágenes sobre las que se produce extrañeza se ubican en el dominio de “aquello que se vivencia” –al decir de este autor– o, en términos generales, en verosímiles realistas:^[32] es el doble familiar el que nos produce ese espanto. Por el contrario, en muchos registros ficcionales, las convenciones del verosímil tienden a generar otros efectos alrededor de estos dobles que pueden estar alejados de lo siniestro, y hasta ser incluso cómicos. Dicho de otro modo: no siempre una figura del doble evoca lo siniestro. Así como lo siniestro (unheimlich) se opone a lo cotidiano y familiar (heimlich), no todo lo que no es familiar es necesariamente siniestro (Freud, 1919[2014]: 2), aun cuando nos presente la figura del autómata o el doble.^[33]

En este punto, nos interesa recuperar un aspecto de estas imágenes audiovisuales de síntesis que hemos dejado de lado hasta ahora: el plano sonoro. En efecto, en todos los ejemplos relevados, el audio que se escucha en la imagen final corresponde al registrado en la imagen de la cual se toman los movimientos. En el ejemplo de la figura 4.4. que vimos en las primeras páginas de este capítulo, la imagen de síntesis de Albert Einstein no solo reproduce los movimientos del joven, sino que también habla con su voz (la del joven), repitiendo exactamente lo que este dijo. Como lo han demostrado muchos autores hace ya varios años, en la vida social la voz puede ser identificada con un altísimo nivel de certeza con una determinada persona; en ese sentido, es signo de su presencia y existencia. La voz, entonces, hace presente a un determinado cuerpo. Al decir de Fernández, “la voz es cuerpo del emisor. Fragmentado, pero plenamente corporal como componente de identificación absoluta” (Fernández, 1994: 39). La voz habilita un grado de identificación y de individuación muchísimo mayor que cualquier gesto en el que podamos pensar; en ese sentido, el vínculo empírico de la imagen de síntesis con la que hemos llamado “imagen de registro de movimientos” en la figura 4.5. es mucho más ostensible en relación con el plano sonoro que con el plano visual. La imagen que resulta, entonces, parece ser la del registro de una persona que posee la voz de otra. Este doble vínculo indicial y simultáneo con dos cuerpos diferentes –con la apariencia de uno, con la voz del otro– contribuye también de modo relevante a la construcción de estas imágenes como siniestras. Como en una condensación onírica, cada una contiene rastros de más de un cuerpo, pero no es decididamente ninguno de ellos.

4.7. Conclusiones

¿De qué modo los sujetos logramos identificar el estatuto semiótico de una imagen generada a través de dispositivos de registro, tales como el fotográfico, el cinematográfico o el televisivo? Es evidente que generamos esta identificación con una operación doble y prácticamente simultánea: por un lado, a través de sus cualidades, reconocemos el tipo de imagen que estamos percibiendo como semejante a otras que ya hemos percibido en el pasado producidas por el mismo dispositivo; por el otro, vinculamos ese tipo de imagen con un cierto saber acerca del arché de ese dispositivo que, con sus variantes, nos hace leer en todos estos casos la imagen como icónica-indicial.

La fascinación del cruce del valle misterioso, puede decirse, proviene justamente de la imposibilidad de distinguir las imágenes de síntesis de las obtenidas con estos dispositivos, y, por tanto, de su confusión con íconos indiciales plenos. En otras palabras, se tiende a pensar que una imagen de esas cualidades solo puede haber sido lograda a través de algún procedimiento de impresión, ergo, se concluye que es signo de un existente. Si el cine hacía “que la muerte no [fuera] ya absoluta” (Carlón, 2004: 129), era justamente porque todo registro audiovisual es el registro de una vida. Leídas de ese modo, estas imágenes de síntesis se nos presentan como la (re)creación de una vida, o la superación de la muerte: se puede seguir haciendo vivir a esa persona aun cuando haya fallecido (Carlón, 2004: 94).^[34] Allí encontramos la figura del autómata o del doble de la que ya hemos dado cuenta.

En ese sentido, recuperamos aquí nuestras aproximaciones tercera y cuarta, que hacían foco, respectivamente, sobre las posibilidades de engaño habilitadas por estas imágenes y sobre el trompe–l’œil. El dispositivo de generación de imágenes de síntesis que hemos estudiado es, en rigor, un dispositivo de emulación: genera imágenes con la apariencia del registro audiovisual, que en verdad son solo una síntesis en la cual la indicialidad está atenuada.

En el pasado ya habíamos observado cómo las tecnologías digitales podían ser soporte de las producciones realizadas en los medios analógicos o tradicionales: fragmentos de films, audios de programas de radio, programas televisivos viven desde hace años digitalizados en la Web. Habíamos observado también cómo las tecnologías digitales lograron recrear funcionamientos de los dispositivos analógicos tradicionales en muy numerosos casos: la fotografía y el video digitales, sin ir más lejos, son dos ejemplos que hoy se encuentran en la vida cotidiana. Menos habitual ha sido observar casos como los que se presentan aquí: la creación digital de textos que trabajan con materias de la expresión cuyo estatuto semiótico se confunde con los de otros dispositivos ya conocidos. Un caso similar al que hemos estudiado sea acaso la generación de archivos de música a través de la síntesis informática: si bien habitualmente discriminamos las cualidades de los sonidos generados por sintetizador de los realmente ejecutados por un músico, en el caso de algunos instrumentos –particularmente el piano–, es habitual que un archivo ordinario creado por síntesis no sea perceptualmente distinguible de una grabación, es decir, de un registro.^[35] La síntesis de imágenes audiovisuales que logran ser confundidas con las de registro que hemos visto aquí es un hecho novedoso, habilitado por la sofisticación de ciertas técnicas informáticas. Al respecto, decíamos al inicio de este capítulo que el avance tecnológico constituido por la posibilidad de crear estas imágenes de síntesis –o lo que se ha llamado “el cruce del valle misterioso”– probablemente estaba comenzando a cambiar nuestra relación con las imágenes audiovisuales. ¿Qué es lo que podría modificarse?

Por el momento, este tipo de imagen de síntesis tiene baja circulación social –sobre todo, si se la compara con las imágenes cinematográficas, televisivas y de video, con las cuales convivimos a diario–. De igual modo, no hay un conocimiento social expandido acerca de su existencia y de su arché, por lo que también en el orden metadiscursivo poseen una vida social acotada. Sin embargo, la expansión de los saberes acerca de estas imágenes de síntesis podría llegar también a poner en duda, en las instancias receptivas, el estatuto de las imágenes audiovisuales de registro, como las que se obtienen con una cámara de cine o de video. De ser así, ya no consideraríamos que una imagen animada audiovisual de una figura humana de un alto grado de iconicidad y con las propiedades habituales de una imagen de registro sea con certeza (también) un índice pleno, puesto que podría tratarse de una imagen de síntesis.^[36] La hipótesis que presentamos es que, socialmente, podría ocurrir que las imágenes audiovisuales con estas propiedades perceptuales dejen de funcionar como prueba, o al menos dejen de hacerlo en forma tan indudable como lo hacen al día de hoy. Nos imaginamos una situación similar a lo que ocurre actualmente con las fotografías: para ser empleadas como prueba, deben ser sometidas a una evaluación de autenticidad, puesto que es sabido socialmente que las imágenes fotográficas podrían ser alteradas sin que esto sea percibido a simple vista. Esta sospecha que aparece a partir de las posibilidades de engaño en el caso de la fotografía no está instalada del mismo modo sobre las imágenes audiovisuales, pues no hay un conocimiento social extendido de que pueda existir una imagen animada de una persona con alto grado de semejanza perceptual que no sea obtenida por registro. La expansión del saber sobre estas imágenes de síntesis podría cambiar este panorama.

Al final de este recorrido, se nos aparece una pregunta: ¿estas imágenes realmente han cruzado el valle misterioso? Como hemos observado en nuestras reflexiones, el componente indicial de estas imágenes –que, aunque atenuado, está siempre presente– afecta de varios modos su estatuto semiótico. Desde nuestra perspectiva, podríamos decir que las hipótesis que Masahiro Mori presentaba en la década de 1970 reflexionaban acerca de la construcción de artefactos de distinto tipo cuyo estatuto era solo el de ser íconos: al hablar de los robots o de las manos protésicas, el autor problematizaba el grado de similitud que debían guardar con sus referentes, pero no pensaba en ningún tipo de lazo empírico con ellos, como el que se genera en las imágenes de registro. Es precisamente el componente indicial el que hace que estas imágenes de síntesis solo crucen el valle misterioso en algunas circunstancias. Lo cruzan, por un lado, si ponen en juego efectivamente el engaño, cuando logran que se ignore su estatuto semiótico: es decir, en aquellas circunstancias en las que se hacen pasar exitosamente por imágenes de registro, como si tuvieran un funcionamiento icónico-indicial pleno. Lo cruzan, por el otro, cuando están insertas en la mayor parte de los registros ficcionales, y por tanto se debilita su estatuto de doble para insertarse en un universo diegético, en el que nada tienen de “misterioso”. Sin embargo, cuando se ubican en un registro realista y su estatuto semiótico está mostrado –y por tanto queda exhibida la debilidad de su componente indicial–, corren el riesgo de caer abruptamente en el valle que quisieron cruzar. En este caso, el rechazo no vendrá ya de su falta de fidelidad para imitar imágenes de registro audiovisual, que era la preocupación de Mori hace algunas décadas. Por el contrario, se producirá por la conjunción de esta fidelidad y del saber del arché, que terminarán por presentar las imágenes como las de un cuerpo reanimado y, por tanto, un doble siniestro.

Bibliografía del capítulo 4

Álvarez Rufs, Manuel (2019). “Características de la Posverdad. Una cuestión de contexto y narrativa”, disponible en bit.ly/31f6EZy [consulta: 7/11/2019].

Barthes, Roland (1989). La cámara lúcida. Nota sobre la fotografía, Buenos Aires, Paidós. Edición original: 1980. La chambre claire. Note sur la photographie, París, Cahiers du Cinéma/Gallimard/Seuil. Traducción de Joaquim Sala-Sanahuja.

Bellour, Raymond (2008). “La doble hélice”, en Las prácticas mediáticas predigitales y post analógicas, Buenos Aires, Meavac_08.

Blejman, Mariano (2011). “Dirás que todo es mentira”, en Página|12, Buenos Aires. Disponible en bit.ly/3j7BGJb [consulta: 2/9/2011].

Carlón, Mario (2004). Sobre lo televisivo. Dispositivos, discursos y sujetos, Buenos Aires, La Crujía Ediciones.

Dubois, Philippe (2015). El acto fotográfico y otros ensayos, Buenos Aires, la Marca Editora. Edición original: 1990. L’acte photographique et autres essais, París, Nathan. Traducción de Víctor Goldstein.

Fernández, José Luis (1994). Los lenguajes de la radio, Buenos Aires, Atuel.

Freud, Sigmund (2014). “CIX. Lo siniestro”, en https://bit.ly/3dCY2kM [Consulta: 17/10/2020]. Edición original: 1919. Publicado como libro en Freud, Sigmund (1989) “Lo ominoso” en Obras Completas Vol. XVII, Buenos Aires, Amorrortu.

Hjelmslev, Louis (1972). Ensayos lingüísticos, Madrid, Gredos. Edición original: 1959. Essais linguistiques, Copenhague, s/d.

Levis, Diego (2014). La pantalla ubicua: televisores, computadoras y otras pantallas, La Crujía Ediciones, Buenos Aires.

Lévi-Strauss, Claude (1994). Mirar, escuchar, leer, Buenos Aires, Espasa Calpe/Ariel. Edición original: 1993. Regarder, écouter, lire, París, Librairie Plon.

Manovich, Lev (2003). “Las paradojas de la fotografía digital”, en AA. VV. (2003). Los usos de la imagen. Fotografía, film y video en La Colección Jumex, Buenos Aires, Malba-Jumex-Espacio Fundación Telefónica. Publicación original: 1994. “The Paradoxes of Digital Photography”, s/d.

Manrique, Carlos A. (2019). “Trayectorias del relativismo moderno y su ontología política: entre la posverdad y la hiperverdad”, en Universitas Philosophica, 36(72), 151-172. Disponible en bit.ly/31ytYlx [consulta: 17/10/2020].

Metz, Christian (1974). “El estudio semiológico del lenguaje cinematográfico”, en revista Lenguajes, n.º 2, Buenos Aires, Nueva Visión.

Metz, Christian (1975). “El decir y lo dicho en cine”, en AA. VV.: Lo verosímil, Buenos Aires, Tiempo Contemporáneo.

Metz, Christian (1982). “Más allá de la analogía, la imagen”, en AA. VV., Análisis de la imagen, Barcelona, Ediciones Buenos Aires. Publicado originalmente en AA. VV. (1970). L’Analyse des Images, Communications, n.º 15, París, Éditions du Seuil.

Mori, Masahiro (1970). “The Uncanny Valley”, en Energy, vol. 7, n.º 4, 33-35 (en japonés). Versión en inglés disponible en bit.ly/3kbPdR6 (traducción del japonés al inglés: Karl F. MacDorman y Norri Kageki) [consulta: 17/10/2020].

Soto, Marita (1998). “Tres casos de naturaleza muerta mediática”, en De Oliveira, Ana Claudia y Fechive, Yvana (eds.) (1988). Visualidade, urbanidade, Intertextualidade, San Pablo, Centro de Pesquisas Sociosemióticas, pp. 251-260.

Quéau, Philippe (1995). Lo virtual. Virtudes y vértigos, Barcelona, Ediciones Paidós Ibérica. Edición original: 1993. Le virtuel. Vertus et vertiges, Ceyzérieu, Éditions Champ Vallon et INA. Traducción de Patrick Ducher.

Schaeffer, Jean-Marie (1990). La imagen precaria del dispositivo fotográfico, Madrid, Cátedra. Edición original: 1987. L’image précaire du dispositif photographique, París, Seuil.

Verón, Eliseo (1974). “Para una semiología de las operaciones translingüísticas”, en revista Lenguajes, n.º 2, Buenos Aires, Nueva Visión.

Verón, Eliseo (1987). Construir el acontecimiento, Barcelona, Gedisa. Edición original: 1981. Construire l’événment, París, Les Editions de Minuit. Traducción de Beatriz Anastasi de Lonné y Horacio Verbitsky.

Vincens, Joan Albert (2018). “La posverdad como sistema”, en revista Perifèria, Vol. 5/2018, 104-151. Disponible en bit.ly/349Mh25 [consulta: 9/11/2019].

Zelcer, Mariano (2006). “Nuevos sitios web: variaciones en las instancias productivas”. Trabajo presentado en las X Jornadas Nacionales de Investigadores en Comunicación, organizadas por la Red Nacional de Investigadores en Comunicación, ciudad de San Juan, provincia de San Juan, Argentina.

Zelcer, Mariano (2016). “El cruce del valle misterioso: aproximaciones a un nuevo tipo de imagen audiovisual”, en revista Me Manda Walt, n.º 2. Disponible en bit.ly/3lOuB23 [consulta: 14/1/2019].

El presente capítulo tuvo varias versiones anteriores, que han sido presentadas o han circulado en distintos ámbitos académicos. La primera versión fue presentada con el título “El cruce del valle misterioso: aproximaciones a un nuevo tipo de imagen audiovisual” en el 10º Congreso Internacional de Semiótica Visual AISV-IAVS, realizado en la ciudad de Buenos Aires, Argentina, entre el 4 y el 8 de septiembre de 2012, y publicada luego en las actas de ese mismo congreso. Una versión resumida y revisada fue publicada con posterioridad en Zelcer (2016). Una tercera versión ampliada circuló también desde 2016 como material de cátedra en la asignatura Semiótica General del Área Transdepartamental de Crítica de Artes de la Universidad Nacional de las Artes. La versión que se presenta aquí –revisada, ampliada y actualizada– es posterior a todas las mencionadas.↵
Para conocer más acerca de estos desarrollos y del modo en que se generan estas imágenes, se puede consultar la entrevista completa a Pete Busch en bit.ly/2GO24KX [consulta: 2/9/2011].↵
En las citas de Mori incluidas en este capítulo, la traducción del inglés es nuestra.↵
En Internet es posible ver algunos videos que ilustran “caídas” en el valle misterioso. Un hombre genera una animación facial que lo imita; el aspecto de la animación es de un altísimo parecido con un ser humano, pero el movimiento de la boca no es natural, y provoca extrañeza: bit.ly/30XAQs3 [consulta: 2/9/2011]. Lo mismo ocurre en bit.ly/3jRZZfc [consulta: 2/9/2011]: mientras en la imagen la mujer no mueve la boca, podría tomarse perfectamente por una imagen de registro de video; sin embargo, cuando lo hace, notamos que en verdad se trata de una animación.↵
La tecnología empleada en estas imágenes se conoce como computer facial animation (animación facial por computadora). Este tipo de animación es parte de un conjunto mayor de técnicas, conocidas como computer generated imagery (imágenes generadas por computadora, o CGI). En este capítulo no nos ocuparemos de todas las imágenes generadas con las técnicas de CGI, ni tampoco de todas las correspondientes a la animación facial por computadora, sino solo de algunas de ellas, que reúnen las características que acabamos de describir. Por esa razón, en el resto del capítulo evitaremos las referencias a estas denominaciones, y hablaremos simplemente de un cierto tipo de imágenes de síntesis.↵
Para un mayor desarrollo acerca de la noción de “materia significante”, remitimos al capítulo 1 de este libro.↵
Dice Schaeffer: “La imagen fotográfica es, en su especificidad, el resultado de una puesta en práctica del dispositivo fotográfico en su totalidad” (Schaeffer, 1987[1990]: 9).↵
La explicación que sigue es una reconstrucción propia a partir de diversos videos explicativos acerca de los procedimientos de generación de estas imágenes de síntesis que se han encontrado en la Web. Si bien puede tener alguna imprecisión, es válida a los fines de reseñar su génesis y nos habilita para la posterior reflexión acerca de su estatuto semiótico, que es lo que nos interesa aquí.↵
A excepción de los metadiscursos como los de la figura 4.3., que explican el modo de generación de estas imágenes y las muestran en forma comparativa. A estos metadiscursos, les otorgaremos un lugar central, como se verá enseguida.↵
Desde luego, se trata de un proceso en el que interviene también la percepción; sin embargo, nuestro foco no está aquí en las cuestiones fenomenológicas, sino en las lecturas, entendidas como siempre insertas en la semiosis. En ese sentido, incluso la instancia perceptual la concebimos ya como modelada por esos interpretantes sociales.↵
Con excepción de las imágenes que, con esta técnica, se han generado para ser insertadas en imágenes mayores que las contienen, particularmente las de ciertos videojuegos o films. Tanto en unos como en otros, estamos ante textos de circulación masiva en los que predomina un régimen ficcional; en ese sentido, pierde interés la pregunta por la veracidad de las imágenes o su estatuto de registro. En las prácticas de la circulación cotidiana de imágenes a través de redes sociales que hemos estudiado en los capítulos anteriores, no es parte de las expectativas recibir un video de este tipo, como sí lo es recibir múltiples tipos de imágenes fotográficas o de video, que pueden estar modificadas o intervenidas de los distintos modos que ya hemos visto.↵
Al referirse a ciertos logros de la animación cinematográfica, Manovich también enfatiza que la propensión a leer las imágenes que aparentan ser fotográficas o cinematográficas como si fueran de registro es un efecto de la historia. Dice este autor: “[Películas como Terminator 2 o Jurassic Park podrían] parecer un logro técnico excepcional: la capacidad de fingir la realidad visual. Porque lo que es fingido no es, por supuesto, la realidad sino la realidad fotográfica, la realidad tal como es vista por la lente de la cámara […]. Y la razón por la que pensamos que los gráficos generados por computadora han tenido éxito al fingir la realidad es que nosotros, en el curso de los últimos ciento cincuenta años, hemos llegado a aceptar a la imagen de la fotografía y del cine como la realidad” (Manovich, 1994[2003]: 107).↵
Schaeffer evoca, al respecto, la recepción que se producía de las obras generadas por la escuela pictográfica. Según reseña, a principios de siglo XX, esta escuela “ha producido fotografías ‘trabajadas’ (después de la toma) hasta tal punto que se carece de cualquier criterio morfológico que permita decidir si se trata de una fotografía o de un cuadro […]. Dada la incapacidad del receptor en decidir si se trata de una foto o de la reproducción de un cuadro, la función indicial de la imagen desaparecerá, lo cual afecta en profundidad a su estatuto semiótico. Pero basta que una indicación textual designe la imagen como fotografía para que vuelva a surgir la fotografía, afectando a su vez los retoques ‘pictóricos’” (Schaeffer, 1987[1990]: 35).↵
En relación con la incidencia de la posverdad en la vida de las democracias contemporáneas, afirma Joan Albert Vincens: “La posverdad […] emerge […] de un sistema social que, en virtud de sus propias inercias, daña el debate político democrático, facilita la circulación de las mentiras en todas sus variantes y dificulta el ejercicio público y eficiente de la inteligencia argumentativa, crítica, anclada en los hechos” (Vincens, 2018: 149). El enfoque de Vincens presenta la singularidad de entender el funcionamiento de la posverdad como un sistema, dentro del sistema mayor que es la sociedad. Explica al respecto que la posverdad puede pensarse como “un ‘sistema’ en el interior del sistema social global; más precisamente, como aquella estructura sistemática mediante la que hoy se produce, se difunde y se acredita lo que muchos acaban considerando ‘verdadero’ o ‘falso’” (Vincens, 2018: 122).↵
Indica Diego Rubio: “La verdad se ha multiplicado y no compite contra la mentira, sino contra otras verdades” (Rubio, 2017, citado en Álvarez Rufs, 2019: 3). El texto referido es Rubio, Diego (2017). “La política de la posverdad”, en Estudios de política exterior, 176, 58-67. Disponible en bit.ly/36XPtQb [consulta: 31/03/2019].↵
Raúl Rodríguez Ferrándiz afirma que “la posverdad se nutre de la oscilación indecidible entre versiones de la realidad que parecen no poder someterse a prueba de falsación” (Rodríguez Ferrándiz, 2018: 211, citado en Álvarez Rufs, 2019: 5). El texto referido es Rodríguez Ferrándiz, Raúl (2018). Máscaras de la mentira. El nuevo desorden de la posverdad, Valencia, Pre-texto.↵
Debemos mencionar aquí que muchos autores cuestionan el carácter de novedad del fenómeno de la posverdad. Uno de ellos es Carlos Manrique, quien dice: “Cuestiono la idea de que la indocilidad del discurso frente a ciertas figuras clásicas de la verdad en su circulación en la vida social sea una novedad histórica, como se pretende asumir” (Manrique, 2019: 153), y agrega más adelante: “Frente a esta caracterización de lo que significa el vocablo posverdad como presunto ‘signo de nuestros tiempos’, esa angustia hacia una peligrosidad devastadora del discurso en su circulación proliferante en el campo social, debemos atender a que no hay allí, en realidad, ninguna novedad histórica: esa angustia es consustancial a la historia de la filosofía política en Occidente, y a cierta experiencia y comprensión de lo político en las prácticas sociales condicionada por, y determinante de, esa historia” (Manrique, 2019: 155).↵
Algunos de ellos son Rubio, D’Ancona y Rabin-Havt; todos se encuentran citados en Álvarez Rufs (2019).↵
La imposibilidad de distinguir a través de la percepción una imagen fotográfica retocada digitalmente de una que no lo ha sido ya fue reconocida formalmente en varios países y jurisdicciones, y dio lugar incluso a la sanción de leyes y disposiciones regulatorias. En Argentina, la Ley 3.960 sancionada el 3 de noviembre de 2011 y promulgada el 1.º de diciembre del mismo año por la Legislatura de la Ciudad Autónoma de Buenos Aires indica en su artículo primero: “Toda publicidad estática difundida en vía pública, en la cual intervenga una figura humana utilizada como soporte o formando parte del contexto o paisaje que haya sido retocada y/o modificada digitalmente mediante programas informáticos, debe exhibir con tipografía y en lugar suficientemente destacado la siguiente leyenda: ‘la imagen de la figura humana ha sido retocada y/o modificada digitalmente’”. En su segundo artículo, la ley señala que los infractores pueden ser sancionados de acuerdo con la Ley nacional argentina de Lealtad Comercial (número 22.802). Esta última ley señala en su artículo 9: “Queda prohibida la realización de cualquier clase de presentación, de publicidad o propaganda que mediante inexactitudes u ocultamientos pueda inducir a error, engaño o confusión respecto de las características o propiedades, naturaleza, origen, calidad, pureza, mezcla, cantidad, uso, precio, condiciones de comercialización o técnicas de producción de bienes muebles, inmuebles o servicios”. El retoque fotográfico se reconoce así como un mecanismo posible de inducción al engaño. De algún modo, estas regulaciones buscan resguardar legalmente lo que se reconoce es imposible de distinguir perceptualmente.↵
Uno de ellos fue el desaparecido diario Crítica de la Argentina. Una copia del artículo publicado en ese diario el día 10/8/2008 puede encontrarse en el sitio Taringa!: bit.ly/3nCI3rr [consulta: 2/9/2011].↵
Ver, por ejemplo, Álvarez Rufs, Manuel (2018). Estado del Arte: Posverdad y Fake News. Master Thesis, Universidad Nacional de Educación a Distancia (España). Facultad de Educación. Disponible en bit.ly/30YYCUP [consulta: 8/11/2019].↵
Ver, por ejemplo, bit.ly/2SO9rnZ [consulta: 8/11/2019]. Sobre la articulación deep fake/fake news, ver, por ejemplo, bit.ly/30YYVir [consulta: 8/11/2019].↵
En relación con esta “voluntad de imitación” de las naturalezas muertas, Marita Soto enfatiza el lugar que ocupa el metadiscurso del ilusionismo en relación con el género, equivalente –según esta autora– al que ocupa el arché en la fotografía, y distingue: “En el caso del lenguaje fotográfico las características icónicas-indiciales son las que lo definen y su arché está vinculado con el ‘protocolo de existencia’ proveniente del saber del dispositivo que comporta: su arché es técnico. En cambio, en el caso de la Naturaleza muerta es un arché de tipo analítico” (Soto, 1998). De esto resulta que lo que está desafiado en el género es la percepción del ojo, antes que la mirada: “Una naturaleza muerta no nos dice nada acerca de la existencia de esos objetos, sino que lo que pone a prueba es la visión de esos objetos. Es un desafío del naturalismo que vacía la escena para que los objetos sean vistos. Es una prueba animal de la percepción, no un desafío a la percepción. El arché genera la mirada sobre el procedimiento” (Soto, 1998).↵
En su momento de surgimiento y expansión, nos hemos ocupado de algunas de las implicancias de las imágenes de modelado de espacios 3D en sitios web en Zelcer (2006).↵
Nos referimos a “Dispositivos, indicialidad y vida cotidiana”, presentado en el V Congreso Internacional de la Federación Latinoamericana de Semiótica, en el año 2002. Este artículo fue luego publicado en el libro Sobre lo televisivo, bajo el título “El muerto, el fantasma y el vivo en los lenguajes contemporáneos” (Carlón, 2004: 123).↵
Carlón está citando a Dubois, Philippe (1994). El acto fotográfico (de la representación a la recepción), Paidós, Barcelona. Edición original: 1983.↵
Carlón está citando el trabajo de Metz “Fotografía y fetiche” (1984), expuesto en una conferencia sobre la teoría del film y la fotografía en la Universidad de California, Santa Bárbara, sin referencia de edición.↵
Citado en Dubois (1990[2015]: 99). La obra referenciada es Van Lier, Henri (1981). Philosophie de la photopgraphie, Bruselas, pre-publicación de Jeunesses et Artes Plastiques.↵
Incluso si ese cuerpo sigue en la vida, en el momento de recepción de la fotografía será un cuerpo pasado: nunca tan joven como en la imagen.↵
Carlón toma esta figura de una formulación de Derrida, Jacques (1998). Ecografías de la televisión, Buenos Aires, Eudeba.↵
El mismo Carlón define los fantasmas como muertos en otro lugar de su texto: “Muertos que hablan desde donde ya no están o que se desplazan con las marcas del ‘estar vivo’ e incluso, a veces, nos interpelan” (Carlón, 2004: 132).↵
Freud no emplea la noción de “verosímil”, que nosotros tomamos de Metz (1975), pero es evidente que está refiriéndose a ello cuando habla acerca de las diferentes “convenciones” que puede adoptar un autor al crear un mundo de ficción. En uno de sus pasajes, Freud describe cómo la aparición de lo siniestro suele darse en textos en los que el verosímil o bien no termina de definirse (y se instala consecuentemente la duda acerca de si es realista o no), o bien se hace pasar por realista durante el primer tramo del discurso para después romperse con la aparición de lo espantoso en donde se esperaba lo familiar (Freud, 1919[2011]: 13). Remitimos al texto del autor para más detalles.↵
La cuestión no se agota en los verosímiles. El mismo Freud (1919[2011]) repasa extensamente distintos casos, buscando identificar los factores por los cuales una repetición o un doble de lo familiar puede aparecer o no como siniestro. Remitimos nuevamente al trabajo citado para un desarrollo sobre el tema.↵
De hecho, esta tecnología ya ha sido empleada para hacer aparecer en algunas escenas de films a actores que habían fallecido durante el rodaje. Uno de los casos más conocidos corresponde al film Rápido y furioso 7, de 2015: uno de los protagonistas tuvo un accidente fatal cuando la película aún no se había terminado de grabar, y su personaje fue añadido en algunas escenas empleando imágenes de síntesis generadas por computadora como las que hemos revisado en este capítulo (ver bbc.in/31hniIm, consulta: 14/1/2019). Los metadiscursos señalaron, en coincidencia con lo que venimos observando, que no era posible distinguir en el film las escenas efectivamente grabadas de aquellas en las que la imagen del actor había sido agregada con posterioridad. Recién pudo saberse cuáles habían sido esas escenas algunos meses después del estreno, cuando esto fue explícitamente revelado por los productores, lo que fue tematizado en algunos artículos periodísticos (ver, por ejemplo, bit.ly/2FDiRQh, consulta: 14/1/2019).↵
Puede comprobarse esto escuchando cualquier obra de música clásica solo para piano en bit.ly/2T3xWxD [consulta: 24/9/2011]. Todos los archivos tipo “midi” en ese sitio han sido generados por síntesis y, sin embargo, se escuchan como si se tratara del registro de un músico ejecutando esas obras en su piano.↵
Los señalamientos que Diego Levis realiza en general para las imágenes digitales de simulación cobrarían particular relevancia para las imágenes que estamos estudiando aquí: “El hecho de que sepamos que una imagen fotorrealista, de un naturalismo perfecto y preciso, puede representar algo que jamás ha tenido existencia física, modifica la manera de mirar imágenes como testimonio de aquello que ha sucedido o existido” (Levis, 2014: 205).↵

Título de la publicación	Devenires de lo fotográfico
Subtítulo de la publicación	Imágenes digitales en los dispositivos contemporáneos
Autor	Mariano Zelcer
Título del capítulo	El cruce del valle misterioso
Fecha	diciembre 17, 2020
Cantidad de páginas	356
ISBN del libro impreso	9789877232738
Keywords/Tags	fotografía, posfotografía, dispositivo, realidad virtual, semiótica, comunicación
DOI	10.55778/ts877232738
Copyright	2021
Imagen de tapa	Carolina Chebi

Mariano Zelcer

Nuestros cursos:

Nuestros cursos:

4 El cruce del valle misterioso^[1]

4.1. Introducción

4.2. Primera aproximación: el estatuto semiótico

4.3. Segunda aproximación: la duda

4.4. Tercera aproximación: el engaño

4.5. Cuarta aproximación: el trompe–l’œil

4.6. Quinta aproximación: la temporalidad del cuerpo, la vida, la muerte

4.7. Conclusiones

Bibliografía del capítulo 4

Deja un comentario Cancelar respuesta

Índice

Mariano Zelcer

Nuestros cursos:

Nuestros cursos:

4 El cruce del valle misterioso[1]

4.1. Introducción

4.2. Primera aproximación: el estatuto semiótico

4.3. Segunda aproximación: la duda

4.4. Tercera aproximación: el engaño

4.5. Cuarta aproximación: el trompe–l’œil

4.6. Quinta aproximación: la temporalidad del cuerpo, la vida, la muerte

4.7. Conclusiones

Bibliografía del capítulo 4

Deja un comentario Cancelar respuesta

Índice

4 El cruce del valle misterioso^[1]