Reflexiones en torno al cuidado
de los datos científicos
Carolina Rosas
El movimiento por la “transparencia” está sacudiendo el mundo de la investigación cualitativa, anuncia, con cierta preocupación, Randol Contreras (2019) en referencia a las crecientes presiones que viene sufriendo la comunidad científica para hacer públicos los datos primarios de investigación. Si bien este debate transcurre principalmente en los países del norte global, ya se ha asomado en nuestro contexto. Se trata de una discusión que está asociada a un cambio sistémico, como argumenta Han (2014, p. 12): “[q]uien refiere la transparencia tan sólo a la corrupción y a la libertad de información desconoce su envergadura. La transparencia es una coacción sistémica que se apodera de todos los sucesos sociales y los somete a un profundo cambio”. Se relaciona, especialmente, con los avances tecnológicos y la consolidación de una economía del dato (el “nuevo petróleo”, en palabras de CEO especializados). De hecho, bloques como el europeo y países como Estados Unidos están creando leyes de gobernanza de datos de manera vertiginosa, viendo en ello la generación de riqueza multimillonaria[1]. Simultáneamente, hay una industria del dato en pleno desarrollo, compuesta por empresas tecnológicas, alianzas y redes de organizaciones internacionales que construyen infraestructuras en la web, diseñan criterios y “buenas prácticas” para el almacenamiento de datos, crean repositorios y revistas de datos, a la vez que venden sus servicios a los sectores privados y públicos. En consonancia, se ha comenzado a hablar de un nuevo paradigma de ciencia abierta, denominación que parece sugerir que hasta ahora el campo científico hubiese estado cerrado sobre sí, opaco e indiferente a las necesidades de las poblaciones, sin conexión con los sectores público, privado y sociocomunitario.
Enmarcado en estos antecedentes, este texto se interesa por el cuidado de los datos primarios que construimos en nuestras investigaciones, y las tensiones que se han generado a partir de la irrupción en el terreno científico del llamado “movimiento por la transparencia”. Luego de introducir el tema y mostrar sus rastros en nuestro contexto, pasaré a describir brevemente los orígenes de esta discusión y a enumerar las ventajas que algunos autores del norte global ven en la apertura de los datos primarios (open data), para luego reflexionar acerca de los vastos argumentos en contrario y las consecuencias negativas que podrían derivarse de ello[2].
En esta oportunidad, me concentraré en los datos de índole cualitativa del campo de las ciencias sociales, producidos por la ciencia pública. Siguiendo al Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) de Argentina, entiendo por dato primario a
todo dato en bruto sobre los que se basa cualquier investigación y que puede o no ser publicado cuando se comunica un avance científico pero que son los que fundamentan un nuevo conocimiento. […]. Se consideran datos primarios, por ejemplo, a: registros numéricos, registros textuales, imágenes y/o sonidos, que se utilizan como fuentes primarias para la investigación científica, y que son comúnmente aceptados en la comunidad para validar los resultados de la investigación[3].
Se dice que estos datos “están abiertos” cuando existe libertad para utilizarlos, reutilizarlos y redistribuirlos (Aleixandre-Benavent et al., 2021, p. S209).
De entrada, conviene aclarar que estoy a favor de las políticas de acceso abierto referidas a las publicaciones científicas; sin embargo, la apertura de los datos primarios despierta suspicacias e interrogantes. Entre quienes se han opuesto con mayor ahínco, se encuentran los/as antropólogos que estudian poblaciones y conductas criminales/criminalizadas.
We must try to keep our participants safe from uninvited harm and scrutiny, whether from law enforcement, friends, relatives, or criminal peers. We must also respect their privacy and not provoke a pouring in of academic outsiders or curiosity seekers who want to meet and observe the participants firsthand. As a crime researcher, I cannot think of a complete way to reconcile such safety and privacy concerns with the transparency movement, which demands or pressures researchers to make all their data public [Debemos intentar mantener a nuestros participantes a salvo de daños y escrutinios no deseados, ya sea por parte de las fuerzas de seguridad, amigos, familiares o compañeros criminales. También debemos respetar su intimidad y no provocar una avalancha de académicos extraños o curiosos que quieran conocer y observar a los participantes de primera mano. Como investigador del crimen, no se me ocurre una forma completa de conciliar estas preocupaciones por la seguridad y la privacidad con el movimiento a favor de la transparencia, que exige o presiona a los investigadores para que hagan públicos todos sus datos] (Contreras, 2019, p. 308).
A diferencia de Contreras (2019), yo no trabajo con poblaciones o conductas criminales, sino que me enfoco en poblaciones migrantes, con frecuencia criminalizadas en los países de tránsito y destino. En las últimas décadas, y de manera alarmante en la actualidad, se han reforzado discursos xenófobos y leyes restrictivas que promueven la criminalización y persecución de la población migrante, así como su exclusión del campo de los derechos (Domenech y Dias, 2020; Rosas y Gil Araujo, 2022, entre otros). Precisamente, comparto la preocupación de Contreras porque las personas marcadas como “criminales” y aquellas a quienes se les atribuye un carácter criminal (“criminalizadas”) suelen correr con suertes similares. Además, en nuestra línea de indagación –las luchas y resistencias migrantes–, abundan los nombres propios. Con frecuencia trabajamos con actores colectivos e individuales reconocidos en el ámbito público (asociaciones de/para/con migrantes, referentes sociales, líderes y lideresas migrantes, entre otros) que son críticos del Estado y de otros actores poderosos. Es necesario discutir de qué manera este enfoque de la transparencia podría perjudicarles en nuestro contexto.
Como dije antes, estas discusiones no nos son ajenas. De hecho, estas notas se motivan en diversas experiencias recientes, en algunas de las cuales junto a otras/os colegas fuimos construyendo argumentos que también retomaré aquí. En primer lugar, la lucha colectiva desarrollada entre 2019 y 2022 a favor de la anonimización del último Censo Nacional en Argentina (Rosas, Penchaszadeh y Mazzeo, 2023). En esa ocasión defendimos que cualquier
registro estatal entraña siempre un intercambio de información entre los individuos y el Estado, que debe ser legitimado con base en ciertos fines específicos, procurando no romper el equilibrio entre cuidado y control estatal, por un lado, y los derechos y garantías, por el otro (2023, p. 244),
lo cual también es un buen punto argumental para la discusión que presento aquí. En segundo lugar, durante el año 2021, acompañé a una organización de la sociedad civil en la realización de una consultoría, financiada por un ministerio nacional y un organismo internacional. Ante estas dos últimas entidades, demostramos los riesgos de entregarles datos primarios de tipo cuantitativo y cualitativo en los cuales figuraba información sensible y personal de lideresas indígenas y migrantes. En tercer lugar, algunas revistas científicas han comenzado a exigir la “publicación del conjunto de datos que fueron recolectados en el proceso de investigación” (Varela-Briceño, 2023, p. 3), lo cual crea incertidumbre sobre el uso que harán de nuestros datos y la posición de poder que se arrogan. En cuarto lugar, el recientemente creado Repositorio de Datos de Investigación de CONICET, para su consulta libre y gratuita, que ha generado interrogantes en la comunidad científica argentina acerca de su implementación y sus consecuencias[4]. En quinto lugar, los intercambios con colegas y tesistas que deciden explicitar en sus publicaciones los nombres propios de referentes/as migrantes cuando estos así lo solicitan, fruto de una reflexión conjunta, porque entienden que ello es una estrategia emancipadora y reconocedora de la agencia de estas personas. Si bien no trataré las cuestiones de la privacidad y confidencialidad en las publicaciones, claramente se trata de discusiones emparentadas con el cuidado de los datos primarios[5].
Cada investigador/a tomará la decisión que crea conveniente respecto de cómo deben tratarse los datos primarios, y de la cuestión de la anonimización en las publicaciones. Pero, indudablemente, cualquier decisión debe ser informada y contextualizada. No podemos ignorar que la creciente cultura de rendición de cuentas y auditoría en la investigación académica está afectando cada vez más nuestro trabajo (Pool, 2017), sin reciprocidad y con frecuencia sin razonabilidad. A su vez, este debate parece olvidar que “toda investigación es una construcción teórica” (Sautu, 2005, p. 9) y que un dato científico –cualitativo o cuantitativo– es un constructo teórico-metodológico que no puede ser escindido del contexto sociohistórico en que fue producido.
Para aportar, procuro introducir solo algunas dimensiones de esta discusión que por ahora se da principalmente en los países del norte, y que por supuesto merece mayor desarrollo del que puedo ofrecer aquí. Con relación a la revisión bibliográfica, no me orienté por el criterio de exhaustividad, sino por el de suficiencia. Entiendo que la revisión de los antecedentes constituye un estudio detallado, selectivo y crítico que integra la información esencial en una perspectiva unitaria y de conjunto, con el fin de situarla en cierto enfoque teórico (Guirao Goris, 2015). Así, partiendo de la teoría fundamentada y el criterio de saturación teórica (Glaser y Strauss, 1967; Flick, 2004), apliqué el criterio de saturación de la información bibliográfica. Es decir, recopilé un conjunto de antecedentes que, de manera suficiente debido a los fuertes acuerdos hallados a su interior, permitió sostener las argumentaciones que presento en estas páginas.
¿Ciencia honesta y ciencia corrupta?
“La omnipresente exigencia de transparencia, que aumenta hasta convertirla en un fetiche y totalizarla, se remonta a un cambio de paradigma que no puede reducirse al ámbito de la política y de la economía”, sentencia Han (2014, p. 12). En efecto, el movimiento por la transparencia es una iniciativa global que también afecta al campo científico. Se trata de un proceso aglutinador de diversos colectivos, con distintos intereses y orientaciones políticas –de derechos civiles, ambientales, de libertad de expresión, etc.–, que se terminó de consolidar hacia finales del siglo xx: “… en un contexto internacional marcado por el derrumbe del campo socialista, la expansión del libremercado y la instalación de un clima cultural tendiente al pensamiento único asistimos a la consolidación de un consenso anticorrupción a escala mundial” (Toyos, 2021, p. 14). El emergente más notable de este movimiento fue la creación en 1993 en Alemania de Transparency International. A Global Coalition against Corruption, que se ha configurado como una de las organizaciones más poderosas de Occidente. Entre sus fundadores destacan un exdirector del Banco Mundial, un asesor del mismo banco y un exmiembro de los servicios de inteligencia de Estados Unidos. No es el fin de este texto detenerme en esta organización, pero quisiera señalar que sus metodologías para medir la corrupción, así como los argumentos que construye y su poder de presión en los países empobrecidos, cuentan con importantes críticas (Bratsis, 2003; Cobham, 2013; Toyos, 2021; Pereyra, 2008; entre otros).
El llamamiento a la transparencia dentro del mundo de la investigación cualitativa coincidió con la controversia protagonizada por Alice Goffman, quien en 2014 publicó la etnografía On the Run: Fugitive Life in an American City. Roldán (2021) explica que la manera en que Goffman construyó su relato, con pasajes narrativos algo confusos, podría explicar las dudas que aparecieron hacia la veracidad de los acontecimientos relatados. La autora recibió una crítica anónima en su lugar de trabajo que debió responder, y se filtraron datos de quienes participaron en el trabajo de campo. Esta discusión llegó a los medios de comunicación. De hecho, el periodista Singal (2015) visitó el barrio donde se había realizado la etnografía, exponiendo a los transeúntes una fotografía de Goffman y preguntándoles si la reconocían. El periodista pudo conocer a algunas de las personas que habían participado en la investigación, y, de esa manera, escribió una nota donde confirmaba que Goffman efectivamente había trabajado en ese barrio.
En la práctica, las políticas de intercambio de datos o de open data que se conocen hasta el momento en países como Estados Unidos fueron desarrolladas para almacenar datos cuantitativos, sin considerar las especificidades de los diseños de los estudios cualitativos y de métodos mixtos. Como explican Tsai et al. (2016), no está todavía claro en qué medida los/as investigadores/as de métodos cualitativos y mixtos deben adherir a ese tipo de políticas. Sin embargo, para autoras como Saunders (2014, p. 689), “[s]i se acepta la lógica que subyace a las nuevas normas de transparencia y reproducción en la investigación cuantitativa, es difícil no estar de acuerdo en que dichas normas también deberían regir la investigación cualitativa”. Interpreto que para ella la cuestión es simple: al mundo cualitativo deben aplicarse las mismas reglas que al cuantitativo, dando por sentado la primacía de este último.
Moravcsik (2022, p. 176) ha sido uno de los defensores más importantes de la “revolución de la transparencia” en la investigación cualitativa y de la creación de repositorios de datos. En su opinión, se han suscitado dudas sobre la legitimidad y la credibilidad de los estudios académicos porque no se publican resultados contradictorios, por la proliferación de citas poco informativas o inexactas[6], todo ello en un entorno mediático que privilegia las noticias falsas y el sensacionalismo por encima de los hechos rigurosamente fundamentados. Para este autor las “buenas prácticas” de transparencia permitirían que los/as investigadores/as sean más responsables, y que otras personas (re)analizaran o determinaran la precisión empírica de un estudio.
Qualitative researchers who conduct case studies, collect archival or interview data, and do ethnography, participant observation, or other types of nonquantitative studies are no exception. They have been developing specific standards and techniques for enhancing transparency, including some that exploit digital technology. Reputable research now requires more than solid empirical evidence, state-of-the-art theory, and sophisticated methods: It must be transparent [Los investigadores cualitativos que realizan estudios de caso recopilan datos de archivos o entrevistas y hacen etnografía, observación participante u otros tipos de estudios no cuantitativos no son una excepción. Han ido desarrollando normas y técnicas específicas para mejorar la transparencia, incluidas algunas que aprovechan la tecnología digital. Hoy en día, la investigación fiable requiere algo más que pruebas empíricas sólidas, teoría de vanguardia y métodos sofisticados: debe ser transparente] (Moravcsik, 2022, p. 176).
En varios de los textos revisados, se sostiene que la accesibilidad y la verificación podrían contribuir a la credibilidad de la ciencia. En mi opinión, en muchos de ellos, se traza una relación concomitante entre accesibilidad y calidad de los datos que, en la práctica, está lejos de verificarse. Que una base de datos cuantitativos o un conjunto de entrevistas estén puestas a disposición de todo el mundo no significa que su calidad esté probada.
Otras de las justificaciones a las que se apela, según Contreras (2019), es que la puesta a disposición de los datos primarios permite el ahorro, ya que otras personas podrían realizar nuevos análisis sin tener que recopilar nuevos datos, a la vez que alentaría la diversidad de análisis, opiniones y aplicación de más metodologías. A su vez, se dice que los proyectos y equipos que hayan producido los datos podrían verse beneficiados con mayor visibilidad, ya que serían citados por quienes utilicen sus datos. Claro que, para que eso suceda, quien reutilice los datos debe tener la buena voluntad de citar la fuente.
No dudo que, si alguien por fuera de las ciencias sociales lee algunos de los textos acá citados, creerá que asistimos a una pandemia de corrupción cualitativa. Una de las propuestas más osadas para contrarrestar la sospecha es la de construir “citas activas” (Moravcsik, 2022, p. 177). Según entiendo, esto consistiría en colocar una nota después de cada afirmación realizada en un artículo, la cual dirigiría a los/as lectores/as a los datos relevantes alojados en un repositorio (las palabras de las personas entrevistadas, observaciones, documentos, etc.) que “verificarían” la afirmación en cuestión, como si una interpretación compleja, un concepto o una hipótesis pudieran ser igualados a un enunciado cuyas partes derivan directamente (y solamente) de algunas respuestas textuales de entrevistas.
Ante este tipo de propuestas, Contreras (2019, p. 309) sugiere cuidar las maneras de revelar los sitios donde se realizó el trabajo de campo y los participantes (divulgación semibiográfica), omitiendo estratégicamente algunos datos en los retratos biográficos y realizando una divulgación parcial del área de estudio. También propone invitar a otros académicos/as a conocer a los/as participantes en el campo, como si se tratara de un testigo del trabajo de investigación realizado. Aun así, los/as autores/as que realizan propuestas para acercar las exigencias de la transparencia a las lógicas de los estudios cualitativos admiten que no están resueltos los inconvenientes que se mencionan en el próximo apartado.
Críticas e inconvenientes de la “libre”[7] disponibilidad de los datos primarios
Como dije al inicio, existen diversos posicionamientos respecto de los repositorios de datos primarios de acceso abierto. Aun quienes ven algunos puntos favorables (Saunders, 2014; Reyes, 2017) no dejan de mencionar numerosos inconvenientes.
… compartir datos también tiene inconvenientes. Uno de los más informados por los investigadores es el temor de que otros puedan hacer un uso fraudulento de sus datos sin el debido reconocimiento. Muchos investigadores desconfían de liberar los datos detallados por miedo a que análisis externos de otros puedan contradecir las interpretaciones iniciales. La publicación de estudios adicionales incorrectos crearía una espiral de confusión que desorientaría a la comunidad científica internacional y la distraería de otras labores. También manifiestan que no existen las infraestructuras necesarias para llevar a cabo el depósito de datos ni disponen de tiempo para llevar a cabo esta práctica. Por otra parte, aún no existen suficientes acuerdos para establecer la normativa que debe regular todo el proceso, como las reglas sobre los formatos de los datos, o el tipo de información contextual que debe acompañarlos para su identificación o metadatos. Otros obstáculos tienen que ver con aspectos legales (sobre todo, derechos de autor y protección de la intimidad de las personas) (Aleixandre-Benavent et al., 2021, p. S210).
Pool (2017) acota que la perspectiva de almacenamiento público, verificación y posible reutilización fuera del control de los/as investigadores/as y de sus entrevistados/as afectaría la forma en que se recogen y registran los datos, así como la disposición a dialogar de cuestiones delicadas o peligrosas[8]. Hay preocupaciones éticas centrales, ya que los repositorios de datos públicos pueden exponer información confidencial de los/as participantes[9]. Además, de esa manera se impediría que los/as participantes ejerzan una negación plausible (plausible deniability), es decir, se afectaría su capacidad de negar su participación en la investigación (Reyes, 2017), si así quisieran hacerlo en el futuro.
Contreras (2019) señala que también podría haber sesgos de selección en el material compartido, ya que los/as académicos/as podrían proporcionar solo los datos que respalden su análisis, y también podrían omitir algunos materiales por temor a causar daño a quienes participen. Como ya dije, hacer que los datos sean accesibles no evitaría necesariamente los sesgos. En definitiva, si no se confía en las investigaciones cualitativas publicadas, ¿por qué se confiaría en los datos alojados en un repositorio?
Otra de las críticas al almacenamiento de datos primarios se centra en la inexistencia de marcos legales o la contradicción con marcos legales y éticos preexistentes. En el caso de Argentina, todavía podemos ampararnos en la Ley 25.326 de Protección de Datos Personales, así como en el comité de ética y los lineamientos éticos[10] de CONICET, que rigen la relación que establecemos con las personas que participan de nuestras investigaciones en ciencias sociales y humanidades. En mi interpretación de dichos lineamientos, queda claro que es nuestra responsabilidad cuidar la confidencialidad en las publicaciones y asegurar la no distribución de los datos primarios. A su vez, en el plano internacional, distintas resoluciones de Naciones Unidas resaltan los riesgos especiales de líderes sociales y organizaciones de derechos humanos (Res. 69-166), entre los que hay personas migrantes, a la vez que se llama la atención sobre las consecuencias de la recopilación de datos personales a gran escala (Res. 68-167 y 69-166). Es decir, hay normativas nacionales e internacionales que pueden invocarse para cuestionar los repositorios digitales de datos primarios.
Por otra parte, los distintos autores coinciden en que preparar los datos para el acceso público puede consumir un tiempo considerable. Esto lo ejemplifica Snyder (2014, p. 709), quien se tomó el trabajo de ejercitar el uso de citaciones activas. Además, concluye que la citación activa no es una “bala de plata” de la inferencia causal, y no es una herramienta más importante que otras para demostrar el rigor de la investigación cualitativa en ciencias políticas. De hecho, Snyder se pregunta: ¿debería ser la cita activa el principal distintivo del rigor profesional, o debería invertirse el tiempo y la formación en teorías mejor construidas, casos más cuidadosamente seleccionados, más trabajo de campo, una mejor integración de estadísticas y casos…? Hablando de tiempo, aprovecho para preguntar: ¿deberíamos hacer todo ese trabajo extra sin recibir honorarios específicos para ello? Ante los magros salarios de los/as científicos/as de países empobrecidos, esa es una pregunta muy importante.
Considero que una de las críticas fundamentales a la reutilización de datos producidos por otros/as investigadores/as tiene que ver con el desconocimiento (parcial o total) de los constructos teórico-metodológicos que permitieron su producción. Incluso, el open data permitiría que fueran reutilizados por alguien que no comparte dichos constructos, lo cual en mi opinión es un acto de negligencia. En definitiva, es ingenuo pretender que los datos “hablen por sí mismos”.
Los datos sólo logran hablar cuando la teoría les aporta el don del lenguaje. Lo que suele ocurrir es que la indiferencia ante las cuestiones teóricas y su papel en la investigación social –y por lo tanto en la creación del dato– alienta la creencia bárbara de que el mismo es un producto neutro, un límpido espejo en el cual se refleja la realidad social, cuando en verdad es el resultado de una teoría y una metodología que lo construyeron y le dieron vida (Borón, 2005, p. 14).
Por otro lado, es igualmente preocupante la reutilización cuando se desconoce el contexto –social, económico, cultural, político, etc.– de donde proceden los datos. Más allá de que en el repositorio los datos sean acompañados por algunas referencias al respecto, lo cierto es que es difícil interpretarlos si no “estuvimos ahí”, si no conocemos de primera mano a los actores e instituciones del lugar, sus problemas, necesidades y creencias, su capacidad de agencia, sus deseos, etc. Se preguntan Tsai et al. (2016, p. 2-3), ¿qué significan estos datos para un investigador externo que podría no tener el mismo tipo de experiencias culturales y que habría recopilado los datos de forma diferente?
En esta línea, Pool (2017) abiertamente dice que la creación de un repositorio público no es el camino por seguir. Para él, los datos etnográficos “duros” (documentos, fotografías, videos, grabaciones, objetos, etc.) son parciales, y cualquier reutilización o reinterpretación de ellos resulta difícil en ausencia del componente “blando” (plano subjetivo experiencial, sensibilidad y memoria del investigador, etc.), imposible de guardar en un repositorio. Este autor también realiza propuestas de transparencia, aunque estas se asemejan mucho a las maneras en que la mayoría de nosotras/os hacemos nuestro trabajo. Primero, recomienda que sigamos almacenando sistemáticamente los datos científicos en espacios físicos o digitales seguros, para que eventualmente puedan ser consultados. Segundo, que dediquemos espacio en las publicaciones para detallar los trabajos de campo, las personas involucradas, los métodos utilizados para recopilar datos, etc. Según el autor, no abundar al respecto puede producir desconfianza en los datos y en las interpretaciones que realizamos. Tercero, que presentemos más datos textuales en las etnografías, es decir, pasajes sustanciales de los discursos y las observaciones que hemos registrado. De este modo, una mayor parte de los datos estaría publicada y abierta a algún tipo de verificación.
Por otro lado, Van de Port (2017) se pronuncia en contra de lo que considera una especie de “desconfianza institucionalizada” y de fantasías burocráticas que creen que un control cada vez más estricto podría aumentar la confiabilidad de las investigaciones. Acepta que a veces se cometen errores, se embellecen las experiencias del trabajo de campo, pero también añade que la comunidad científica –cada vez más numerosa, interconectada y crítica– ya ha demostrado ser capaz de desenmascarar tales extravíos. Aun así, el autor entiende que los tiempos han cambiado. Al aceptar que ahora hay más necesidad de chequear la veracidad de todo lo que se comunica (comenzando por las noticias), indica que es necesario explicitar claramente que los resultados de la investigación están “empíricamente fundamentados”, aunque eso nunca puede implicar un retorno a una aceptación acrítica de “los hechos, puros y simples”, o un rechazo de las ideas de los teóricos posestructuralistas. Es decir, el autor se inclina por imaginar una “rendición de cuentas” más ligada a la calidad de las investigaciones que a la accesibilidad. En definitiva, la cuestión de la rendición de cuentas no es nueva, dice el autor. Siempre ha estado presente y forma parte de nuestro trabajo: cuando, a partir de elaboraciones propias y de la crítica externa, nuestros pensamientos y observaciones son cuestionados, matizados, reorientados, rechazados o sustituidos por otros mejores.
Finalmente, la discusión sobre la apertura de datos primarios requiere considerar el contexto tecnológico actual y sus imperiosas necesidades de datos. Entiendo, como indica Vercelli (2021, p. 112), que
[l]as crecientes y, muchas veces, compulsivas capacidades de extracción (recolección, procesamiento, archivo y explotación) de grandes datos alcanzadas por algunos Estados y sus corporaciones tecnológicas están planteando nuevos y complejos desafíos para los derechos humanos y las democracias representativas en el siglo xxi.
Para Pasquinelli y Joler (2021), estamos ante un régimen corporativo de extracción del conocimiento y colonialismo epistémico, asentado en poderosos algoritmos de aprendizaje maquínico (machine learning). Así, se comprende tanto la necesidad de datos para propiciar ese aprendizaje maquínico, como que la creación de reservorios abiertos es perfectamente funcional al extractivismo de datos; de hecho, es una forma de legitimarlo y legalizarlo (ni siquiera serían necesarios ciberataques y hackeos). Cabe preguntarse, además, cuáles serán las consecuencias de que los datos primarios científicos sean también accesibles a interpretaciones realizadas por inteligencias artificiales, prescindiendo así del quehacer de las personas científicas.
Discusión final
Este capítulo procuró recuperar las discusiones que tienen lugar en los países del norte acerca de las crecientes presiones que viene sufriendo la comunidad científica para que haga públicos sus datos primarios. Si bien la exigencia de transparencia afecta a todas las ciencias, incluso a las que experimentan en laboratorios y a las matemáticas, tiene sus particularidades en las sociales y humanidades, en especial cuando producen datos cualitativos. Encuentro mucho sentido en las posiciones críticas que expuse en el último apartado, aunque entiendo que deben ser repensadas a la luz de nuestro contexto académico. De las diferentes propuestas críticas, sobresale que, si se trata de procurar más transparencia, debemos hacerlo en nuestras publicaciones, comunicando detalladamente nuestros diseños teórico-metodológicos, las herramientas y los recursos puestos en juego, argumentando las decisiones que tomamos en los trabajos de campo, entre otros aspectos. Ello permitirá a los/as lectores una mayor comprensión de los procesos de construcción de nuestros datos.
Finalmente, considero que cualquier reflexión de este tipo debería recuperar los debates paradigmáticos ocurridos desde comienzos del siglo xx, al menos (Cortés, 2003; Cohen y Piovani, 2007). Esos antecedentes tienen centralidad política en este momento de la historia, cuando son de gran utilidad para defender a las ciencias sociales, y a sus maneras de construir y validar la evidencia científica. Por ejemplo, cobran relevancia la autocrítica realizada al interior de las filas positivistas, las novedades que introdujo el pospositivismo y los consensos con el constructivismo; los acercamientos paradigmáticos alrededor de los planos ontológico, axiológico y epistemológico; qué entendemos ahora por conocimiento objetivo, y el acuerdo entre subjetividades como basamento de él; el reconocimiento del importante papel que juegan los marcos teóricos, los valores y los sentidos, tanto en investigaciones cuantitativas como cualitativas; las posibilidades de generalizar en los estudios cualitativos y la necesidad de diferenciarlo de la idea de representatividad estadística; las maneras de relacionarnos –en cuanto investigadores/as– con quienes (co)participan en nuestros estudios, reconociendo su poder y empleando una praxis ética, entre otros (Cortés, 2003). Si bien los consensos son siempre provisorios, constituyen un punto de partida ineludible de los desafíos presentes. En definitiva, y aunque suene a verdad de Perogrullo: ¡leamos a los/as pioneros/as epistemólogos/as y metodólogos/as para comprender, enfrentar y construir nuevos argumentos ante los dilemas del presente! No dejemos que este debate conveniente sobre la supuesta opacidad de las ciencias sociales, y en particular de la investigación cualitativa, esconda tanto los intereses económicos que despiertan nuestros datos, como el recelo que produce nuestra capacidad crítica. No permitamos que el llamamiento a la transparencia nos haga trampa.
Referencias bibliográficas
Aleixandre-Benavent, R., Ferrer Sapena, A. y Peset, F. (2021). Compartir los recursos útiles para la investigación: datos abiertos (open data). Educación Médica, (22), S208—S215. En www.sciencedirect.com/science/article/pii/S1575181319301287.
Borón, A. (2005). Prólogo. En R. Sautu, P. Boniolo, P. Dalle y R. Elbert, Manual de Metodología: construcción del marco teórico, formulación de los objetivos y elección de la metodología (pp. 13-20). CLACSO.
Bratsis, P. (2003). Corrupt Compared to What? Greece, Capitalist Interests, and the Specular Purity of the State. London School of Economics and Political Science. The Hellenic Observatory. En eprints.lse.ac.uk/5696/1/Corrupt_compared_to_what.pdf.
Cobham, A. (2013). Corrupting Perceptions. Why Transparency International’s flagship corruption index falls short. Foreign Policy. En foreignpolicy.com/2013/07/22/corrupting-perceptions.
Cohen, N. y Piovani, J. (2007). Producción y reproducción de sentidos en torno a lo cualitativo y lo cuantitativo en sociología. En N. Cohen y J. Piovani (Comps.), La metodología de la investigación en debate (pp. 121-196). Eudeba y Editorial de la Universidad de La Plata.
Contreras, R. (2019). Transparency and Unmasking Issues in Ethnographic Crime Research: Methodological Consideration. Sociological Forum, 34(2), 293-312. En onlinelibrary.wiley.com/doi/abs/10.1111/socf.12498.
Cortés, F. (2003). Algunos aspectos de la controversia entre investigación cualitativa e investigación cuantitativa. En A. Canales y S. Lerner Sigal (Coords.), Desafíos teórico-metodológicos en los estudios de población en el inicio del milenio (pp. 131-157). El Colegio de México, Universidad de Guadalajara y SOMEDE.
Domenech, E. y Dias, G. (2020). Regimes de fronteira e “ilegalidade” migrante na América Latina e no Caribe. Sociologias, 22(55), 40-73. En doi.org/10.1590/15174522-108928.
Guenther, K. (2009). The Politics of Names: Rethinking the Methodological and Ethical Significance of Naming People, Organizations, and Places. Qualitative Research 9(4), 411-421. En doi.org/10.1177/1468794109337872.
Han, B. C. (2014). La sociedad de la transparencia. Herder.
Jerolmack, C. y Murphy, A. (2017). The Ethical Dilemmas and Social Scientific Trade-Offs of Masking in Ethnography. Sociological Methods and Research. En doi.org/10.1177/0049124117701483.
Meo, A. I. (2010). Consentimiento informado, anonimato y confidencialidad en investigación social. La experiencia internacional y el caso de la sociología en Argentina. Aposta. Revista de Ciencias Sociales, (44), 1-30.
Moravcsik, A. (2022). The Transparency Revolution in Qualitative Social Science: Implications for Policy Analysis. En J. Widner, M. Woolcock y D. Ortega Nieto (Eds.), The Case for Case Studies: Methods and Applications in International Development. Strategies for Social Inquiry (pp.176-192). Cambridge University Press.
Pasquinelli, M. y Joler, V. (2021). El Nooscopio de manifiesto. La inteligencia artificial como instrumento de extractivismo del conocimiento. LaFuga, (25), 1-20. En lafuga.cl/el-nooscopio-de-manifiesto/1053.
Pereyra, S. (2013). Política y transparencia. La corrupción como problema público. Siglo XXI.
Pool, R. (2017). The Verification of Ethnographic Data. Ethnography, 18(3), 281-286. En doi.org/10.1177/1466138117723936.
Reyes, V. (2017). Three Models of Transparency in Ethnographic Research: Naming Places, Naming People, and Sharing Data. Ethnography, 19(2), 204-226. En doi.org/10.1177/1466138117733754.
Roldán, N. (2021). Las cosas son más fáciles de decir que de hacer: Dilemas y controversias etnográficas sobre On the Run de Alice Goffman. Cuestiones Criminales, 4(7/8), 461-484. En ri.conicet.gov.ar/handle/11336/164120.
Rosas, C. y Gil Araujo, S. (2022). Régimen generizado de control migratorio y fronteras. La producción de expulsabilidad en Argentina (2010-2020). Estudios Fronterizos, (23). En doi.org/10.21670/ref.2220104.
Rosas, C., Penchaszadeh, A. y Mazzeo, V. (2023). La lucha por un censo nacional anónimo en la Argentina. Reflexiones desde la mirada de las migraciones internacionales. En B. Baeza, B. Matossian e I. Barelli (comps.), (In)movilidades e impactos del COVID-19 en las migraciones y los territorios (pp. 243-258). Ed Teseo. En https://tinyurl.com/5n72hwj8.
Rovetta Cortés, A. I. (2022). En las letras de rosa está la rosa. El uso de pseudónimos como dilema ético. Revista Latinoamericana de Metodología de la Investigación Social – ReLMIS, (24), 39-54. En ri.conicet.gov.ar/handle/11336/210917.
Santi, M. F. (2016). Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social. Revista de Bioética y Derecho, (37), 5‐21. En scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1886-58872016000200002.
Saunders, E. (2014). Transparency Without Tears: A Pragmatic Approach to Transparent Security Studies Research. Security Studies, 23(4), 689-698. En doi.org/10.1080/09636412.2014.970405.
Sautu, R. (2005). Todo es teoría: objetivos y métodos de investigación. Lumiere.
Singal, J. (2015). The Internet Accused Alice Goffman of Faking Details in Her Study of a Black Neighborhood. I Went to Philadelphia to Check. The Cut. En www.thecut.com/2015/06/i-fact-checked-alice-goffman-with-her-subjects.html.
Snyder, J. (2014). Active Citation. In Search of Smoking Guns or Meaningful Contexts? Security Studies, 23(4), 708-714. En doi.org/10.1080/09636412.2014.970409.
Toyos, F. (2021). Cuando las cosas no son lo que parecen: Acerca de los estudios sobre la corrupción y los índices de percepción de la corrupción. Revista Pilquen, 24(2), 13-23. En https://tinyurl.com/4jej6kt6.
Tsai, A., Kohrt, B., Matthews, L., Bentancourt, T., Lee, J., Papachristos, A., Weiser, S. y Dworkin, S. (2016). Promises and Pitfalls of Data Sharing in Qualitative Research. Social Science & Medicine, (169), 191-198. En doi.org/10.1016/j.socscimed.2016.08.004
Van de Port, M. (2017). The Verification of Ethnographic Data: A Response. Ethnography, 18(3), 295-299. En doi.org/10.1177/1466138117722799.
Varela-Briceño, M. (2023). La publicación de los conjuntos de datos por medio de las revistas científicas: el caso de Pensar en Movimiento. Pensar en Movimiento: Revista de Ciencias del Ejercicio y la Salud, 21(1), 1-6. En https://tinyurl.com/3fxjhdfm.
Vercelli, A. (2021). El extractivismo de grandes datos(personales) y las tensiones jurídico-políticas y tecnológicas vinculadas al voto secreto. THĒMIS. Revista de Derecho, (79), 111-125. En ri.conicet.gov.ar/handle/11336/171030.
- A modo de ejemplo, la Comisión Europea promueve la creación de un mercado único de datos para permitir que estos “fluyan libremente por la Unión y de unos sectores a otros, en beneficio de las empresas, el personal investigador y las administraciones públicas” (https://tinyurl.com/4hyus53f). ↵
- Este texto se elaboró en el marco del proyecto de investigación PIP 2023-2025 11220220100208CO, RESOL-2024-436-APN-DIR#CONICET, “Control migratorio y luchas migrantes desde una perspectiva de género. Un análisis desde Gran Buenos Aires y Gran San Salvador de Jujuy”, dirigido y codirigido por Sandra Gil Araujo y Carolina Rosas respectivamente.↵
- A los fines de esta discusión, también considero datos primarios a aquellos que Conicet denomina datos procesados y datos analizados. Puede profundizarse en ri.conicet.gov.ar/wp/ayuda/datos-de-investigacion.↵
- El Repositorio Institucional CONICET Digital se creó en agosto de 2015, para dar cumplimiento a la Ley 26.899/2013.↵
- Al respecto, recomiendo los artículos escritos por Guenther (2009), Meo (2010), Santi (2016) y Rovetta (2022). En este último, la autora presenta una revisión bibliográfica exhaustiva acerca de la pseudonimización, y advierte que, en los casos en que se decida develar los nombres, igualmente se recomiendan ciertos recaudos, como el de “valorar si, con el paso del tiempo, la información que hayan compartido podría perjudicar a los participantes de estudio que deseen revelar su identidad” (Rovetta, 2022, p. 46). En mi opinión, es relevante considerar la dificultad, si no imposibilidad, de valorar el contexto de utilización de los datos, ya que eso involucra al siempre impredecible futuro. ↵
- Quisiera acotar que las afirmaciones de este autor no pueden generalizarse, al menos no me constan en el contexto en el cual yo trabajo. ↵
- Escribo “libre” (entrecomillado) porque me pregunto si yo tendré la misma libertad de utilizar los datos construidos por una científica de una universidad prestigiosa del norte global.↵
- En mi opinión, queda claro que, cada vez más, debemos esmerarnos en la construcción y aplicación del consentimiento informado. Las personas que participan en nuestras investigaciones deben saber que, posiblemente, sus datos quedarán por largo tiempo en la web y disponibles para cualquier persona, institución e inteligencia artificial del planeta.↵
- En algunos repositorios digitales, se admite que los datos cualitativos estén anonimizados con el fin de salvar la cuestión de la revelación de las identidades y evitar inconvenientes legales a las instituciones que los almacenan. Pero anonimizar es una tarea enorme. No se trata solamente de eliminar el nombre y los datos personales en el encabezado, o de poner en su lugar un seudónimo, sino de rastrear de principio a fin de cada texto toda la información que pueda hacer identificable a la persona. Esto me lleva a preguntarme si es serio reutilizar un material que fue mutilado durante el proceso de anonimización, y en el cual se quitaron o modificaron actores sociales (individuales y colectivos, sus datos sensibles y personales), lugares, etc. ↵
- Ver www.conicet.gov.ar/wp-content/uploads/RD-20061211-2857.pdf.↵






