Todas as áreas de nossa experiência como humanos já estão transformadas pela utilização de Big Data. O termo é utilizado para descrever um novo paradigma na gestão de informação em função de uma capacidade crescente de processar volumes de dados grandes, complexos e conectáveis (Mittelstadt, Floridi, 2016).
Se a tecnologia parece promissora, ela também traz riscos às diversas dimensões de nossas vidas. Recentemente, em artigo publicado na Revista Nature Communications, foi apontada a ineficácia das atuais práticas utilizadas para anonimização de dados. Os resultados apresentados mostram que qualquer cidadão estadunidense pode ser reidentificado, em qualquer conjunto de dados, utilizando-se apenas quinze atributos demográficos, e demonstrando que mesmo conjuntos de dados anônimos dificilmente se mostram adequados aos atuais padrões da prática (Rocher, Hendrickx, de Montjoye, 2019).
Os grandes dados – Big Data – crescem e variam com grande rapidez, e podem derivar de várias fontes. Além da diversidade de origem, o termo Big Data também serve para denominar muitos recursos e características de diferentes soluções tecnológicas, de modo que não existe uma definição compreensiva e amplamente aceita sobre o que é Big Data (Al-Mekhlal, Ali Khwaja, 2019).
Entretanto, existe algum consenso em torno dos 5 Vs, como são chamados os 5 atributos que caracterizam as tecnologias expoentes do fenômeno Big Data: Volume, Variedade, Velocidade, Validade e Valor. A presença dessas cinco características pode ser considerada como requisito para que determinada tecnologia de coleta, análise e processamento de dados seja considerada Big Data (Demchenko et al., 2013).
O aspecto volume refere-se ao fato de que, contemporaneamente, a esmagadora maioria dos dados, mais de 99% deles, encontra-se em formato digital. Desta maneira, as tecnologias precisam ser capazes de tratar um volume massivo de dados (Al-Mekhlal, Ali Khwaja, 2019).
A variedade descreve a diversidade de tipos e fontes de dados tratados. A obtenção de dados em Big Data inclui dados do tipo estruturado (aqueles que derivam de coletas com campos fixos e que, por isso, seguem padrões pré-determinados); dados semiestruturados (dados que não foram obtidos a partir de campos fixos, mas que possuem identificadores ou tags que diferenciam cada um de seus elementos) e não estruturados (dados variados obtidos das atividades aleatórias dos usuários, sem seguir padrões) (Al-Mekhlal, Ali Khwaja, 2019).
No campo da saúde, por exemplo, os dados podem ser oriundos de coleta realizada no cuidado individual do paciente, dados laboratoriais, dados genéticos, dados de saúde pública, dados provenientes de seguradoras, dados coletados por pesquisadores, dados de estilo de vida, etc. Adicionalmente, dados de todas essas fontes podem ser classificados de diferentes maneiras, de acordo com diferentes critérios, como dados pessoais, dados anonimizados, metadados, dados primários e secundários (Unesco/IBC, 2017).
O atributo de velocidade descreve a necessidade de que tais dados possam ser tratados em alta velocidade, de modo que soluções tecnológicas atuais possam gerar análises e até mesmo produzir recomendações imediatas (Al-Mekhlal, Ali Khwaja, 2019).
O termo validade refere-se ao requisito de qualidade e confiabilidade dos dados, implicando no requisito de adequação e precisão do conteúdo (Al-Mekhlal, Ali Khwaja, 2019).
Por último, o termo valor traduz a significância assumida por determinado conjunto de dados para a compreensão de uma determinada questão. Em outras palavras, descreve a imprescindibilidade de determinado conjunto de dados para abordar o objeto de interesse (Al-Mekhlal, Ali Khwaja, 2019).
Quanto ao uso da tecnologia, no campo da saúde, é fato que a compilação e a análise de dados oferecem orientações indispensáveis para o planejamento e decisões das práticas, principalmente no campo da saúde pública, numa temporalidade que remonta pelo menos ao século XVIII. De alguma maneira, também é possível afirmar que implicações éticas relacionadas ao uso de dados pessoais vêm sendo apontadas desde então (Vayena et al., 2015). O papel crucial da organização de sistemas de vigilância sanitária e mecanismos como notificação compulsória de doenças no enfrentamento de fenômenos epidemiológicos, como epidemias e o combate a doenças endêmicas, é amplo consenso. Entretanto, é também conhecido o risco de exposição dos registros, e suas graves consequências de violação de privacidade e estigmatização dos pacientes. Nesse sentido, são vastamente relatados na literatura eventos que envolvem vazamentos de dados provenientes de vigilância sanitária sobre HIV/AIDS e tuberculose, por exemplo (Myers et al., 2008).
O interesse no fenômeno Big Data, contudo, não resulta somente da quantidade de dados processados, mas da potencialidade de entrecruzamento de informações dos mais diversos setores. O que testemunhamos é uma habilidade inédita de interpretação e predição de comportamentos humanos. Na área da saúde, por exemplo, já existem aplicativos que monitoram dados pessoais e informações corporais, permitindo prever padrões e sugerir hábitos mais saudáveis de forma individualizada aos seus usuários (Mittelstadt, Floridi, 2016).
Dados ambientais, financeiros, geográficos, de mídias sociais e da saúde podem ser compreendidos em interface, oferecendo novas possibilidades de análise e aplicações (Khoury, Ioannidis, 2014), bem como novos e aumentados riscos.
De forma sucinta, as tecnologias de Big Data surgem em resposta à necessidade de lidar com um conjunto crescente de dados que é ou muito volumoso ou muito desestruturado para ser gerido e analisado por meios informacionais tradicionais. As soluções tecnológicas pretendem lidar com um fluxo massivo e ininterrupto de cliques na Internet, conteúdo de redes sociais e conteúdo em formatos de áudio e vídeo (Davenport, Barth, Bean, 2012).
A coleta e manipulação de dados pessoais por parte das grandes corporações atuantes no ramo, no entanto, representa a possibilidade de impactos negativos para os direitos humanos (Albuquerque, 2020).
É justamente quando se pensa sobre esse tipo de risco que a aproximação entre o campo da bioética e dos Direitos Humanos se mostra mais importante. A reconhecida afinidade entre o referencial dos Direitos Humanos, postulado na Declaração Universal dos Direitos Humanos (ONU, 1948), e as possíveis implicações éticas do saber tecnocientífico, objeto de interesse da bioética, culminou em 2005 na formulação da Declaração Universal sobre Bioética e Direitos Humanos (DUBDH) (Unesco, 2005).
A DUBDH em seus 28 artigos aborda questões éticas “relacionadas à medicina, às ciências da vida e às tecnologias associadas quando aplicadas aos seres humanos, levando em conta suas dimensões sociais, legais e ambientais” (Unesco, 2005). O documento reflete a ampliação do escopo da bioética, por meio da adoção dos princípios e valores relacionados aos direitos humanos como marcos referenciais para as reflexões da disciplina.
A expansão da disciplina em um contexto global, promovido pela DUBDH, é resultante de um movimento crítico a leituras individualistas dos dilemas e questões bioéticas. Impulsionados pelas propostas teóricas latino-americanas, com principal destaque para a Bioética de Intervenção, os debates críticos resultaram em um documento que fortaleceu a bioética como um campo interdisciplinar de saberes relacionados à saúde, mas cada vez mais interessado em refletir os problemas concretos, em suas dimensões social e ambiental (Dussel, Mendieta, Bohórquez, 2009). A partir dessa perspectiva, os aspectos ligados à coleta, análise e uso massivos de dados, sintetizados no termo Big Data, são objetos de uma preocupação bioética diversa.
Certamente questões como a liberdade individual, são fundamentais. Contudo, interessa especialmente neste livro a compreensão das dimensões morais da interseção entre o fenômeno Big Data e a saúde humana compreendida em sua acepção mais ampla, incluídos seus condicionantes sociais e ambientais.
Os potenciais benefícios e malefícios gerados pela utilização massiva de dados referentes a sequências genéticas, registros de saúde e outros rastros digitais deixados por indivíduos já têm sido objeto de análise (Boyd, Crawford, 2012). Porém, até o momento, têm se discutido majoritariamente aspectos éticos que não são propriamente exclusivos dessa tecnologia, como, por exemplo, o caso da questão da privacidade (Zwitter, 2014).
A possibilidade de obtenção e aplicação de agregados de dados é praticamente infinita e as transações financeiras relacionadas à coleta, cruzamento, agregação e venda desses dados são parte significativa da atividade econômica global. Esse emergente setor corresponde, grosso modo, à origem de todas as grandes acumulações de riqueza surgidas nesse milênio (Zuboff, 2019a).
Os desdobramentos do fenômeno não são somente econômicos, mas atravessam a organização social como um todo. Fala-se em letramento digital (digital literacy), em uma divisão digital (digital divide) que separa os pobres em dados (data poor) dos ricos em dados (data rich). Esses termos descrevem uma distribuição desigual dos efeitos da tecnologia e um grande potencial de incrementar iniquidades já agudas em função de uma concentração de informações e de capacidade de processá-las (McCarthy, 2016).
É em função desses mecanismos injustos que a preocupação bioética sobre o tema não adquire a mesma face, independentemente do contexto. Em países periféricos a reflexão sobre a temática não pode se desenvolver de maneira neutral, sob o risco de contribuir com a ampliação das distorções sociais existentes nesses contextos (Garrafa, Porto, 2003). Dessa maneira, a análise bioética das tecnologias de Big Data e de sua apropriação pelo campo da saúde contemplar as dinâmicas sociais e econômicas envolvidas no processo.
É adicional fonte de preocupação o fato de que não há no mundo regulamentação legal específica sobre o uso de Big Data (Zwitter, 2014). As regras e leis regionais e internacionais existentes tratam da privacidade e confidencialidade dos dados pessoais. Tal abordagem, no entanto, não se mostra suficientemente abrangente, uma vez que já há aplicações econômicas e políticas destas novas habilidades informacionais, com vasto alcance populacional. Diante disso, o presente debate ético e regulatório sobre o tema se demonstra ainda incipiente.
Dessa maneira, é importante entender o que é Big Data e como tais dados são utilizados para analisar suas implicações éticas. É importante não perder de vista que esses resultados não se limitam ao nível individual, mas podem afetar a humanidade e sua maneira de se organizar socialmente. A manipulação de dados com fins de indução de comportamentos de consumo é uma preocupação, mas o uso dessas soluções tecnológicas com fins políticos para a vigilância e controle dos cidadãos é uma ameaça às liberdades individuais e aos processos democráticos (Dias, Vieira, 2013).
Os desafios relacionados ao uso de Big Data no campo da saúde já começaram a despertar a atenção da comunidade bioética. Nosso trabalho neste livro é introdutório e metodologicamente sistematizado, retomando a discussão de alguns referenciais necessários para entender a temática e, a partir disso, realiza uma análise da atual literatura científica sobre as relações entre Big Data e bioética. A ideia é observar os indícios e vestígios deixados por autores que antes se indagaram:
Quais são as implicações éticas do uso de Big Data em saúde?
Nesta coleta sistematizada, nos servirá de alguma forma como ponto de referência um dos primeiros e mais extensivos esforços feitos sobre o tema, um relatório sobre o tema produzido pelo Comitê Internacional de Bioética (IBC, da sigla em inglês: International Bioethics Committee) da Organização das Nações Unidas para a Educação, a Ciência e a Cultura (Unesco).
Muitas dessas implicações são recolhidas exatamente assim, como uma pista, para que outros interessados possam persegui-las. De tal modo, uma vez identificados esses problemas, nossa atenção se concentra mesmo naquilo que consideramos ser o principal problema com o tema: a mercantilização da privacidade.
Finalmente, consideramos importante ressaltar que para abordar este tema de maneira rigorosa, dividimos este livro em cinco capítulos. Após esta Introdução, o segundo capítulo, intitulado Big Data: desenvolvimento da tecnologia e suas aplicações, buscará dar um panorama conceitual do que se entende por esta categoria e espera servir como fonte de consulta para o tema que, como foi dito, tem múltiplos significados. O terceiro, intitulado Bioéticas, tem como objetivo apresentar referencial teórico que possibilitará a análise, mencionada nos parágrafos anteriores. O quarto capítulo, Um olhar bioético sobre o uso de Big Data em saúde, procurará propor a análise comentada e oferecer pistas para, a partir da bioética, tratar o problema da mercantilização da privacidade. No quinto e último parágrafo, o livro conclui oferecendo Palavras futuras, revelando possíveis próximos passos de investigação sobre o tema.
Referências
Al-Mekhlal, M., Ali Khwaja, A. “A synthesis of Big Data definition and characteristics”. In: 2019 IEEE international conference on computational science and engineering (CSE) and IEEE international conference on embedded and ubiquitous computing (EUC). Nova York: IEEE, 2019. p. 314-322.
Albuquerque, A. “A privacidade na era dos algoritmos sob a ótica dos direitos humanos”. In: Neto A. B. S., Almeida G. H. C. B. (org.). Norma, linguagem e teoria do direito: reflexões para a compreensão do direito do século XXI. Goiânia: Editora Espaço Acadêmico, 2020. p. 36-57.
Boyd, D., Crawford, K. “Critical questions for Big Data: Provocations for a cultural, technological, and scholarly phenomenon”. Information, Communication & Society; 15(5):662-679, 2012.
Davenport, T. H., Barth, P., Bean, R. “How ‘Big Data’ is different”. MIT Sloan Management Review; 54(1):22-24, 2012.
Demchenko, Y., Grosso, P., De Laat, C., Membrey, P. Addressing Big Data issues in scientific data infrastructure. In: 2013 International conference on collaboration technologies and systems, 2013, p. 48-55.
Dias, G., Vieira, A. “Big Data: questões éticas e legais emergentes”. Ciência da Informação; 42(2):174-184, 2013.
Dussel, E., Mendieta, E., Bohórquez, C. (eds.), El pensamiento filosófico latinoamericano, del Caribe y “latino” (1300-2000). Historia, corrientes, temas, filósofos. México: CREFAL, Siglo XXI Editores, 2009.
Garrafa, V., Porto, D. “Intervention bioethics: a proposal for peripheral countries in a context of power and injustice”. Bioethics, 17(5-6):399-416, 2003.
Khoury, M. J., Ioannidis, J. P. A. “Big Data meets public health”. Science, 346(6213):1054-1055, 2014.
McCarthy, M.T. “The Big Data divide and its consequences”. Sociology Compass, 10(12):1131-1140, 2016.
Mittelstadt, B. D., Floridi, L. “The ethics of Big Data: current and foreseeable issues in biomedical contexts”. Science and Engineering Ethics, 22(2): 303-341, 2016.
Myers, J., Frieden, T. R., Bherwani, K. M., Henning, K. J. “Ethics in public health research: privacy and public health at risk: public health confidentiality in the digital age”. American Journal of Public Health, 98(5):793-801, 2008.
Organização das Nações Unidas – ONU. Declaração Universal dos Direitos Humanos. 1948. Disponível em: http://www.un.org/en/universal-declaration-human-rights/ (Acessado em 26 de junho de 2023).
Organização das Nações Unidas para a Educação, a Ciência e a Cultura – UNESCO. Declaração Universal sobre Bioética e Direitos Humanos da UNESCO. Tradução de Tapajós A, Prado MM, Garrafa V. Brasília: Cátedra Unesco de Bioética; 2005.
Organização das Nações Unidas para a Educação, a Ciência e a Cultura – UNESCO/ International Bioethics Committee – IBC. “Report of the IBC on Big Data and health”. Paris: United Nations Educational, Cultural and Scientific Organization, 2017. Disponível em: http://bit.ly/3oShRhu (Acesso em 15 de dezembro de 2021).
Rocher, L., Hendrickx, J. M., de Montjoye, Y. A. “Estimating the success of re-identifications in incomplete datasets using generative models”. Nature Communications, 10: e3069, 2019.
Vayena, E., Salathé, M., Madoff, L. C., Brownstein, J. S. “Ethical challenges of Big Data in public health”. PLoS Computational Biology, 11(2): e1003904, 2015.
Zuboff, S. “Surveillance Capitalism and the Challenge of Collective Action”. New Labor Forum, 28(1):10-29, 2019a.
Zwitter, A. “Big Data ethics”. Big Data & Society, 1(2):1-6, 2014.







