O texto abaixo foi escrito como parte da avaliação da disciplina “Design e Epistemologia”, dada em conjunto pelos programas de Pós-Graduação em Design da ESDI/UERJ e UFPR. Na revisão por pares, um dos professores elogiou e recomendou publicação; o outro, achou “superficial a ponto de ser irritante”. Tendendo a concordar com o professor mais rigoroso, portanto, só me resta publicá-lo no veículo mais apropriado — minha própria plataforma.
introdução
O cinema em particular e o audiovisual em geral são — como algumas outras áreas do fazer profissional, como o design, a publicidade, o jornalismo… — frutos do que se convencionou chamar Modernidade, ao mesmo tempo em que produzem leituras sobre ela [1]. Através da sua linguagem, construída sobre limitações e possibilidades científicas da técnica que a produz, o vídeo possibilitou a criação de modos de ver próprios desse modelo de sociedade. Esse artigo busca refletir e discutir formas de construção da realidade e da verdade através da linguagem do vídeo, considerando as presentes possibilidades dessa linguagem trazidas pelas suas formas de captação, pela alta resolução das imagens e pela inteligência artificial.
No que diz respeito à produção artística e de entretenimento, as possibilidades construtivas dessa linguagem audiovisual, já consolidada em seus anos de história, são usadas de maneira deliberada de modo a construir determinadas narrativas e possibilidades de leituras dessas obras. Mas uma das ideias que emergem da possibilidade de se reproduzir tecnicamente imagens da realidade é a de que o vídeo proporciona um meio fidedigno de representar essa realidade. Essa não é necessariamente uma ideia adotada de forma geral dentro da variada comunidade dedicada a esse tipo de produção, mas é especialmente comum no que diz respeito ao jornalismo e ao vídeo documental.
Como toda linguagem, a linguagem audiovisual é ela também uma espécie de caixa de ferramentas para determinado tipo de construção artificiosa, seja essa construção uma tentativa de retrato da realidade ou uma criação artística. A produção de ficções ou de reportagens [2] com o vídeo se utiliza essencialmente das mesmas ferramentas e são constituídas de blocos construtivos de mesma natureza.
isenção, ilusão & ficção
A partir da breve discussão anterior, é possível entender que mesmo a produção audiovisual mais pretensamente desinteressada ou neutra/isenta — como se posicionam alguns dos “produtores de realidade” do jornalismo — não escapa de ser construída com as mesmas ferramentas e possibilidades usadas na ficção. Sendo assim, construídas da mesma substância, a verdade e a ficção podem, pelas suas próprias possibilidades técnicas e narrativas, se entrelaçarem ou, até mesmo, sequer se distinguirem. A verdade no vídeo surge desse seu lugar na vida social (FOUCAULT, 2002) — como meio informativo e, ao mesmo tempo, lúdico.
Existe uma anedota a respeito de uma das primeiras projeções cinematográficas da história, realizada pelos irmãos Lumiére em Paris em 1896 (GRUNDHAUSER, 2016). Conta-se que, ao enxergar diante de si um trem a vapor se aproximando em alta velocidade, o público do cinema assustou-se, e algumas pessoas fugiram desesperadas com medo do iminente atropelamento. A colisão impossível certamente não aconteceu, mas a sua possibilidade só pôde existir para aquela audiência — ou para os ouvintes da anedota — pelas ilusões que essas projeções imagéticas causam. Desde os inícios do vídeo, portanto, a discussão a respeito do ilusionismo possível através das suas imagens existe.
Como discurso, o vídeo produz também efeitos no mundo, dado que é ele mesmo um modo de olhar, um modo literal de se elaborar visões de mundo — Flusser fala em “biombos” (1985. P. 7). É antiga já a discussão do vídeo como meio de agitação e propaganda, como forma de estabelecer certos tipos de representações e leituras sobre certos tipos de personagens, lugares, indivíduos e coletivos de pessoas pela organização dos modos de falar (EISENSTEIN, 1990). Porém, as possibilidades técnicas e científicas que se colocam atualmente e se somam ao seu conjunto de ferramentas exigem a continuidade dessas discussões, pertinente precisamente pelas possibilidades de reprodução ilusória da realidade que o vídeo possui.
Essas possibilidades não capacitam a técnica a fazer uma cópia exata da realidade — a coincidência do mapa com a realidade que busca representar é tida como a perfeição cartográfica em um pequeno conto de Jorge Luis Borges [3] —, mas cria uma aproximação com ela que é real o suficiente. Essa possibilidade é circunscrita por recortes, edições e enquadramentos, criando ficções mesmo quando a intenção dos emissores é em direção a uma tentativa de re-produção da realidade.
as possibilidades de verdade do vídeo
Sendo de natureza fictícia, as verdades produzidas pelo vídeo, como modos de falar, permitem uma inteligibilidade comum e atuam na construção identitária não só daqueles que constituem a sua audiência, mas também daqueles que o produzem, que o circulam, ou até mesmo que se mantém alheios, sendo indiretamente afetados por eles. Ainda que as suas tentativas documentais sejam também fictícias, fabricadas, entre as possibilidades do vídeo está o contato para além das fronteiras de tempo e espaço — aprofundadas ainda mais pela disseminação do acesso à internet. É, portanto, falsa a oposição entre uma verdade que é construída pela linguagem e uma verdade independente da linguagem, que emerge da natureza e não é influenciada pelas ações humanas (FOUCAULT, 2007); toda verdade necessita da linguagem para ser articulada, para se fazer construir e se fazer entender.
Uma das formas de produção da realidade muito difundidas atualmente é o uso massivo de câmeras de segurança, principalmente nos ambientes urbanos públicos. Deslocadas de sua utilização comum no cinema e na TV, as câmeras de segurança têm como objetivo o monitoramento da realidade que se observa através de suas lentes. Sua forma de captação, que resulta em uma sequência linear direta de imagens, sugere que não existe ali uma construção narrativa intencional, apenas o monitoramento das atividades em um dado local de forma impessoal e isenta. É essa percepção de retrato da realidade das imagens por elas captadas que as legitima como provas documentais em processos criminais e as estabelece como ferramentas discursivas de poder.
A câmera de segurança produz imagens com qualidade relativamente inferior à de outros equipamentos de mesma função. Ela funciona como uma tentativa de ampliar o alcance da vigilância realizada por olhos humanos, sem no entanto permitir ao observado identificar seu observador. Como o panóptico prisional idealizado por Bentham e comentado por Foucault (1987), as câmeras de segurança criam não só a armadilha da visibilidade, mas também modos de compreender e experienciar a realidade por aqueles que se valem de suas imagens: ao mesmo tempo em que elas auxiliam na construção de uma “sensação de segurança” através da tentativa de inibição da atividade criminosa (CARDOSO, 2013), elas também permitem a domesticação dos espaços público e privado e de seus ocupantes.
As características imagéticas próprias das produções realizadas através de câmeras de segurança — com suas resoluções mais modestas, cheias de ruídos e, muitas vezes, sem a informação de cor — possibilitam que se aflore a partir delas uma linguagem reconhecível, reprodutível e ressignificável. O emprego de imagens similares às produzidas pelas câmeras de segurança no campo da ficção — simulando as suas deficiências técnicas e as suas características estéticas mais evidentes [4] — estabelecem, por exemplo, um modo de narrar que se apropria dessas características e busca, também no espaço da criação artística, efeitos de significação similares ao que as imagens “autênticas” produzidas por estes aparatos transmitem. O reconhecimento dessas imagens enquanto linguagem depende, portanto, dos seus modos de representação.
O vídeo documental, por sua vez, é um gênero do audiovisual que se coloca como crônica não-ficcional. Ainda que alguns autores o identifiquem como um tipo de interpretação subjetiva da realidade, por vezes se afirma em seguida que esse gênero “tem por característica sustentar-se em acontecimentos reais”, tratando “efetivamente daquilo que ocorreu”, “e não daquilo que poderia ter acontecido” (PUCCINI, 2009. P. 24). É na possibilidade reprodutiva imagética propiciada pela técnica que a “realidade” — ou seja, a “verdade” — do documentário é construída: a noção do documentário como um recorte ou enquadramento próprio do diretor é às vezes bastante explícita na literatura da área do Cinema e da Comunicação (NICHOLS, 2012), mas não resolve o paradoxo das afirmações de credibilidade daqueles que capturam imagens com esse propósito.
Pode-se pensar que documentários naturalistas, por exemplo, se aproximem de um discurso científico: eles advogam um determinado acesso privilegiado a natureza — inacessível às pessoas comuns — quando buscam, através do uso de altas resoluções, captar a realidade de forma fidedigna em suas cores, sons, contextos, texturas, lugares e composições. Muitas dessas expedições para captar imagens na “natureza selvagem” se valem da consultoria ou da parceria com cientistas. É o caso de alguns dos documentários produzidos pela Natural History Unit, divisão do canal de televisão britânico BBC.
Criada em 1957, a NHU alega “revelar a audiências ao redor do mundo as maravilhas extraordinárias da natureza por meio de narrativas excepcionais, imagens de cair o queixo e ciência de ponta” (BBC STUDIOS, s.d.) [5]. A BBC é uma rede de broadcasting estatal que enuncia certo discurso a respeito da cultura britânica dentro do seu próprio território e também no exterior. Esses enunciados têm muito a ver com a validação de um projeto moderno que em certa medida foi capitaneado pela Grã-Bretanha e a Revolução Industrial: de que as sociedades ocidentais seriam um tipo especial de civilização, que rompeu com o passado através da promoção de valores universais e pela aplicação do método científico (LATOUR, 1994).
Algumas formas de captar essas imagens dos documentários produzidos pela NHU usam truques que brincam com a percepção e a cognição animal, no intuito de manter cinegrafistas e cientistas afastados dos assuntos retratados e não inibir a aproximação dos animais. Por vezes, ao mesmo tempo em que se usam as técnicas clássicas da fotografia — como teleobjetivas, câmera lenta e lentes especiais —, câmeras escondidas são inseridas em bonecos mecatrônicos animados e controlados a distância (BBC, 2017) [6]. Esses aparatos são modos de organizar a realidade de que se valem esses documentaristas, são truques usados para tentar uma aproximação da realidade da natureza ao mesmo tempo em que se mantém o distanciamento necessário para não se perturbar a natureza observada.
Esse é mais um exemplo que demonstra que não existe, na prática, uma oposição real entre verdade e ficção. É interessante, portanto, compará-lo com o anterior, das câmeras de segurança: tratam-se de dois modos diferentes de se construir a realidade através do vídeo. Discursivamente, a câmera de segurança constrói sua versão de verdade a partir dos efeitos visuais e dos defeitos inerentes à seu modo de produção, imbricados nas imagens produzidas. Já os documentários da BBC se valem justamente do oposto: a História Natural retratada pelo canal se faz a partir de imagens de altíssima resolução e capturadas por lentes poderosas, produzidas com o melhor que a tecnologia fotográfica possui no presente. Mesmo que câmeras de segurança e documentários naturalistas construam visões da realidade através de técnicas de mesma natureza, tratam-se de duas formas diferentes de se construir fidedignidade.
A rede necessária a se mobilizar e efetivamente produzir um documentário como esses da divisão de História Natural da BBC exige articular cientistas, fotógrafos, cinegrafistas, editores, comunidades, instituições, infraestruturas (logística, comunicação etc), e uma série de pessoas e seres não humanos (naturais e fabricados). Todos esses atores estão, conscientes ou não de seus papéis, empenhados em uma atividade que se constitui basicamente em tradução (LATOUR, 2005): eles traduzem a audiências do mundo todo — ou, pelo menos, do mundo alcançável pela influência do canal britânico — visões da natureza sob um dado ponto de vista. Essas visões nem sempre são povoadas por seres humanos, em geral posicionados atrás das câmeras manipulando equipamentos, e distanciados da natureza que retratam.
Como as câmeras de segurança e as imagens documentais em alta resolução, o deepfake pode também ser entendido como uma forma de criar imagens que podem ser tomadas por realidade. Mas as imagens produzidas através dessa técnica de síntese computacional são, por princípio, ilusórias; só é possível tomar as imagens de deepfake por realidade ao ser deliberadamente enganado por elas. Bastante difundida na criação de filtros para vídeos e fotos em redes sociais que alteram as características do rosto dos seus usuários, essa técnica usa aprendizagem de máquina para mapear um rosto e reproduzi-lo sobre outro, gerando resultados em vídeo. Algumas das primeiras e mais populares aplicações dessa técnica têm sido a criação de vídeos de caráter pornográfico, como aconteceu com a atriz norte-americana Kristen Bell; os vídeos falsos com seu rosto estão ainda hoje em circulação em sites pornográficos (REDAÇÃO, 2020).
A diferença do deepfake para outras técnicas de manipulação digital de vídeo é que ele permite simular expressões faciais de forma muito realista. Usando técnicas de deepfake e atores que interpretem razoavelmente bem os gestuais de uma pessoa, é possível criar imagens falsas, mas coerentes e convincentes de alguém. Mesmo que essa mentira possa ser desmentida mais tarde, a verdade por trás dela pode não ser suficiente para convencer aqueles por ela enganados — vide a contínua propagação de fake news já desmentidas (ESTADÃO VERIFICA, 2018).
Como as primeiras e mais comuns aplicações da técnica atestam, o deepfake tem sido extensivamente usado para a criação de pornografia, a ponto de fóruns de programadores precisarem se posicionar nominalmente como estudantes da técnica que não intentam produzir esse tipo de imagem, como atesta a página “Deepfakes that are Safe for Work” no Reddit (2021). Esse uso levanta questões de consenso, de ética, de arruinamento de reputações, mas também aquelas relativas à exploração sexual das mulheres e da construção contínua da imagem delas enquanto objetos sexuais. Ele também reitera um certo discurso sobre o sexo que é estruturado e propagandeado pela pornografia, atuando na própria construção do que é o sexo propriamente dito.
Entre essas imagens fictícias do sexo geradas por manipulação digital está um caso recente, que vitimou o então candidato ao governo do estado de São Paulo, João Dória. Em 2018, às vésperas da eleição, um suposto vídeo íntimo do candidato circulou pela internet e foi por ele imediatamente desmentido. O laudo da análise independente encomendada pela revista Veja não cita deepfake (QUINTELLA, 2018), mas esse caso provocou discussões na época sobre o potencial de destruição que essas novas possibilidades de manipulações em vídeo permitem.
Por outro lado, alguns estudantes da técnica passaram a utilizá-la no desenvolvimento de memes com crítica política: é o caso do jornalista Bruno Sartori, que disse em entrevista que seu trabalho humorístico pode ajudar a desmistificar a tecnologia e identificar seus usos (GLOBOPLAY, 2019). Geralmente o que leva alguém a perceber que um vídeo pode ter sido gerado com deepfake são os glitches e os “erros de percurso” da técnica (LATOUR, 2016) — como quando ela não compõe direito os rostos e a imagem se desloca um pouco, ou quando as expressões faciais acabam gerando imagens que são conflitantes para a nossa interpretação cognitiva e acabam caindo no chamado Vale da Estranheza (CABALLAR, 2021). É, então, nesses desvios que a realidade da mediação do deepfake aparece e se evidencia.
As técnicas de rede generativa e inteligência artificial que compõem a caixa de ferramentas do deepfake não são usadas só por curiosos para fazer vídeos bizarros e arruinar reputações, no entanto. Elas também são empregadas em filtros de redes sociais e engines de reconhecimento facial, a princípio para aplicações lúdicas e meramente de entretenimento. No entanto, as discussões éticas que esse uso suscita não são menos complexas do que no que diz respeito à produção de pornografia falsa: pode-se discutir aqui os possíveis danos à saúde mental dos usuários desses filtros — como os distúrbios de imagem corporal provocados pelo uso excessivo de redes sociais — e o uso dessas imagens por governos e sistemas de vigilância, fazendo uma ponte com o primeiro tema tratado neste subitem.
considerações finais
Existem inúmeras formas de se construir verdades e mentiras através do audiovisual. Se antes os limites técnicos impediam um realismo representacional nas narrativas de fantasia e forçava algumas delas aos domínios da animação em duas dimensões [7], hoje eles não são um entrave tão grande da criatividade no que diz respeito a obras de ficção. Quanto às possibilidades de captura do real, aparentemente se trata apenas de uma questão de quantidade de pixels: a mais alta resolução de imagem atingida até o momento foi em uma imagem produzida pela empresa chinesa Jingkun Technology, que possui 195 bilhões de pixels [8].
São infinitas as possibilidades de falar de verdade e mentira, de mentir com imagens legítimas, de montar a verdade com imagens em movimento. Com a profusão do vídeo na vida comum trazida pela internet, essa linguagem só se expande. Esse artigo tentou articular modestamente três dessas possibilidades, de modo a encontrar entre elas formas de discutir os temas na disciplina de Design e Epistemologia, seus pontos de contato e suas especificidades. A principal conclusão referente a esses estudos e leituras é a de que usar a linguagem é mentir (ou criar) usando uma convenção compartilhada (NIETZSCHE, 2009).
Os pensadores da área do audiovisual em geral parecem estar conscientes do caráter artificioso das técnicas do vídeo. Desde os seus princípios históricos em shows de ilusionismo, antes mesmo do estabelecimento de uma linguagem reconhecível, o cinema e o vídeo fazem parte desse universo das ilusões imagéticas: sua linguagem é toda no sentido de uma construção compositiva com imagens, seja essa uma construção interpretativa e subjetiva da verdade ou uma narrativa com tendência representativa realista da ficção.
A linguagem audiovisual, como toda linguagem que permite a construção de discursos e enunciados em invólucros coerentes, é flexível, adaptável e também generativa. A verdade e a mentira são construídas de forma semelhante pelos instrumentos compositivos do vídeo pela simples impossibilidade de se estabelecer uma linguagem própria da verdade em vídeo: a linguagem da verdade e da isenção pode sempre ser apropriada como recurso narrativo.
O que condiciona certas leituras enviesadas da realidade em vídeo é justamente os modos de representação empregados na sua produção, a linguagem propriamente dita que realiza essa mediação; mas sem linguagem, a mediação e o entendimento simplesmente não acontecem. O fato de os próprios pensadores do vídeo não conseguirem às vezes se desfazer desse paradoxo entre subjetividade e realidade demonstra que o cerne do problema não é a falta de acesso direto à realidade e à “coisa em si”, dado que esse acesso é sempre intermediado pelo castelo de cartas da linguagem. O filtro da verdade é a mente humana, e esse filtro não tem como ser driblado.
notas
[1] Walter Benjamin discute isso a partir do ponto de vista da escola de pensamento em que se inseria, a Teoria Crítica, comentando a possibilidade de reprodução técnica como um desenvolvimento moderno em seu ensaio mais famoso (BENJAMIN, 1987), publicado originalmente em 1936.
[2] “Reportagem” descreve um gênero jornalístico de caráter informativo, mas a palavra foi escolhida propositalmente aqui por sua ambiguidade e pela possibilidade de significar uma tentativa de estabelecer uma relação com a realidade.
[3] Originalmente publicado em uma revista argentina em 1946, “Del Rigor de La Ciencia” pode ser lido em quatro idiomas neste link.
[4] Além da propaganda da Coca-Cola, um outro exemplo é o programa de TV americano de 2010 chamado Look: The Series, que simula em suas imagens os defeitos e efeitos da transcodificação de vídeo com objetivo de criar um efeito dramático narrativo (LOOK, 2010). Uma discussão sobre câmeras de segurança, bem como a sua articulação com o texto Vigiar e Punir (op. cit.) de Foucault a partir de exemplos como esses, foi desenvolvida em maior extensão e profundidade em um artigo ainda não publicado, escrito por mim e outros dois colegas da PUCPR.
[5] Tradução livre do original: “reveal to audiences around the world the extraordinary wonders of nature through exceptional storytelling, jaw dropping imagery and cutting-edge science.”
[6] Alguns desses robôs espiões têm como propósito atrair animais em períodos de acasalamento para registrar seus processos e ritos de reprodução — o que lembra um pouco o mito de Pasífae e o touro de Creta…
[7] Diz-se ser o caso de The Lord of The Rings, a animação (1978).
[8] A imagem produzida retrata uma vista panorâmica interativa da cidade de Xangai.
referências
BBC. “Making a wildlife documentary using robot spies | Spy in the Wild – BBC”. YouTube.com. Acesso em 2 de julho de 2021.
BBC STUDIOS. “Natural History Unit”. BBC Studios Productions. Acesso em 2 de julho de 2021.
BENJAMIN, Walter. “A obra de arte na era de sua reprodutibilidade técnica”. In: _________. Magia e Técnica, Arte e Política. São Paulo: Brasiliense, 1987.
CABALLAR, Rina Diane. “What Is the Uncanny Valley?” IEEE Spectrum, 2 de novembro de 2019. Acesso em 2 de julho de 2021.
CARDOSO, Bruno. “Câmeras legislativas: videovigilância e leis no Rio de Janeiro”. Revista Brasileira de Ciências Sociais. V. 28. N. 81, 2013. P. 49-62. Acesso em 30 de junho de 2021.
EISENSTEIN, Sergei. O Sentido do Filme. São Paulo: Zahar, 1990.
ESTADÃO VERIFICA. “‘Mamadeiras eróticas’ não foram distribuídas em creches pelo PT”. Estadão Política, 28 de setembro de 2018. Acesso em 2 de julho de 2021.
FLUSSER, Vilém. Filosofia da caixa preta: ensaios para uma futura filosofia da fotografia. Tradução do autor. São Paulo: Editora Hucitec, 1985.
FOUCAULT, Michel. Vigiar e Punir: nascimento da prisão. Petrópolis: Vozes, 1987.
________________. “Conferência 1”. A Verdade e As Formas Jurídicas. 3ª edição. Rio de Janeiro: NAU, 2002. P. 7-27.
________________. As palavras e as Coisas. Tradução de Salma Tannus Muchail. 9ª edição. São Paulo: Martins Fontes, 2007.
GLOBOPLAY. “Bruno Sartori fala sobre a origem do deepfake e comenta algumas reações ao seu trabalho”. Conversa com Bial, 11 de dezembro de 2019. Acesso em 2 de julho de 2021.
GRUNDHAUSER, Eric. “Did a Silent Film About a Train Really Cause Audiences to Stampede?” Atlas Obscura, 3 de novembro de 2016. Acesso em 30 de junho de 2021.
LOOK, The Series. Direção de Adam Rifkin. EUA: CapturedTV, 2010. Série de TV, 1 temporada.
THE LORD of The Rings. Direção de Ralph Bakshi. EUA: Fantasy Films, 1978. 2h12m.
LATOUR, Bruno. Jamais Fomos Modernos: ensaio de antropologia simétrica. Tradução de Carlos Irineu da Costa. São Paulo: Editora 34, 1994.
_______________. Reassembling the Social: An Introduction to Actor-Network-Theory. Nova York: Oxford Press, 2005.
_______________. Cogitamus: seis cartas sobre as humanidades científicas. Tradução de Jamille Pinheiro Dias. São Paulo: Editora 34, 2016.
NICHOLS, Bill. Introdução ao documentário. São Paulo: Papirus, 2012.
NIETZSCHE, Friedrich. “Sobre verdade e mentira no sentido extra-moral (1873)”. In: Antologia de Textos Filosóficos. Curitiba: Secretaria de Estado da Educação do Paraná, 2009. P. 530-541.
PUCCINI, Sérgio. Roteiro de documentário. São Paulo: Papirus, 2009.
REDAÇÃO. “Kristen Bell desabafa sobre uso de imagem em pornô deepfake: ‘Chocada’”. Isto É: Gente. Acesso em 2 de julho de 2021.
REDDIT. “Deepfakes that are Safe for Work”. Reddit. Acesso em 2 de julho de 2021.
QUINTELLA, Sérgio. “Perícia revela laudo sobre vídeo íntimo atribuído a João Doria”. Veja São Paulo: Poder SP. Acesso em 2 de julho de 2021.