Friday, 19 de April de 2024 ISSN 1519-7670 - Ano 24 - nº 1284

Com quantos dados se faz uma reportagem?

Jornalistas escrevem frases. Jornalistas de dados escrevem linhas de código. Ambos constroem histórias. Essa é uma maneira de distinguir em poucas palavras o que diferencia o jornalismo de dados de outros gêneros jornalísticos. É também uma simplificação – reducionista, por certo. Mas serve para marcar a principal diferença do jornalismo de dados: a incorporação da linguagem do computador ao dia a dia da reportagem.

Custou-me mais tempo do que deveria para perceber essa diferença. Por duas vezes convidamos o editor de “data-driven journalism” do The New York Times, Aron Pilhofer, para falar em congressos da Abraji (Associação Brasileira de Jornalismo Investigativo) sobre suas atividades. Por duas vezes eu mediei sua apresentação. Nas duas vezes terminei o dia com a mesma dúvida que tinha ao acordar: o que é jornalismo de dados?

Apenas depois de participar de um seminário patrocinado pelo Knight Center for Journalism in the Americas, na Universidade do Texas, em Austin, e, sem seguida, conhecer in loco o trabalho do time de jornalismo de dados do The New York Times foi que encontrei a resposta para essa pergunta. Precisei ver as telas dos seus computadores para a ficha cair: jornalistas de dados escrevem em código. Java script, Python e outras linguagens estranhas.

É só essa a diferença? Não. Todo jornalista que trabalha com jornalismo de dados precisa saber escrever código? Também não. Mas é uma parte fundamental do processo, sem a qual estaremos sempre restritos às técnicas de Reportagem com Auxílio do Computador (RAC), na melhor das hipóteses. Dominar o processo de codificação expande fronteiras para o jornalismo. Nem que seja necessário incorporar outros tipos de profissionais à equipe.

Campo único

As melhores equipes de jornalismo de dados reúnem jornalistas, desenvolvedores e designers. Aliando suas diferentes habilidades, dão conta de resolver problemas que, sozinhos, teriam muito mais dificuldades para solucionar. Mas é importante que todos tenham ao menos noções básicas do que o outro é capaz de fazer para poderem trabalhar em conjunto.

A divisão social do trabalho não é nada revolucionária, nem nas redações. Em TV, há quem produza, grave, entreviste e edite o próprio material. Mas é a exceção. Em geral, produtores, cinegrafistas, repórteres e editores fazem cada um a sua parte, e o resultado é a reportagem que vai ao ar.

No jornalismo de dados é muito parecido, com a diferença de o que vai ao ar é, muitas vezes, uma ferramenta interativa que permitirá ao usuário (antigamente conhecido como leitor) usá-la para contar a história para si mesmo, sem intermediários. Antes de avançar para o produto do jornalismo de dados, porém, convém tratar do processo, de porque e como se chega lá.

Em RAC, há limitações de tamanho. Uma planilha das mais recentes versões do Excel, por exemplo, comporta apenas 1.048.576 linhas. Apenas? É comum esse limite impedir a abertura do arquivo que se pretende analisar. É o caso das declarações de bens de candidatos às eleições municipais no Brasil. São cerca de 600 mil aspirantes a prefeito e vereador. Cada um declara dois ou mais bens. O resultado é que não dá para abrir o arquivo do Tribunal Superior Eleitoral em uma planilha só. Não cabe.

O problema não é só esse. Planilhas são coleções de tabelas independentes, sem conexão entre si. No caso dos candidatos a vereador e prefeito, há várias tabelas diferentes que precisam ser conectadas para o jornalista ter uma visão ampla do quadro eleitoral e de quem está na disputa: uma com o nome e característica de cada candidato, outra com os bens de cada um, uma terceira com as doações que cada um recebeu, uma quarta com as despesas que efetuaram durante a campanha e uma quinta com a quantidade de votos dados a cada candidato.

São relações de muitos itens (candidatos) para muitas características distintas (sexo, partido, votos, doações, bens, despesas). Não podem ser organizadas em apenas uma tabela. Para relacioná-las e descobrir-se, por exemplo, quanto os candidatos do partido XYZ receberam da empreiteira ABC é necessário montar um banco de dados relacional.

Ele terá os candidatos como campo único e comum a todas as tabelas. Se consultado corretamente, o banco de dados fornecerá uma tabela síntese com o resultado que se buscava. Mas para montá-lo é necessário ter noções de programação — ou contar com um programador na equipe.

Acompanhamento online

Imagine agora tentar calcular o tamanho da base de apoio ao governo no Congresso. São 513 deputados e 81 senadores, centenas de votações por legislatura, dezenas de milhares de votos. O problema não é tanto o tamanho dos arquivos, mas o fato de cada votação em cada Casa (Senado e Câmara) ser uma tabela diferente. Para computar como votou cada parlamentar é preciso montar um banco de dados com todas elas e as características de cada um. Só assim é possível medir o grau de governismo ou oposicionismo de um partido ou um indivíduo. Mas há problemas adicionais.

Os parlamentares trocam de partido, novas agremiações partidárias são formadas ao longo do caminho, o comportamento dos deputados e senadores muda com o passar do tempo e conforme o atendimento de suas demandas pelo governo. Há, portanto, que se acrescer a dimensão temporal à análise para poder medir a evolução de partidos e indivíduos no decorrer das votações. Diante desse grau de complexidade, apenas uma interface gráfica é capaz de permitir ao usuário interagir com os dados sem precisar fazer um curso de programação. Esse é o objetivo final do jornalismo de dados.

Os melhores exemplos do gênero são ferramentas online que oferecem uma interface gráfica acoplada a um banco de dados. Quanto mais intuitiva melhor. O que se pretende é que o usuário consiga fazer as perguntas que lhe interessa ver respondidas sem ter de ler um manual de instruções antes. E que as respostas sejam apresentadas graficamente, de maneira clara e sintética.

É o que a equipe do Estadão Dados tentou fazer com o Basômetro, a ferramenta online de acompanhamento da base governista no Congresso. O processo de aprendizado e as técnicas que levaram a isso é o que tentaremos mostrar e transmitir no curso de introdução ao jornalismo de dados montado especialmente para a ANJ com o apoio do Knight Center for Journalism in the Americas.

******

José Roberto de Toledo é jornalista