“A estatística é a espinha dorsal da ciência de dados”, afirma o Prof.Dr. Hedibert Lopes, em palestra na UFPR 


Mesa de abertura do 3º encontro de Data Science & Big Data trouxe importantes discussões acerca do papel da Estatística na Ciência de Dados

Texto: Eduardo Perry

A importância crescente da estatística em um mundo dominado por dados foi o foco da palestra do professor do Insper, Hedibert Lopes, realizada no 3° Encontro de Data Science e Big Data promovido pela UFPR. Durante sua apresentação, o pesquisador destacou como as fronteiras entre as duas áreas do conhecimento estão se tornando cada vez mais nebulosas, uma vez que a chamada Data Science evolui em direção a análises e interpretações mais complexas de dados, enquanto o estatístico de século XXI está se aproximando de ferramentas computacionais avançadas, como o machine learning e a inteligência artificial. 

Nos Estados Unidos, os primeiros programas acadêmicos de ciência de dados começaram a surgir em meados dos anos 2010. No entanto, à medida que a área se consolidava, universidades de ponta passaram a incorporar a ciência de dados em seus currículos, muitas vezes renomeando departamentos de estatística e outras áreas para refletir essa integração. Hoje, instituições renomadas, como o Massachusetts Institute of Technology (MIT) e a Universidade de Stanford, oferecem programas robustos que combinam estatística, ciência da computação e análise de dados, refletindo a natureza interdisciplinar e prática do campo.

De acordo com Lopes, o “boom” do Data Science é consequência direta do aumento da quantidade de dados produzidos, assim como a capacidade computacional disponível nos dias de hoje, “Eu tô aqui e meu celular tá ali me escutando. Quando eu abrir ele, ele vai sugerir pra mim: ‘Ah, você tá em Curitiba. Que tal fazer isso? Nosso trabalho estatístico, ou de ciência de dados, serve para compilar e interpretar todas essas coisas”, explicou. 

O professor também ressaltou que a consolidação da ciência de dados como um campo próprio também significou a incorporação e a ampliação de técnicas estatísticas, que passaram a servir não apenas como base, mas como motor de desenvolvimento para novas abordagens tanto na estatística quanto na ciência da computação. “Muitas das técnicas utilizadas hoje em machine learning, por exemplo, advêm do universo da estatística, mas ao mesmo tempo foram criadas muitas coisas novas e interessantes”. Para ele, isso significa principalmente duas coisas: não se pode minimizar a importância da matemática e da estatística, no que diz respeito à ciência de dados; e o papel do estatístico no mundo do data Science precisa ser repensado para que ele esteja mais bem equipado com novas habilidades que o tornem atualizado e efetivo”, refletiu.

É preciso democratizar a área

Lopes ainda lamentou o fato de que poucas pessoas procuram pelo bacharelado em Estatística, enquanto muitos vão atrás do diploma de Ciência da Computação. Segundo ele, não é interessante que a área tenha tão pouca visibilidade. O pesquisador ainda trouxe dados que indicam que por volta de 2015 houve um aumento na procura pelo curso, mas menciona que esse fenômeno deve ter sido provocado pela maior adesão que o Exame Nacional do Ensino Médio (ENEM) teve na época, o que acabou significando em um aumento na procura por todos os cursos, e não só o de estatística. Hoje, o número de inscritos em vestibulares de estatística no Brasil está caindo e de 2013 para cá, a média anual de término do curso é de um terço, segundo estudo citado pelo professor. 

Perguntado sobre ausência de mulheres, sobretudo pretas e pardas na área, Lopes ressaltou que esse é um problema sério a ser resolvido. “Sempre que fazemos seminários no Insper, eu busco trazer o mesmo tanto de homens e mulheres para falar. Mas, elas são minoria, e quanto mais você sobe na carreira, mais você percebe a predominância masculina”, enfatizou.