DESBLOQUEANDO O FUTURO
Em um mundo no qual os dados são a chave para o conhecimento, Humberto Elias Garcia Lopes, professor da PUC Minas e autoridade em análise de dados, nos apresenta seu mais recente trabalho: “DATA SCIENCE UNLOCKED”. Neste livro, Humberto desmistifica a ciência de dados, oferecendo um guia prático para desvendar os segredos dos dados com o uso do R e inteligência artificial. Com uma carreira internacional invejável, tendo lecionado em prestigiadas instituições, Humberto traz uma abordagem única que combina teoria e prática. Seus interesses de pesquisa vão desde o comportamento do consumidor até estratégias de marketing sob a ótica da Economia Austríaca, sempre com um olhar atento às novas tecnologias. Em uma entrevista exclusiva, ele compartilha insights valiosos sobre sua jornada, seu livro e o futuro da análise de dados. Não perca a oportunidade de explorar o universo dos dados com um dos grandes nomes da área. Primeiro, aqui, nesta entrevista. Em seguida, durante as Aula Inaugurais do ICEG Escola de Negócios, que acontecerão na Sala de Multimeios do Prédio 14, no dia 21 de março: às 8h50, para o turno da manhã; e às 19h00 para os acadêmicos da noite. Imperdível!
P – Qual é o público-alvo do livro?
R – Eu escrevi Data Science Unlocked para que ele fosse um guia imprescindível para as pessoas que querem e precisam aprender análise de dados, mas ficam perdidas e inseguras com os livros que existem no mercado. Esses livros muitas vezes frustram os leitores porque estão cheios de explicações complexas ao ponto de se tornarem incompreensíveis aos não iniciados na área. Esse problema não ocorre em Data Science Unlocked. O conteúdo do livro é simples, sendo exposto didaticamente para que qualquer pessoa possa entender como analisar dados corretamente.
P – Quais os principais tópicos abordados no livro em relação ao uso da linguagem R e das inteligências artificiais na análise de dados?
R – Data Science Unlocked ensina qualquer pessoa a usar dois recursos extremamente poderosos na análise de dados. O primeiro é a linguagem R, uma das mais usadas no mundo por universidades, empresas e organizações em geral. Ela é totalmente gratuita e tem uma comunidade de colaboradores voluntários que desenvolvem novas funcionalidades continuamente, disponibilizando-as de graça para todos os interessados. O segundo recurso são as inteligências artificiais. Em Data Science Unlocked, eu adotei a versão gratuita do ChatGPT, mantendo o objetivo de ensinar análise de dados para iniciantes sem que eles tenham que gastar fortunas com materiais de aprendizado. Em Data Science Unlocked, os leitores encontrarão explicações detalhadas de como instalar e usar tanto a linguagem R quanto o ChatGPT. Depois, eu os ensino a conciliar os dois para analisar dados de maneira profissional e sem complicação.
P – Como o livro ajuda iniciantes na área de ciência de dados a se familiarizarem com os conceitos e ferramentas mais essenciais?
R – Eu acredito que um dos grandes diferenciais de Data Science Unlocked é que eu tenho mais de 20 anos de experiência ensinando análise de dados para diferentes públicos, de iniciantes até profissionais que trabalham há anos na área. Graças a isso, ao longo dos anos eu fui identificando as dificuldades, os medos e as dores das pessoas que precisavam e queriam aprender análise de dados, mas se sentiam perdidas com tantas explicações complicadas. Essa experiência me permitiu aprimorar a maneira de ensinar análise de dados para que todas as explicações fossem muito didáticas e simples, começando do mais básico e chegando aos tópicos mais avançados. Em Data Science Unlocked, isso fica muito claro. Eu começo o livro ensinando a instalar o software que roda a linguagem R e depois explico como realizar as operações aritméticas básicas: adição, subtração, multiplicação e divisão. A partir daí, em uma sequência bastante didática, eu vou explicando conceitos e ferramentas em ordem crescente de complexidade. O resultado é que os leitores podem ter uma experiência de aprendizado plena com Data Science Unlocked. Eu posso afirmar que qualquer pessoa poderá aprender análise de dados, mesmo sem ter qualquer conhecimento prévio do assunto.
P – Que exemplos e exercícios seu livro oferece para ajudar os leitores a aplicar os conhecimentos adquiridos?
R – A minha experiência como professor de análise de dados para iniciantes me ajudou muito a pensar no livro como um guia que fosse realmente imprescindível para todos que querem e precisam aprender sobre o assunto. Para isso, um dos aspectos mais importantes para mim foi criar exemplos e exercícios que levassem os leitores a praticar tudo o que é ensinado no livro. Também graças a minha experiência como professor eu pude solucionar um dos maiores problemas em livros mais técnicos como o Data Science Unlocked: a ausência de respostas dos exercícios. Eu leio muitos livros mais técnicos e confesso que fico irritado quando os exercícios não têm soluções. Algumas editoras norte-americanas ao menos vendem uma chave de respostas à parte, mas suas congêneres brasileiras sequer se preocupam com isso. O resultado é que o leitor fica frustrado por ser impedido de conferir se suas respostas estão corretas. Felizmente esse não é o caso de Data Science Unlocked: todos os exercícios têm respostas, permitindo aos leitores acompanhar melhor o seu aprendizado. Mas o livro vai além: ele inclui prompts para o ChatGPT que podem ser usados pelos leitores sem dificuldades. Obviamente, eu testei todos esses prompts mais de uma vez e posso garantir que esses leitores terão um material precioso em mãos.
P – Qual é a importância de apresentar os insights de forma clara e persuasiva? Seu livro oferece orientação aos leitores nesse sentido?
R – Tenho conversado muito com o professor Renato Moreira Hadad, do iPUC, sobre a importância dos insights em análise de dados. Nessas nossas maravilhosas conversas, temos compartilhado nossa preocupação em ajudar os iniciantes da área a interpretar os resultados corretamente, obtendo conclusões bem fundamentadas. Em Data Science Unlocked eu uso os exemplos para mostrar ao leitor como ele pode analisar os resultados de maneira a descobrir aspectos do comportamento dos dados que muitas vezes não são tão nítidos. É aí que entram os insights, que, obviamente, precisam ter respaldo nos dados. Em outras palavras, o livro ajuda o leitor a entender como usar esse poderoso recurso para obter conclusões que sejam pertinentes e inovadoras.
P – Ética e análise de dados. Qual sua abordagem para este tempo tão complicado?
R – Essa é uma ótima pergunta. Infelizmente, há pessoas que se deixam levar pela tentação de produzir resultados inexistentes em suas análises. Em parte, isso ocorre porque vivemos uma era que eu denomino de “ciência da confirmação”, caracterizada pela imposição de divulgarmos somente os resultados que confirmam nossas hipóteses de pesquisa. Nessa lógica, se a análise de dados o levar a resultados que contrariam suas hipóteses iniciais, você sabe de antemão que dificilmente a sua pesquisa será levada a sério no meio acadêmico. Uma das consequências disso será a rejeição dos artigos escritos a partir desses resultados, deixando você com a sensação de que todo o trabalho executado ao longo de meses não deu em nada. Voltando ao aspecto ético: a “ciência da confirmação” exerce uma forte influência nos analistas de dados para que eles produzam os resultados que interessam, ou seja, que confirmam tudo o que eles esperavam confirmar. Para isso, esses analistas precisam “ajeitar” os métodos, as técnicas de análise e, eventualmente, os próprios resultados. Isso é lamentável porque consolida uma ciência baseada na mentira. Em Data Science Unlocked, assim como nas minhas aulas, eu enfatizo que resultados são resultados. Mesmo quando nossas hipóteses são rejeitadas à luz dos dados, isso é um resultado perfeitamente válido. Essa, aliás, é uma ideia que desenvolvi a partir dos meus estudos do filósofo holandês Herman Dooyeweerd. Para ele, precisamos conhecer e entender a realidade criada de maneira honesta e despida de vaidades intelectuais. O nosso compromisso nesse empreendimento, portanto, é com a verdade. Nessa perspectiva, não importa se os dados sustentam as suas hipóteses ou não: o bom analista é aquele que busca a verdade sobre o comportamento dos dados, ao invés de mostrar que suas hipóteses estavam corretas.
P – Quais são as perspectivas e desafios para o profissional de análise de dados?
R – Boa pergunta. Eu gostaria de expandi-la um pouco, delimitando melhor o que nós chamaríamos de “profissional de análise de dados”. Entender o comportamento dos dados é importante não apenas para quem estuda esse assunto específico, mas também para aqueles que labutam em qualquer área. A análise de dados pode ser vital para o profissional de marketing, mas também para o microempreendedor individual que presta serviços de eletricista. Ela pode ajudar muito o professor da PUC Minas, mas também aquele aluno da graduação que acabou de sair do Ensino Médio. Para mim, portanto, talvez o mais adequado seria falarmos em perspectivas e desafios para as pessoas que querem e precisam tomar decisões a partir do que elas conseguem entender do comportamento dos dados. Nesse sentido, temos muitos desafios pela frente, sendo o primeiro deles tratado em Data Science Unlocked: oferecer às pessoas um material sobre análise de dados simples, didaticamente primoroso e, por isso, fácil de entender. Além disso, há a necessidade de termos pessoas com bom conhecimento técnico do assunto. Isso significa que as pessoas precisam aprender temas relacionados à matemática, à estatística, à ciência da computação, entre outros. Analisar dados com proficiência demanda isso. Essa, talvez, seja a grande barreira a ser superada na mente das pessoas. Muitas delas se sentem atemorizadas quando veem uma equação de um modelo de regressão linear simples. Eu entendo essa reação porque o ensino de ciências exatas na educação básica é uma lástima. Eu sei que uma equação muitas vezes desperta aquela frustração das aulas na escola, quando o professor falava e a pessoa não entendia nada. Embora compreensível, essa barreira precisa ser quebrada pelas pessoas. Como eu ensino em Data Science Unlocked, qualquer um de nós pode aprender os conhecimentos básicos suficientes para que analisemos dados com autoridade e proficiência. Basta vencermos os temores e darmos os primeiros passos para isso. Meu livro pode ser um ótimo caminho para ajudar as pessoas nesse empreendimento.