Da indústria de aviação para ciência de dados
Por Danilo Borges

Da Engenharia Aeronáutica para Ciência de Dados
Paulo Shindi: “Fiz uma entrevista com o Danilo Borges para contar um pouco da sua jornada de transição de carreira. Ele trabalhou por 7 anos com projetos aeronáuticos na Embraer e migrou para área de ciência de dados na WMcCann, uma das maiores agências de publicidade do mundo. Ele atuou como cientista de dados e, posteriormente, como líder técnico.”
- Pode nos contar um pouco sobre sua carreira na indústria e o que despertou seu interesse pela ciência de dados?
Eu me graduei em Manufatura Aeronáutica em 2013. Até então, só tinha estudado e feito iniciação científica. Em 2014, prestei um processo seletivo para a Embraer, onde fui aprovado em um programa de capacitação de projetistas aeronáuticos (PPE). Esse foi o início da minha carreira na indústria.
Ao longo de 7 anos, tive muitas experiências incríveis, como trabalhar em quase todos os aviões da empresa (aviação civil, militar e executiva), participar de um programa de transferência de tecnologia que ocorreu na Suécia, puxar iniciativas de inovação e automação para a área de projetos aeronáuticos, entre outras coisas. Nesse período eu também me formei na segunda graduação, dessa vez em engenharia mecânica. Talvez, para quem observasse de fora, minha carreira parecesse caminhar muito bem, mas não era bem assim para mim.
Por volta de 2018, ano em que virei engenheiro, eu já tinha adquirido bastante experiência no que eu fazia e já era capaz de conduzir as atividades sem a necessidade de supervisão. Por mais que eu gostasse da área, aquilo não era mais o que movia minhas engrenagens. Eu me sentia pouco desafiado, sendo os principais motivos disso a natureza das atividades de projeto e a minha própria natureza curiosa. Eu sempre fui muito agitado e questionador, curioso sobre o funcionamento de tudo, e estava me vendo em uma posição com poucos desafios, onde não se tinha muito mais o que aprender (era tudo um pouco do mesmo). Em paralelo a isso, começavam a se intensificar as conversas sobre novas tecnologias que estavam ganhando certa maturidade naquele momento, como os vídeos com deepfake e o GPT-2 (antecessor do nosso querido ChatGPT). Para mim, aquilo foi uma luz no fim do túnel! Naquele momento, eu estava vislumbrando um universo repleto de coisas para explorar. Só dependia de mim para abrir a porta e entrar.
- Quais foram os primeiros passos que você deu para iniciar a transição para a ciência de dados?
Após ler inúmeros artigos sobre o que mais se falava no momento (redes neurais, deepfake e GPT-2), eu estava obcecado! Eu queria muito aprender a fazer coisas como aquelas, mas não tinha a mínima ideia de por onde começar. Naquele momento, o contato mais próximo que eu tinha tido com programação foi como mero expectador. Eu entendia um pouco da lógica, mas não tinha noção nem de como fazer um simples “Hello World”. Eu precisava de um plano.
Depois de pesquisar bastante, eu tracei um roteiro e decidi colocá-lo em prática. A ideia era simples: começar com um curso de excel e VBA (isso parecia fazer sentido pra mim no tempo) e avançar para um curso de redes neurais em Python. A plataforma que eu escolhi para dar esse primeiro passo foi a Udemy. Ali, no final de 2018, eu começava a dar os primeiros passos da minha jornada!
- Quais cursos você fez para facilitar a transição e quais você recomendaria para quem está pensando em fazer o mesmo?
Após os cursos da Udemy, eu iniciei uma pós-graduação em inteligência artificial e aprendizado de máquina pela Pontifícia Universidade Católica de Minas Gerais (PUC Minas), que me deu o título de especialista. Embora seja um curso bem introdutório, ele aborda as principais metodologias e ferramentas utilizadas para desenvolver e gerenciar projetos de dados. Além disso, ele é ministrado por uma ótima instituição de ensino e tem um preço bem acessível.
O segundo curso foi o MBA em data science e analytics pela Escola Superior de Agricultura Luiz de Queiroz da Universidade de São Paulo – USP (USP ESALQ), que será finalizado agora em julho de 2024. Esse curso, em relação ao primeiro, é um pouco mais denso na parte teórica da modelagem. A USP segue por um caminho mais focado nos principais métodos utilizados no cenário de ciência de dados, dando ênfase na explicação de como as coisas funcionam e o motivo delas serem feitas daquele jeito. Um excelente curso para reforçar conhecimentos e refinar habilidades.
Além das formações acadêmicas, fiz alguns cursos específicos de estatística no Datacamp. Os cursos oferecidos por eles são bem elaborados, com um conteúdo simplificado, porém sem perder a essência e complexidade dos assuntos.
Reforço que a curiosidade é a principal arma para aprender algo novo. No tempo da minha primeira especialização, além das horas dedicadas ao conteúdo oficial, a primeira e a última coisa que eu fazia no dia era ler artigos. Ao acordar, eu pegava o celular para ver o que tinha de novo nas principais comunidades de dados e lia enquanto tomava café. Isso se repetia no período da noite, quando eu me deitava para dormir.
Tutoriais de comunidades podem ser bons guias de como implementar um novo método, mas costumam ter muitas falhas metodológicas. Para aprender de verdade, eu fortemente recomendo que você busque artigos científicos em bases acadêmicas confiaveis (www.scielo.br e www.scopus.com são bons exemplos de bases confiáveis). Sempre que quiser aprender uma técnica nova, pesquise as aplicações práticas que estão sendo feitas pela comunidade científica. Se possível, procure o artigo seminal para entender qual era o objetivo do autor ao propor aquele método.
Não se esqueça, mantenha-se curioso e questionador!
- Quais foram os maiores desafios que você enfrentou durante a transição?
Eu acredito que o maior desafio foi ingressar efetivamente na área. Ser chamado para uma entrevista ou contratado é algo que está completamente fora das suas mãos, dependendo mais de sorte do que de capacitação. Por mais que você tenha a formação adequada, a falta de experiência comprovada se torna uma das grandes barreiras para receber uma proposta.
No meu caso, eu conhecia uma cientista de dados que já trabalhava na área. Ela recebeu uma proposta via LinkedIn, mas recusou e me indicou. Deu certo pra mim, mas infelizmente não tem uma fórmula certa pra isso.
- Como a sua experiência na indústria ajudou na sua nova carreira em ciência de dados?
A minha experiência na Embraer foi de grande ajuda na área de ciência de dados. Algumas práticas estão presentes até hoje no meu cotidiano. Por ser uma das maiores empresas no ramo da aviação do mundo, a Embraer costuma adotar muitas práticas de organização e excelência empresarial. As principais práticas que levo comigo são a de padronização das atividades (trabalho padrão), gates de qualidade e registro detalhado dos projetos. Para uma indústria em um ramo tão importante como a aviação, onde vidas estão em jogo todos os dias, é importante que as coisas sejam padronizadas, possibilitando que a execução ocorra sempre da mesma forma. Os procedimentos devem ser documentados e desenhados de forma que não ocorram falhas. Além disso, os processos precisam ser auditáveis, possibilitando assim a validação das práticas de segurança.
Se pararmos para pensar, essas práticas visam reduzir os desvios no desenvolvimento de um produto, garantindo que sempre sejam aplicadas as melhores práticas do ponto de vista de projeto e de segurança. Para ciência de dados, a lógica é a mesma! Bastou adaptar os processos para o contexto de dados e continuar aplicando o que eu já conhecia.
- Você pode descrever um pouco sobre a sua atuação como Cientista de Dados Sênior e Líder Técnico?
É uma montanha-russa de emoções! Atuar como líder técnico é muito legal. Você se coloca numa posição não só de referência técnica, mas de mentor. Do meu ponto de vista, as habilidades que mais definem um sênior/líder técnico são gerenciar, capacitar e delegar. Como ponto focal, o sênior deve atuar como uma ponte entre o time e os gestores. Ele deve ser capaz de, junto aos gestores, dimensionar as atividades de forma com que elas possam ser cumpridas adequadamente, sem exaurir ninguém. Além disso, ele precisa amparar os outros membros do time, promovendo capacitação e servindo como um guia. Na minha opinião, a parte mais difícil é delegar atividades. Eu sou uma pessoa muito crítica comigo mesmo, então levou um tempo para eu chegar em um tom correto para conduzir isso. A melhor maneira de ter confiança em delegar as atividades para os outros é estar presente no momento certo quando necessário. Eu incentivo as pessoas a questionarem, não ficarem com dúvida. Enquanto você se sentir inseguro, pode me procurar. Uma, duas, três, dez ou cem vezes. Eu prefiro investir 20 ou 30 minutos do meu tempo, em toda atividade, garantindo que o trabalho está no caminho certo, do que ter que perder tempo depois com retrabalho por coisas que poderiam ter sido evitadas. Entender isso foi uma virada de chave incrível para o meu lado profissional e pessoal.
Além disso, existe a parte dos projetos. Diferente dos toy problems que costumamos encontrar nas comunidades de dados, os projetos da vida real costumam ser complexos e desafiadores. Uma das minhas funções como líder técnico é transformar as necessidades e requisitos dos clientes em soluções robustas de dados. É importante ter em mente que cada projeto terá suas peculiaridades. Existirão projetos complexos que serão resolvidos com soluções simples, assim como projetos simples que precisarão de um conjunto de soluções complexas para atingir o resultado esperado. Na maioria das vezes, não existe um padrão.
- Quais são as principais habilidades e ferramentas que você utiliza como Cientista de Dados?
Acredito que a principal habilidade seja a interpretação de texto! Parece brincadeira, mas a verdade é que você só começa um projeto com soluções de dados após entender bem o problema do negócio. Essa etapa é fundamental para o sucesso de qualquer desenvolvimento e eu recomendo que você dedique bastante tempo a ela. Além disso, analogias são extremamente importantes. Para exercitar isso, recomendo que você estude outras resoluções de problemas, mesmo que não sejam da área de dados. Se pergunte como aquilo poderia ser aplicado no seu problema. Muitas técnicas foram criadas analogamente a outras situações como alguns algoritmos de otimização baseados em comportamentos da natureza (meta-heurísticas), ou em alguns campos da engenharia mecânica, onde é possível modelar o movimento de alguns sistemas mecânicos por meio de circuitos elétricos análogos.
As analogias vão ser muito úteis também na hora de contar histórias. Com elas, é possível explicar com clareza temas muito complexos para pessoas das mais diversas áreas de estudo, sem que elas necessariamente precisem saber matemática. Por isso, pratique analogias!
Já em habilidades técnicas, a estatística, na minha opinião, é a habilidade mais importante pra mim, pois está presente na maioria das atividades que eu desenvolvo. Eu sei que muitos lugares afirmam que Python e SQL são as principais habilidades de um profissional de dados, mas eu discordo. Python e SQL são ferramentas, assim como uma calculadora. Como cientista de dados, é preciso ter uma noção clara de probabilidade, modelos probabilísticos, distribuições, amostragem, testes de hipótese, modelos estatísticos clássicos, entre outras técnicas e conceitos. Você só conseguirá ser um bom cientista de dados se você souber como funcionam as técnicas que você está utilizando e quando utilizá-las.
As ferramentas que mais utilizo no meu dia a dia: Python, R, Excel (dedique um tempo para aprender algumas coisas sobre esse cara aqui, ele vai te ajudar bastante com análises rápidas), SQL e Power BI.
- Há algum projeto ou realização na sua carreira em ciência de dados que você gostaria de destacar?
Nesses últimos três anos, estive envolvido no desenvolvimento de um otimizador de resultados de campanhas publicitárias. De maneira resumida, a ferramenta retorna sugestões otimizadas de distribuição de recursos entre os canais de mídia, tendo como objetivo maximizar os resultados oriundos das campanhas publicitárias.
Esse projeto foi muito importante para minha carreira por inúmeros motivos. Só a parte de planejamento daria um TCC completo! Aqui, todas as etapas preliminares foram abordadas: entendimento do problema de negócios, avaliação dos dados disponíveis, avaliação dos processos de geração de dados, avaliação da qualidade dos dados, avaliação dos processos, etc. Essa etapa foi muito importante para trazer um direcionamento, pois inicialmente não tínhamos noção de como chegaríamos no resultado esperado.
A etapa de modelagem foi outro desafio. Diferente dos problemas tradicionais de classificação, regressão e clusterização, a modelagem para otimização tem como objetivo desmembrar os efeitos de cada variável nos resultados. Para esse tipo de problema, o resultado esperado é uma equação que descreva o comportamento da variável em questão, possibilitando assim simular os resultados para cada situação. Além dos desafios da modelagem, a parte da otimização foi um universo à parte. Diferente de outros problemas clássicos de otimização, a solução adotada aqui precisou ser feita em duas etapas: uma etapa de otimização local, onde buscam-se as melhores soluções por canal de mídia, assim como uma etapa de otimização global, onde busca-se o melhor resultado total. Embora seja simples de entender, é um processo complexo e demorado, visto que o otimizador busca não só a melhor distribuição entre os canais de mídia abordados, mas também a melhor forma de aplicar os investimentos por canal ao longo do tempo. E antes que me pergunte, sim! A parte do otimizador foi tema do TCC de um grande amigo que trabalhou junto comigo (falarei disso em breve).
Em resumo, eu enxergo esse projeto como um ponto importante da minha carreira. Ele não só me trouxe um mar de conhecimento, como me permitiu gerenciar e executar um projeto de ponta a ponta. Quase todas as etapas da metodologia CRISP-DM foram abordadas aqui. Foram dias de planejamento, pesquisa, adaptação, implementação e teste. Sem dúvidas, foi incrível fazer parte da idealização e realização desse projeto.
Quanto ao que eu falei anteriormente, um cientista de dados que participou do desenvolvimento do projeto decidiu apresentar nossa solução à comunidade científica. O desenvolvimento do otimizador virou tema de TCC (MBA) e deu origem a um artigo científico, no qual eu sou co-autor. O artigo intitulado Differential Evolution Framework for Budget Optimization in Marketing Models with Saturation and Adstock Effects foi aprovado no evento 11th International Conference on Information Technology and Quantitative Management, realizado pela Procedia Computer Science, e será publicado em breve.
- Que conselhos você daria para quem está pensando em fazer uma transição de carreira semelhante?
Meu conselho é acreditar e lutar por isso. A transição de carreira é assustadora e desafiadora. Você é obrigado a sair da zona de conforto, precisa estudar muito e se colocar à prova inúmeras vezes. Mesmo quando você se acha apto a concorrer por uma vaga na área, enfrenta a enorme muralha dos processos seletivos. É desesperador você ter se preparado tanto e só precisar de uma oportunidade para mostrar o que sabe, mas simplesmente não ser nem ao menos chamado para conversar, para mostrar o que você sabe.
Você depende mais da sorte do que do seu esforço, e isso é extremamente frustrante. Sei que dá vontade de desistir, chorar, voltar para a sua zona de conforto. Você muitas vezes vai se questionar se seu esforço foi em vão ou pensar em desistir. Sei que você vai se sentir encurralado, estagnado, sem vontade de levantar da cama pela manhã. Mas quero que você saiba: você não está sozinho.
Não se trata de você, da sua formação ou do seu esforço. Não se trata de você não ter dado duro o suficiente, não ter feito os cursos X, Y, Z ou não ter participado de determinado evento. Infelizmente, se trata de sorte. Será necessário passar por isso e enfrentar ansiedade, depressão, síndrome do impostor, fome emocional e outras coisas do tipo. Mas eu garanto pra você, é possível! Não desanime e não desista, uma hora dá certo.
Como cientista de dados, meu conselho é: quando um evento é muito improvável de acontecer, o segredo é aumentar o número de tentativas. Eventualmente, o resultado esperado vem! Não desista, continue estudando e bata na porta até que alguém abra para você.