Cientista de Dados

Cientistadedados_InfogrficosemHeader   A demanda continua em expansão mesmo com o mercado de trabalho brasileiro em retração. “Crise? Que crise” dirá, provavelmente, um cientista de dados qualificado. Raro porque não é tão fácil assim encontrar profissionais que atendam à tríade exigida pela profissão: conhecimentos de programação, estatística/matemática e visão de negócios. “É uma carreira nova no Brasil, e estamos percebendo um aumento exponencial na demanda por profissionais. Em contrapartida, ainda não temos muitas pessoas sendo formadas nessa área”, diz Henrique Gamba, diretor geral da Yoctoo, recrutamento especializado em TI. Segundo ele, a crise não fez cair os salários para estes profissionais: a partir de 9 mil reais para quem tem entre 3 e 4 anos de experiência e até 22 mil para um especialista na área. “É que a geração, captação e armazenamento de dados, em volume cada vez maior (big data), é a chave para o direcionamento e estratégia de qualquer negócio”, diz Gamba. As empresas que mais contratam cientistas de dados são as fornecedoras de soluções de tecnologia (de big bata) e aquelas que trabalham intensivamente com dados como instituições financeiras, institutos de pesquisa, internet, e-commerce, bureaus de crédito, etc. As diferentes fases do trabalho de um cientista de dados “O coração da atividade de um cientista de dados é analisar uma massa de informações para fazer inferências”, diz Lucas de Paula da Neoway, empresa que oferece soluções de inteligência de negócios. O dado é a matéria bruta do cientista. Mas seu primeiro desafio é pensar na pergunta certa a ser feita para chegar na resposta que o negócio precisa responder. A partir desta questão é que começa o trabalho de captar e preparar os dados. Com o terreno preparado, é hora de aplicar fórmulas matemáticas. Para isto, modelos estatísticos são elaborados e hipóteses criadas e testadas. “Ele usa a matéria prima (dados) para tirar insights, gerar estas hipóteses que serão postas à prova com trabalho estatístico e matemático”, diz Lucas. A validação científica destas inferências é o que trará, de fato, a resposta de valor para os negócios. O próximo passo é apresentar as conclusões para clientes externos e internos. “Saber comunicar é igualmente importante. Muitas vezes é preciso convencer o cliente de que o modelo é exato”, diz ele. A análise dos dados e suas conclusões é como combinar as notas tocando piano e produzir uma música, compara Lucas. Mas para tocar este piano, é preciso antes carregá-lo e deixá-lo pronto para ser usado, o que, na linguagem da ciência de dados, significa preparar as informações coletadas. “A diferença entre um estatístico e um cientista de dados é que o primeiro precisa dos dados já prontos para trabalhar e o segundo tem a versatilidade de fazer esta preparação, tem as chamadas hacking skills (habilidades de hackeamento), que o estatístico não tem. Combinação de habilidades e trabalho em equipe Justamente por ser extremamente difícil combinar todas estas habilidades, o mais comum é formar equipes com profissionais que se complementam. “Fazemos um mix e montamos equipes. Um profissional de computação fica encarregado de fazer a preparação, trabalha em conjunto com quem faça análise matemática e embutimos também conhecimento de negócios”, diz Monica Tyszler, diretora de soluções e serviços do SAS América Latina. A falta de alguma das habilidades compromete todo o sucesso no trabalho. “Se há expertise em computação e matemática, mas nenhuma em negócios, não será possível descobrir qual é o problema que a empresa precisa resolver”, diz De Paula. Mais expertise na área computação e de negócios e nenhuma em matemática e estatística vai resultar em prejuízos no rigor da análise. E por fim, a ausência de conhecimento em computação impede a extração de um volume significativo de dados que é o que, em última instância, tem a capacidade de trazer valor em termos de negócios. Na Neoway, De Paula forma duplas de trabalho para garantir que todas as habilidades estejam à mesa. “Por exemplo, temos aqui um físico e um especialista em econometria que atuam juntos”, diz. As formações mais frequentes dos cientistas de dados em ação hoje Nos Estados Unidos, algumas universidades já possuem programas de formação conceituados. Mas por se tratar de atividade nova, grande parte dos profissionais que atuam hoje na área veio de outras formações acadêmicas. Estatística, engenharia, matemática, física são bastante frequentes nos currículos dos profissionais, segundo o diretor geral da Yoctoo. “Importante notar que formações como mestrado e doutorado são quase sempre mandatórias”, diz Gamba. Segundo ele, carreiras que facilitam a migração para a área são inteligência de negócios, estatística ou tecnologia, de modo geral. Na opinião da diretora do SAS, a formação em engenharia de produção atrelada à engenharia de computação dá uma boa base para quem quer seguir carreira na área de ciência de dados. “Tem aula de programação, matemática estatística, pesquisa e há o conhecimento de negócios aplicado à engenharia de produção”, explica. Saber programar e ter conhecimentos de sistemas gerenciadores de bancos de dados é essencial. Grande parte das linguagens usadas neste ramo são open source, ou seja, código aberto. Na Neoway, as equipes trabalham com as linguagens Python, R, Spark, Scala, Go e os gerenciadores de bancos de dados MongoDB, SQL, Elasticsearch, Neo4j, Cassandra e o sistema de mensagens Apache Kafka. O SAS é uma das empresas que investem na qualificação de profissionais. “Começamos com um curso de formação de cientista de dados nos Estados Unidos e a ideia foi trazer para o Brasil”, diz Mônica. Técnicas de gerenciamento de big data, de análises avançadas, de visualização de dados, machine learning e técnicas de comunicação que também são essenciais para os cientistas de dados, a Academia para Ciência de Dados do SAS é uma opção para quem quer certificação nesta área. Fonte: Exame e BlogBrasil

Loading