Resumo

Título do Artigo

O QUE FAZEM CIENTISTAS DE DADOS? Uma Revisão da Literatura Visando Identificar as Principais Habilidades de uma Profissão em Evidência
Abrir Arquivo
Ver apresentação do trabalho
Assistir a sessão completa

Palavras Chave

Ciência de Dados
Cientista de Dados
Data Science

Área

Tecnologia da Informação

Tema

Ciências de dados e Inteligência analítica

Autores

Nome
1 - Fabiano Castello
Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo - FEA - Administração
2 - Cesar Alexandre de Souza
Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo - FEA - Faculdade de Economia, Adinistração e Contabilidade da Universidade de São Paulo - FEA/USP

Reumo

A demanda de mercado por cientistas de dados aumentou na mesma medida em que aumentou a demanda por big data, e essa demanda surge não apenas de “startups” como também de grandes corporações, sob pressões competitivas globais por inovação e qualidade nas ofertas de serviços e produtos. Não há um consenso sobre o termo “cientista de dados”, particularmente em relação as habilidades que fazem de um profissional um cientista de dados. Este artigo propõe-se a trazer luz especificamente para este aspecto: o das principais habilidades de cientistas de dados, esta nova e pungente profissão.
O problema de pesquisa pode ser resumido como a falta de informações abundantes, consensadas e amplamente divulgadas sobre habilidades de cientistas de dados. O objetivo do artigo é apresentar um recorte específico sobre habilidades de cientista de dados, resultado de uma revisão sistemática de literatura realizada no contexto de pesquisa acadêmica de mestrado.
Este artigo foi produzido a partir de uma ampla revisão sistemática de literatura foi planejada e conduzida, visando, através de uma busca consistente e parametrizada, identificar e interpretar todas as informações existentes sobre o tema estudado, de forma completa e imparcial. Buscas foram pesquisadas nas bases de publicações científicas ACM, EBSCO, Elsevier Science Direct, Google Scholar, IEEE, Proquest, Scopus e Web of Science, produzindo 2.245 documentos. Os documentos foram analisados e 54 foram lidos integralmente. Destes, 30 apresentaram conteúdo passível de extração de habilidades.
Cientistas de dados dependem de um arcabouço de infraestruturas e aplicações para realizar seu trabalho. Por ser um campo amplo, existem muitas tecnologias e técnicas, não apenas tradicionais como também emergentes, que crescem anualmente, criando um cenário heterogêneo. Os 30 artigos analisados produziram 4 tabelas de habilidades de cientistas de dados, segregadas da seguinte forma: (a) “Hard Skills”, segregados em “Conhecimentos Gerais em Computação e Desenvolvimento de Sistemas”, “Conhecimentos Gerais em Negócios” e “Inteligência Artificial”; e (b) “Soft Skills”.
Com base nos resultados encontrados é possível sugerir que duas características relevantes são a quantidade e a heterogeneidade das habilidades encontradas. Estas duas características, em conjunto, sugerem que cientistas de dados são profissionais super-qualificados, ou seja, que para desempenhar suas atividades são necessárias muitas habilidades. Adicionalmente, podem existir “famílias” ou grupos de cientistas de dados baseado na homogeneidade de suas habilidades.
Por tratar-se de um artigo baseado em revisão de literatura, a bibliografia é extensa (mais de 40 referências, apenas neste artigo)