Data Science ou ciência de dados é uma área interdisciplinar que ultiliza métodos para extrair valor ou informações dos dados. Esse campo vem expandindo-se nos últimos anos, principalmente no setor de negócios, permitindo entrega rápida e eficaz de resultados como solução de problemas. Por meio desse campo, é possível desenvolver análises e visualizar dados através de tabelas ou gráficos.
Neste curso, você conhecerá mais sobre os conceitos de Data Science, aprenderá de maneira prática e teórica sobre definições, fundamentos, técnicas, programas e algoritmos capazes de analisar dados. O estudante terá contato com programas, como SPSS e PAST (criados para análises estatísticas) e o jupyter-notebook (construído para uso instrumental e técnico em programação voltada a Pyhton).
Bibliotecas como NumPy, Pandas e Sklearn serão utilizadas em Python a fim de criar e avaliar datasets (conjunto de dados). Serão apresentadas técnicas supervisionadas e não supervisionadas, e algumas delas terão explicação de fato instrumental e aplicada, como regressão, por exemplo. O material contém explicações sobre descoberta de insights através de estudo de vizinhos, agrupamentos, entropia, entre outros. Cálculos matemáticos serão passados a fim de dar consistência aos usos dos programas, podendo o profissional tender mais para a programação ou para o cálculo, como melhor se ajustar.
Soluções para problemas de sobreajuste serão citadas, bem como avaliações por custo-benefício, lucro esperado, taxas de erro, análises de matriz de confusão e análises de precisão. Para estimar desempenho, a aprendizagem abordará curvas de ROC e outras técnicas, e, para estimar tendências, serão utilizadas técnicas como classificação de naive bayes. O aluno verá, ainda, conceitos aplicados à Mineração e Engenharia de dados, além da aplicabilidade da ética, a fim de evitar problemas de aplicação e não deixar de lado a responsabilidade social.