Introdução à Estatística para Ciência de Dados Da exploração dos dados à experimentação contínua com exemplos de código em Python e R
Tatiana Escovedo, Marcos Kalinowski, Thiago MarquesConteúdo
Em um mundo cada vez mais data-driven, a capacidade de entender e aplicar conceitos de Estatística na Ciência de Dados se torna cada vez mais essencial para tomadas de decisões estratégicas que podem ter impactos cruciais no negócio. Profissionais da área estão aprofundando seus conhecimentos em estatística aplicada, a fim de desenvolver um conjunto de competências e ferramentas para abordar com eficácia a incerteza subjacente a essas decisões. Por meio da aplicação de métodos estatísticos, os cientistas de dados têm a habilidade de traduzir dados em informações valiosas, transformando o território complexo da incerteza em uma área de atuação clara e informada. Enquanto a Estatística oferece o rigor metodológico e as bases para inferências confiáveis, a Ciência de Dados expande as possibilidades com técnicas computacionais avançadas e modelos complexos, capazes de lidar com o volume, a velocidade e a variedade dos dados modernos. Juntas, essas disciplinas permitem resolver problemas altamente complexos.
Neste livro, Tatiana Escovedo, Thiago Marques e Marcos Kalinowski trazem um guia prático e acessível que cobre desde os fundamentos da estatística até suas aplicações em análises exploratórias de dados, modelagem para Machine Learning e experimentação contínua, utilizando Python e R. Com uma abordagem passo a passo, os autores descomplicam a estatística e demonstram sua importância e aplicabilidade na prática da Ciência de Dados. Você terá ainda diversos exemplos práticos para estudar e treinar suas habilidades analíticas para transformar dados em insights relevantes para a tomada de decisões. De fato, muitas vezes é por saber explorar as incertezas que surgem as oportunidades mais significativas, e a Ciência de Dados é o guia confiável para desbravar esse terreno desafiador.
Sumário
- 1 Introdução
- 1.1 Por que estudar Estatística para Ciência de Dados?
- 1.2 Conceitos fundamentais
- 1.3 Estatística e Ciência de Dados
- 2 Estatística Descritiva: Conceitos básicos, tipos de variáveis e gráficos
- 2.1 Conceitos básicos
- 2.2 Variáveis e tipos de variáveis
- 2.3 Gráficos adequados a cada tipo de variável
- 2.4 Correlação
- 3 Estatística Descritiva: Medidas de tendência central e de dispersão
- 3.1 Medidas de tendência central
- 3.2 Medidas de dispersão
- 3.3 Boxplot, ou diagrama de caixas
- 3.4 Resumo
- 4 Cálculo das Probabilidades: Conceitos e fundamentos
- 4.1 Conceitos fundamentais em probabilidade
- 4.2 Axiomas de probabilidade de Kolmogorov
- 4.3 Atribuição das probabilidades
- 5 Cálculo das Probabilidades: Distribuições de probabilidade discretas e contínuas
- 5.1 Distribuições de probabilidade discretas
- 5.2 Distribuições de probabilidade contínuas
- 6 Inferência Estatística: Noções de amostragem e reamostragem
- 6.1 Teorema central do limite
- 6.2 Tipos de amostragem casuais/probabilísticas
- 6.3 Tipos de amostragem não casuais/não probabilísticas
- 6.4 Reamostragem
- 6.5 Intervalos de confiança
- 7 Inferência Estatística: Modelagem Estatística - Introdução aos algoritmos de Machine Learning e comparação de modelos
- 7.1 Problemas de Machine Learning
- 7.2 Algoritmos de Machine Learning
- 7.3 Exemplo prático
- 8 Experimentação Contínua
- 8.1 Experimentação Contínua na Ciência de Dados
- 8.2 Hipótese
- 8.3 Teste de hipótese
- 8.4 Teste de normalidade
- 8.5 Homocedasticidade
- 8.6 Testes de hipótese paramétricos
- 8.7 Testes de hipótese não paramétricos
- 8.8 Tamanho do efeito (effect size)
- 8.9 Considerações finais
Autores
Tatiana Escovedo
Tatiana Escovedo é Gerente Geral de Transformação Digital da Petrobras. Além disso, atua como professora do Departamento de Informática da PUC-Rio, onde coordena a Pós-Graduação lato sensu de Ciência de Dados e Analytics e colabora com pesquisas nas áreas de Ciência de Dados e Engenharia de Software. É doutora em Engenharia Elétrica, na área de Métodos de Apoio à Decisão, mestre em Informática na área de Engenharia de Software e bacharel em Sistemas de Informação, todos pela PUC-Rio. É autora de diversos livros e artigos na sua área de atuação.
Thiago Marques
Thiago Marques é Analista Censitário em Métodos Quantitativos no IBGE e CEO da Comunidade de Estatística do prof. Thiago Marques. É bacharel em Estatística pela ENCE/IBGE (Escola Nacional de Ciências Estatísticas). Nos últimos anos, atuou como coordenador e professor em MBAs e Pós-Graduações lato sensu na área de dados. Possui experiência como consultor em estatística e Analytics em diversas empresas. É criador do maior canal do YouTube de Estatística e Ciência de Dados da América Latina, o EstaTiDados.
Marcos Kalinowski
Marcos Kalinowski é Professor Associado do Departamento de Informática da PUC-Rio, onde orienta pesquisas de mestrado e doutorado nas áreas de Engenharia de Software e Ciência de Dados e coordena projetos de pesquisa e desenvolvimento junto a diversas empresas. É doutor e mestre em Engenharia de Sistemas e Computação na área de Engenharia de Software e bacharel em Ciência da Computação, todos pela UFRJ. É bolsista de produtividade em pesquisa do CNPq e possui mais de 150 artigos publicados nos principais veículos da sua área de atuação.
Dados do produto
- Número de páginas:
- 205
- ISBN:
- 978-85-5519-380-4
- Data publicação:
- 06/2024