Machine Learning Introdução à classificação

Guilherme Silveira, Bennett Bullock

*Você terá acesso às futuras atualizações do livro.

Conteúdo

Nós, como seres humanos, sabemos facilmente distinguir uma informação de outra, e por meio da experiência, podemos tirar conclusões em decisões simples, como reconhecer se um animal é um cão ou um porco, se um e-mail é spam ou não, decidir se uma movimentação bancária é uma fraude. O computador pode aprender de forma similar, em um processo chamado de classificação dentro da área de machine learning.

A classificação é uma ferramenta para responder perguntas, mas antes é preciso saber quais e quantas perguntas fazer, a partir de quais informações, e ainda, como interpretar as respostas.

Neste livro, Guilherme Silveira e Bennett Bullock mostram como o computador aprende com uma base de dados e algoritmos para responder perguntas do dia a dia, com uma aplicabilidade crescente no mundo dos negócios, cada vez mais apurada, conforme mais dados estão disponíveis. Por meio de variáveis numéricas e categóricas, você vai treinar modelos matemáticos computacionais em Python que nos ajudam a tomar decisões e prever comportamentos, como quando um funcionário está próximo de pedir demissão ou qual será o próximo passo de um usuário em um site.

Saiba o que você vai aprender

 

Sumário

  • 1 Classificando e-mails, animais e muito mais
  • 1.1 Resumindo
  • 2 Importando, classificando e validando um modelo
  • 2.1 E no mundo real, como classificar dados da web?
  • 2.2 Importando, classificando e validando um modelo
  • 2.3 Importando os dados
  • 2.4 Analisando os valores adicionados
  • 2.5 Melhorando a leitura do código
  • 2.6 Acertando demasiadamente?
  • 2.7 Resumindo
  • 3 Classificação de variáveis categóricas
  • 3.1 Instalando o Pandas
  • 3.2 Resumindo
  • 4 O problema do sucesso e o algoritmo burro
  • 4.1 Implementando o algoritmo base
  • 4.2 Calculando a quantidade de zeros e uns com o data frame
  • 4.3 Lidando com sim e não
  • 4.4 Utilizando collections do Python
  • 4.5 Resumindo
  • 5 Naive bayes e maximum a posteriori por trás dos panos
  • 5.1 Resumindo
  • 6 Testando diferentes modelos e validando o vencedor
  • 6.1 Algoritmo AdaBoost
  • 6.2 Resumindo
  • 7 Novos conceitos de classificação
  • 7.1 Classificando um elemento com três categorias
  • 7.2 Resumindo
  • 8 Utilizando o k-fold
  • 8.1 Implementando o k-fold
  • 8.2 Implementando o novo fit_and_predict
  • 8.3 Resumindo
  • 9 Criando um dicionário
  • 9.1 Resumindo
  • 10 Classificando os textos e ganhando produtividade na empresa
  • 10.1 Resumindo
  • 11 Quebrando na pontuação adequada
  • 12 Conclusão
  • 12.1 O caminho
  • 12.2 Como continuar os estudos

Autores

Guilherme Silveira

Guilherme Silveira Guilherme Silveira é líder técnico na Caelum e no Alura, cofundador do GUJ.com.br e um dos criadores do VRaptor. Especializou-se na área de ensino de Desenvolvimento de Software e é um dos principais autores dos cursos online do Alura. Ele pode ser encontrado no twitter em @guilhermecaelum.

Bennett Bullock

Bennett Bullock Bennett Bullock é um profissional com 14 anos de experiência no campo de aprendizagem de máquina e NLP. Ele tem desenvolvido tecnologias de classificação de texto, de pesquisa (na qual obteve uma patente), e de análise financeira para vários clientes no governo americano e na comunidade financeira. Ele é mestre em linguística árabe pela Universidade de Georgetown, e em bioengenharia pelo MIT.

Dados do produto

Número de páginas:
407
ISBN:
978-85-94188-18-2
Data publicação:
10/2017

Compartilhe!

Compartilhe no Facebook Compartilhe no Twitter