Inteligência Artificial e ChatGPT Da revolução dos modelos de IA generativa à Engenharia de Prompt
Fabrício CarraroSobre o livro
A origem da Inteligência Artificial vem das décadas de 1950 e 60, mas os anos de 2022 e 2023 viram uma revolução, com a chegada e popularização em tempo recorde das IAs generativas como o ChatGPT, o Bard, o Midjourney e muitas outras.
Se você acha esse tema fascinante, assim como eu, mas não sabe exatamente por onde começar a estudá-lo e quer entender como essas ferramentas fantásticas funcionam por baixo dos panos, este livro foi feito para você.
No capítulo 1, explicarei a base sobre o que é a Inteligência Artificial, seus diferentes tipos e classificações, e como ela já está muito presente no seu dia a dia mesmo sem você perceber.
No capítulo 2, entrarei na parte técnica, mas ainda de maneira suave e didática, para lhe explicar como as Inteligências Artificiais aprendem. Você terá os conceitos de Machine Learning, os diferentes tipos de aprendizado (Supervisionado, Não Supervisionado, Por Reforço etc.), redes neurais artificiais e Deep Learning.
No capítulo 3, demonstrarei o que é um modelo de linguagem, como eles funcionam, e contarei sobre a evolução da área e dos algoritmos de PLN (Processamento de Linguagem Natural), como N-grama, word embeddings, redes neurais profundas e os famosos Transformers, que possibilitaram a criação de LLMs como o ChatGPT.
O capítulo 4 será totalmente dedicado ao ChatGPT. Veremos com profundidade o que ele faz, como ele funciona por dentro, como os seus modelos foram treinados, além de tocar em tópicos como tokens, temperatura, alucinações e as diferenças do modelo GPT-4.
No capítulo 5, esmiuçarei um a um os parâmetros de calibragrem oferecidos no Playground da OpenAI e via API para os modelos GPT.
No capítulo 6, mergulharemos no mundo da Engenharia de Prompt, explicando os princípios mais importantes e as técnicas mais relevantes (Few-shot Prompting, Chain-of-Thought etc.) desenvolvidas por pesquisadores de empresas de IA e universidades do mundo todo, a fim de gerar prompts ideais e obter respostas mais precisas ao lidar com LLMs.
No capítulo 7, talvez o mais importante do livro, falarei de temas relacionados às limitações e à ética sobre a Inteligência Artificial. Aqui você se debruçará sobre tópicos que estão sendo discutidos exaustivamente em fóruns mundiais sobre IA, como as questões de privacidade, segurança, regulamentação, direitos autorais, fake news, viés, alinhamento e as possíveis repercussões no mercado de trabalho.
Para finalizar, o capítulo 8 será um "extra" apenas para pessoas desenvolvedoras ou para quem esteja aprendendo a programar, onde ensinarei como desenvolver um sistema de chatbot inteligente utilizando a linguagem de programação Python conectada à API da OpenAI e aos modelos GPT.
Certamente, este livro pode ser usado como ferramenta em disciplinas introdutórias que trabalham os conceitos de Inteligência Artificial, Machine Learning, redes neurais, Deep Learning e Processamento de Linguagem Natural com modelos de linguagem. Todas as referências bibliográficas estão descritas ao final de cada capítulo, caso você deseje se aprofundar ainda mais nos temas.
Que a leitura deste livro seja tão intelectualmente empolgante para você quanto o processo de escrita dele foi para mim. Aproveite para mergulhar nesse assunto, e espero que, ao final, você também se apaixone pelo mundo da Inteligência Artificial.
Vamos começar?
Prefácio
Quando decidi (na verdade, precisei) aprender Inteligência Artificial, existiam basicamente duas formas, que ainda estão disponíveis — iniciar pela matemática e computação, ou iniciar de forma empírica, seguindo tutoriais e desenvolvendo pequenos projetos que, com o passar do tempo, se tornam mais complexos, e todos os conceitos centrais da tecnologia são absorvidos em doses homeopáticas.
Já fazia mais de uma década que eu tinha me formado em engenharia e, por algum instinto masoquista, decidi começar pela matemática, para desenferrujar os neurônios. Claro que deu bem errado e, algumas semanas depois, eu joguei a toalha: aquilo era ciência de foguete para mim. Eu não conseguia sequer entender os termos usados nos artigos que lia, e muito menos formular buscas que me ajudassem a entender (este é, aliás, um dos motivos de ser tão fã e usuário do ChatGPT hoje em dia, porque muitas vezes, aprender a formular perguntas de forma adequada é tudo o que precisamos para aprender algo novo).
Alguns meses depois, a necessidade apertou ainda mais, e me vi realmente obrigado a me dedicar ao tema, mas dessa vez, decidi ir pelo outro caminho, provavelmente mais demorado, mas com maiores chances de dar certo... E deu!
Consegui encontrar alguns cursos bem introdutórios sobre o assunto, mas ainda assim, eu precisei fazer um trabalho inicial de pesquisa para poder entender quais eram as áreas da IA, qual a aplicabilidade de cada uma delas aos problemas que eu precisava resolver, para, finalmente, começar a buscar e fazer cursos, assistir a vídeos, seguir tutoriais e iniciar a minha jornada de aprendizado. Tudo de que eu precisava neste início era que alguém me ajudasse a entender o panorama mais amplo de IA, entender os principais fundamentos, termos, conceitos, tecnologias envolvidas e áreas de aplicação, para, finalmente, com a imagem toda em mente, decidir por onde começar. Levei algumas boas semanas para conseguir ter esta ideia geral, ainda que muito equivocada, depois de ler muita coisa (e quase desistir novamente). Este guia que eu tanto procurava está neste momento em suas mãos.
Com linguagem extremamente acessível, exemplos do mundo real e analogias extremamente didáticas, o Fabrício Carraro nos guia por este mundo de tecnologia que é a Inteligência Artificial, desmistificando a "ciência de foguete", que ainda pode ser a concepção do tema para muitos de nós.
Nos últimos anos, com Python se tornando a linguagem central para o desenvolvimento em Inteligência Artificial, é cada vez mais fácil implementar sistemas complexos utilizando algoritmos de computação paralela e distribuída sem que seja necessário ter um Mestrado ou Doutorado nessas áreas. Quando falo sobre a importância de processamento acelerado, paralelizado e distribuído, gosto sempre de lembrar que o modelo GPT-3.5 (por trás da primeira versão do ChatGPT) foi treinado por uma legião de 10.000 GPUs.
Constantemente me perguntam em eventos e palestras: "Por onde devo começar a estudar IA?". Sempre recomendo um overview da tecnologia e suas aplicações, que é exatamente o que este livro entrega e, depois disso, que se concentre na área que mais lhe atrai ou que mais se aplica ao problema que quer ou precisa resolver. Aí, é mãos à obra.
Uma segunda recomendação é que crie um projeto real para poder aplicar a tecnologia. "Estudar por estudar" não nos permite absorver tanto conhecimento como quando colocamos a mão na massa. Portanto, crie um projeto para o mundo real, aplique o que está aprendendo para construí-lo, e você verá que, no final do processo, além de ter aprendido bastante, já vai ter o seu primeiro projeto desenvolvido e aplicado a um problema real do seu dia a dia.
Se não pensa em nenhum problema específico, existem diversos sites na Internet, como o Kaggle (https://www.kaggle.com/), que propõe desafios constantemente e, neste caso, além de aprender, você ainda pode se juntar a um grupo de pessoas que estão aprendendo como você e, certamente, com pessoas que estão ali exatamente para compartilhar o conhecimento que têm. O conhecimento contraria a matemática, porque o multiplicamos a cada vez que dividimos.
Espero que esta leitura seja tão prazerosa para você como foi para mim, e que, ao final dela, esteja motivado a continuar seus estudos e tenha encontrado a área que mais lhe atrai.
Que a sua jornada de aprendizado seja tão divertida e com resultados concretos como está sendo a minha — e não se esqueça: compartilhe sempre o que aprender durante ela!
Jomar Silva
O autor
Fabrício Carraro nasceu em 1988 no ABC paulista. Sua formação compreende Engenharia da Computação pela UNICAMP e, mais recentemente, a Pós Tech de Data Analysis & Machine Learning pela FIAP. Atuou por anos na área de desenvolvimento de software, tendo passado por empresas como Griaule Biometrics e UOL PagSeguro.
Sua paixão pelo estudo de línguas estrangeiras o levou a mudar-se para a Alemanha e, posteriormente, para a Espanha, onde vive em Barcelona, mas considera-se um cidadão do mundo, já tendo visitado ou morado em cerca de 40 países. Atualmente, pode se comunicar em 14 idiomas em diferentes níveis, sendo eles o português, inglês, italiano, espanhol, russo, polonês, francês, alemão, grego, turco, croata, romeno, hebraico e holandês.
Atua na Alura como Product Manager e especialista técnico junto aos times de Marketing e Conteúdo, além de ter sido o líder da criação de produtos como o TechGuide.sh, o 7 Days of Code, bem como a Websérie de Inteligência Artificial. É também host do podcast Dev Sem Fronteiras, onde entrevista brasileiros e brasileiras que moram e trabalham na área de TI fora do país.
Com a popularização do ChatGPT e outras IAs generativas, mergulhou de cabeça na área de Inteligência Artificial, com foco principal nos LLMs (Large Language Models) e sua potencial atuação no campo da educação. Foi palestrante no Polyglot Gathering de 2023 com o tema "ChatGPT, AI, and the Future of Language Learning" (traduzindo, "ChatGPT, IA e o Futuro do Aprendizado de Idiomas").
Sumário
- 1 Introdução à Inteligência Artificial
- 1.1 O que é Inteligência Artificial?
- 1.2 Inteligência Artificial no seu dia a dia
- 1.3 Tipos de Inteligência Artificial
- 2 Como a Inteligência Artificial aprende?
- 2.1 Subáreas da Inteligência Artificial
- 2.2 Visão geral do processo de aprendizado
- 2.3 Machine Learning, o Aprendizado de Máquina
- 2.4 Redes Neurais e Deep Learning
- 2.5 Conclusão
- 3 Modelos de linguagem e como funcionam
- 3.1 O que é um modelo de linguagem?
- 3.2 O início e evolução de PLN e modelos de linguagem
- 3.3 LLM — Large Language Models
- 4 Como funciona o ChatGPT
- 4.1 O que é o ChatGPT
- 4.2 O que faz e como funciona o ChatGPT
- 4.3 Tokens
- 4.4 Como o ChatGPT foi treinado
- 4.5 Alucinações
- 4.6 GPT-4
- 5 Parâmetros de calibragem dos modelos GPT
- 6 Engenharia de Prompt
- 6.1 Princípios para a criação de um prompt
- 6.2 Zero-shot & Few-shot Prompting
- 6.3 Chain-of-Thought Prompting
- 6.4 Outras técnicas
- 7 Limitações e considerações éticas sobre a Inteligência Artificial
- 7.1 Privacidade, segurança e regulamentação
- 7.2 Direitos autorais
- 7.3 Fake news
- 7.4 Viés
- 7.5 Alinhamento
- 7.6 Mercado de trabalho
- 8 (Extra) Programando sistemas em Python com a API do GPT
Dados do produto
- Número de páginas:
- 223
- ISBN:
- 978-85-5519-359-0
- Data publicação:
- 12/2023