O que é machine learning? O segredo por trás da magia do ChatGPT

Machine learning ou aprendizado de máquina é uma expressão que está sempre em alta mas o que ela significa? E como está relacionada ao ChatGPT?

Machine learning: o que está por trás das ferramentas de inteligência artificial que vemos hoje em dia?
Machine learning: o que está por trás das ferramentas de inteligência artificial que vemos hoje em dia?

Aprendizado de máquina ou machine learning é um nome que provavelmente está sempre associado com inteligência artificial. A ideia muita vezes é de que são sinônimos de tanto aparecerem juntos mas há diferenças entre os dois. Estamos falando de uma das técnicas dentro da área de Inteligência Artificial.

O machine learning nasceu com a ideia de ensinar máquinas a aprenderem a fazer tarefas através de observação de padrões. Isso é uma forma de imitar como humanos aprendem: desde que nascemos observamos padrões e aprendemos através deles. Por exemplo, nós sabemos o que é um gato porque desde que nascemos observamos o animal em diversos lugares.

Mas o que é machine learning realmente? Por que ele é usado hoje em tantos lugares? E inclusive podemos encontrá-los em ferramentas famosas como ChatGPT e sistemas de recomendação de sites e redes sociais.

Inteligência artificial

Definir o que é inteligência artificial pode ser uma tarefa complicada dependendo da referência que usar. Uma definição famosa vem desde Alan Turing com seu artigo sobre máquinas pensantes. No artigo Computing Machinery and Intelligence, Turing define que uma máquina poderia pensar se conseguisse resolver tarefas que um ser humano consegue.

Usando a análise de Turing, inteligência artificial é tudo aquilo que um computador consegue fazer que um ser humano também consegue fazer.

Por essa definição, até mesmo um código escrito por humano com orientações poderia ser considerado inteligência artificial. Porém, quanto mais complexo um problema é, mais complexo esse código teria que ser. Foi então que no final da década de 50, um cientista da computação introduziu a ideia que máquinas poderiam aprender sozinhas.

Por que machine learning?

A ideia de machine learning nasceu com o cientista da computação Arthur Samuel no final da década de 50, nove anos após o artigo de Turing. Nele, Samuel introduz machine learning como a habilidade de computadores aprenderem sem serem explicitamente programados. Décadas mais tarde, machine learning se mostraria como uma técnica cada vez mais bem sucedida.

youtube video id=0PrOA2JK6GQ

Parte do sucesso, se deve ao fato de usar métodos matemáticos que conseguem encontrar uma função que aprenderia a mapear os dados alimentados. Dessa forma, não seria necessário criar funções explicitas porque a própria máquina encontraria uma função que conseguisse realizar tarefas após observação dos dados.

Machine learning ou deep learning?

Outro termo que surge muito dentro da área de inteligência artificial é deep learning ou aprendizado profundo. Os três termos criam uma confusão já que aparecem quase sempre juntos e pode dar a impressão que se referem à mesma coisa. Porém, há diferenças entre os termos.

Inteligência artificial se trata de uma área inteira que segue o argumento que Alan Turing introduziu em 1950. Machine learning se refere a uma técnica dentro da inteligência artificial onde máquinas aprenderiam sozinhas após observação de dados. Deep learning, por sua vez, se refere ao uso de redes neurais para fazer a máquina aprender. As redes neurais teriam a função de aprendizado.

Tipos de aprendizados

Há diferentes tipos de aprendizados sendo os mais conhecidos: supervisionado, não-supervisionado e semi-supervisionado. Além disso, também existe o aprendizado por reforço que usa um esquema supervisionado um pouco diferente. Cada um possui um objetivo diferente e qual tipo de aprendizado usar depende do problema e dos dados disponíveis.

Esquema de qual tipo de aprendizado usar para qual tipo de problema.
Esquema de qual tipo de aprendizado usar para qual tipo de problema. Crédito: MIT Sloan/Thomas Malone

Supervisionado: quando a máquina recebe dados de entrada e de saída, sendo que os dados de saída geralmente são as respostas para a tarefa. Dessa forma, a máquina aprenderia após relacionar os dados de entrada com os de saída e estimando o erro após comparar com a resposta verdadeira.

Não-supervisionado: a máquina não receberia a resposta ao final do aprendizado. Ela procura por padrões de forma independente apenas observando os dados de entrada. Uma vantagem do não-supervisionado é que a máquina consegue encontrar padrões que podem não ter sido encontrados antes.

Semi-supervisionado: é um equilíbrio entre supervisionado e não-supervisionado. Geralmente, o semi-supervisionado usa um grupo de dados com rótulos e também técnicas de aprendizado não-supervisionado. É bastante útil quando o número de dados não é suficiente.

Aprendizado por reforço: funciona como um tipo de jogo de tentativa e erro. A máquina aprende após fazer diversos testes por si só. Esse tipo de aprendizado é muito usado em carros autônomos onde ruas simuladas junto com as regras de trânsito são adicionadas e a máquina precisa aprender a dirigir sem burlar as regras.

Aplicações

Com o sucesso do machine learning, hoje em dia, quase todas as inteligências artificiais que vemos por aí usam essa técnica por trás. É o método mais bem sucedido e até hoje nenhum outro conseguiu competir de igual para igual com aprendizado de máquina. Além disso, em um mundo onde o big data domina, uma série de aplicações é possível usando machine learning.

Aplicações na Ciência como descobertas na Astronomia, estudo de medicamentos, simulações de meteorologia, classificação de plantas e animais já são muito usadas. No Mercado também é possível encontrar o aprendizado de máquina em ferramentas na Economia, para otimizar processos em indústrias e até mesmo para interagir com clientes e obter respostas para problemas.

ChatGPT usa machine learning?

Um grande exemplo é o ChatGPT. A ferramenta da OpenAI que chamou a atenção de todo mundo durante 2023. A OpenAI deixa explicito em seu site que usa técnicas de deep learning com redes neurais usando transformers. Eles também ensinaram a inteligência artificial por trás do ChatGPT a analisar dados obtidos na internet durante anos.

O ChatGPT é resultado de uma outra área chamada natural language processing que utiliza dados e técnicas de machine learning para interpretar e gerar textos ou imagens.

Então a resposta curta é sim. A ferramenta mais utilizada em 2023 que quebrou recordes de downloads em 1 dia utiliza por trás o aprendizado de máquina ou machine learning. Talvez isso seja suficiente para mostrar que é uma técnica que funciona muito bem e já está presente em nossas vidas.