É um modelo em que a máquina recebe um conjunto de dados com rótulos, divididos em diferentes classificações. O aprendizado supervisionado é muito usado para antecipar resultados em que já se tem uma ideia de quais são as possibilidades de desfecho, casos de sim ou não, principalmente.
Para verificar se uma transação feita por cartão de crédito é fruto de uma fraude ou não, por exemplo. Isso é possível graças às técnicas de classificação e de regressão aplicadas nesse tipo de método de ensino.
Classificação: consegue categorizar um dado a partir dos rótulos aprendidos. Por exemplo, um algoritmo já sabe quais são os tipos de cores primárias e secundárias, portanto, quando aparecer algum elemento em vermelho, vai ser colocado entre as cores primárias.
Regressão: serve para prever valores contínuos, ou seja, variáveis que tendem a se repetir dentro de uma lógica durante um determinado intervalo de tempo. Por exemplo, o cálculo de rendimentos para investimentos de taxas pré-fixadas.
É um modelo em que a máquina recebe uma série de dados que não possuem rótulos e, portanto, não há qualquer perspectiva de se prever o resultado final. Nesses casos, nem os humanos sabem quais informações poderão ser extraídas.
A ideia nesse tipo de aprendizado é justamente reconhecer determinados padrões e, a partir deles, encontrar uma lógica entre os dados. Nesse sentido, o aprendizado não supervisionado utiliza basicamente três técnicas para identificar essas possíveis relações entre as informações:
Agrupamento: busca similaridade entre os dados e os divide em grupos assim que encontra essas semelhanças. Ele pode ser usado, por exemplo, para segmentar o seu público-alvo e favorecer a criação de personas.
Associação: combina dois ou mais dados, encontrando uma sequência e identificando padrões. É o caso das recomendações de conteúdo ou das sugestões de compras, entre outros.
Redução de dimensão: ajuda a eliminar dados aleatórios, fazendo prevalecer somente aquelas variáveis mais consistentes. Pode ser usado em planos de gerenciamento de riscos, por exemplo, ao reduzir resultados menos prováveis.
Conforme o nome sugere, é um modelo que funciona como um híbrido dos dois anteriores. Normalmente, ele é utilizado quando há grande volume de dados, mas apenas parte dele possui rótulos, que é a condição que possibilita um aprendizado totalmente supervisionado. Nesse caso, a máquina e seus algoritmos aprendem tanto a partir de dados supervisionados quanto de não supervisionados.
Em termos práticos, esse método pode ser utilizado para fazer o reconhecimento facial de uma pessoa por uma webcam ou pela câmera do smartphone, entre outras aplicações.
É um método no qual a máquina aprende através do sistema de tentativas, por erro e acerto. De certa forma, lembra o sistema de recompensas, utilizado na psicologia infantil, para premiar a criança que realiza um comportamento desejado.
No caso do aprendizado da máquina, esse modelo desconsidera um pouco o valor dos dados (rotulados ou não rotulados), e valoriza mais o ambiente. Nesse modelo, existem sempre três variáveis: o agente (a máquina), o meio (lugar onde o agente atua) e as ações (atividades do agente).
Pense no problema como um grande jogo de quebra-cabeças em que é preciso combinar todas as peças corretamente. Sendo assim, a cada peça combinada, a máquina faz um ponto, e a cada associação errada, ela perde.
Ou seja, ela vai aprendendo ao reforçar uma ação, seja ela positiva (acerto) ou negativa (erro), em busca do objetivo final, que é encontrar a melhor estratégia no menor tempo.