Quais são os componentes do processo de aprendizagem de máquina?

Aurélio Miranda, cientista de dados da Norven, dá uma breve introdução aos paradigmas e modelos usados na aprendizagem de máquina

Conforme abordado no artigo “Entendendo Inteligência Artificial de forma simples”, publicado anteriormente no nosso blog, a aprendizagem de máquina é uma área que possibilita aos computadores a habilidade de aprender sem serem programados explicitamente, possibilitando a execução de previsões com precisão científica. Isso é possível graças à obtenção de experiência a partir de dados históricos, utilizando-os para calcular resultados futuros probabilisticamente factíveis.

Antes de serem implementados, os algoritmos de aprendizado de máquina passam por um treinamento em conjuntos de dados, denominado processo de aprendizado. A escolha do algoritmo depende do tipo de problema a ser resolvido, sendo determinado a partir da classificação ou regressão do conjunto de dados, processo executado a partir de modelos matemáticos.

Logo, para utilizar técnicas de aprendizado de máquina, área relevante da Inteligência Artificial, é necessário que os problemas sejam  classificados, a partir de modelos matemáticos, para então iniciar o processo de aprendizado.

Tipos de Modelos

A palavra “modelo” é utilizada em diversas áreas com conceitos diferentes. O dicionário Aurélio define modelo como algo “que serve como objeto de imitação” ou, no contexto matemático, como uma “representação matemática de um fenômeno”.[3]

Em programação, modelo é a representação simplificada de um sistema ou ação real obtida a partir dos dados de uma amostra, como uma representação matemática de um processo real. Existem dois tipos de modelos: regressão e classificação. Caso o problema a ser modelado seja um número real, a tarefa será classificada como regressiva ou, caso seja um conjunto finito e não ordenado, a tarefa será de classificação.[1]

  • Regressão

O objetivo da regressão é realizar a estimativa do valor da variável de saída numérica a partir das variáveis de entrada, sendo o método utilizado quando é preciso prever um valor numérico específico. Este valor pode ser o preço de um produto, altura ou peso de uma pessoa, por exemplo.

Regressão é um trabalho preditivo e a avaliação da precisão é feita em função do erro de predição, assim, a diferença entre o valor predito e o valor correto é utilizado para o reparo do modelo. Ao desenvolver um trabalho de Análise de Regressão, se busca entender o padrão de um valor, encontrando uma resposta que expressará esse padrão.[3] Com base nesse modelo que plataformas como Instagram e Netflix conseguem estimar qual o padrão de anúncios e/ou conteúdos tem maior compatibilidade com os direcionar usuários.

  • Classificação

Na classificação, também chamada de classificação supervisionada, o objetivo é criar um modelo capaz de classificar itens ou amostras de acordo com as características observadas em uma das diferentes classes predefinidas a partir de valores das variáveis de entrada, que representam as características observadas. A saída são variáveis, em geral do tipo discreta e não ordenada.[6]

A classificação é uma tarefa preditiva, pois o modelo deve ser capaz de predizer a classe para uma nova amostra previamente desconhecida A avaliação de um modelo de classificação é realizada principalmente em função da sua precisão na predição da classe correta. Suas aplicações são diversas, desde áreas como a medicina até tecnologias para o setor elétrico [4]. Exemplos práticos de aplicação desse modelo ocorrem nas indicações de conteúdo apresentadas em plataformas como YouTube e Spotify. 

Processos de aprendizagem

A definição do processo de obter experiência através do aprendizado de máquina depende do problema a ser solucionado, que pode ser classificado conforme os “Paradigmas de Aprendizagem”. Os três principais paradigmas existentes são: aprendizagem supervisionada, aprendizagem não-supervisionada e aprendizagem por reforço [1].

  • Aprendizagem Supervisionada

No aprendizado supervisionado, como o próprio nome já diz, há necessidade de um “supervisor” do processo. Esta aprendizagem tem como foco encontrar uma função a partir de dados de treinamento que tenham sido previamente rotulados. O treinamento é realizado através do ajuste dos parâmetros com base na média do erro entre a saída calculada e a que era esperada, com o intuito de minimizar o erro a cada iteração.[2]

Uma característica básica da aprendizagem supervisionada é que os dados utilizados para o treinamento contêm  a resposta almejada, em outras palavras, eles contêm as variáveis que serão observadas de forma independente.[5]

Regressão linear, redes neurais artificiais, logística, entre outras, são as técnicas mais conhecidas para resolver problemas de aprendizado supervisionado. Este aprendizado geralmente inicia com um grupo padronizado de dados para os quais já haja uma categorização, assim o objetivo será encontrar padrões em dados que possam ser utilizados em um ato analítico.[6] Um exemplo de categorização descrita seria o de um aplicativo que possa ser capaz de distinguir um animal entre milhões de outros animais, com base em imagens e descrições escritas. [6]

  • Aprendizagem não-supervisionada

O aprendizado não-supervisionado desenvolve suas próprias conclusões a partir de um determinado conjunto de dados, o que se pode considerar um processo de auto-organização, além de não possuir meios críticos de avaliação e monitoramento do aprendizado.

A auto-organização no aprendizado de máquina é definida pelo processo de ajuste dos parâmetros por meio de características dos dados, formando representações das entradas e criando novas classificações de maneira automática.

De forma geral, o aprendizado não-supervisionado tem como foco encontrar uma representação mais detalhada dos dados. Normalmente essa exibição mais detalhada também é simples e condensa os dados em pontos de maior relevância.

Por exemplo, se houver um grande conjunto de dados de vendas on-line, poderia ser utilizada a aprendizagem sem supervisão para encontrar clusters ou associações entre esses dados, para melhor direcionamento das ações de marketing. Geralmente quando se tem uma vasta quantidade de dados não rotulados este é o tipo de aprendizado usado para resolver o problema, por correlação. Aplicativos de redes sociais, como Instagram, Facebook, e Twitter, são exemplos de plataformas que utilizam estes recursos para classificar uma grande quantia de dados não rotulados.[6]

  • Aprendizagem por reforço

Aprendizado por reforço é um modelo de aprendizado comportamental, onde a mudança do ambiente, devido às incertezas, consegue incorporar as mudanças eventuais do processo de tomada de decisão. Essa ideia baseia-se no conceito de “aprendizagem por reforço” da psicologia, onde a punição ou a recompensa é dada aos agentes dependendo de cada decisão tomada. “Na psicologia, aprendizagem por reforço é chamada de behaviorismo e tem B. F. Skinner como um dos principais expoentes, um famoso psicólogo que, dentre outros experimentos, usou a ideia de recompensas e punições para treinar pombos para conduzir mísseis na Segunda Guerra Mundial”. [5]

Nesta técnica o sistema aprende por meio de tentativa e erro, não há treinamento com o conjunto de dados de amostra, utilizando o sistema de feedback, análogo ao conceito de punições e recompensas, forçando a máquina a tentar entender qual é a melhor execução a ser tomada de acordo com as circunstâncias na quais essa ação será efetuada.[1]

Os agentes inteligentes treinados por aprendizagem por reforço devem agir de modo a maximizar alguma noção de recompensa adquiridas  através  da interação com o  ambiente.[1] A recompensa é a melhor ação a se tomar para cada um dos cenários plausíveis a serem analisados no futuro.[5]

Mas qual o melhor processo de aprendizagem?

Não existe algoritmo/solução genérico que resolva perfeitamente todos os  problemas, pois cada um tem características que os distingue dos demais. Uma aprendizagem que traga bons resultados em um problema específico não garante que terá performance igual ou superior se aplicada a outro tipo de cenário. Sendo assim, o especialista deve ser capaz de analisar e indicar o melhor algoritmo para cada necessidade de solução.

Ponto importante na definição do processo de aprendizagem é a identificação dos dados utilizados no treinamento, pois grande parte do sucesso vem da qualidade desses dados.

Portanto, para escolher uma solução ou técnica adequada a cada problema, é necessário entender quais os tipos de problema que geralmente podem ser resolvidos através de aprendizado de máquina, para que então seja possível identificar o melhor modelo a ser utilizado.

Referências

[1] 10 Machine Learning Algorithms You Need to Know. (2018, December 18). Retrieved January 22, 20, from Water Problems: https://semantix.com.br/10-algoritmos-de-machine-learning-que-voce-precisa-conhecer/

[2]SILVA, Daniel et al. Uso de aprendizado de máquina para estimar esforço de execução de testes funcionais. 2009.

[3]EVSUKOFF, Alexandre G.. Inteligência Computacional: fundamentos e aplicações. Rio de Janeiro: E-Papers, 2020. 526 p.

[4]SOUZA, L. Aplicação de aprendizado de máquina para predição de prioridade em gestão de incidentes. 2017. Acessado em, v. 9, p. 12, 2018.

[5] Os Três Tipos de Aprendizado de Máquina. (July 27, 2017). Retrieved January 22, 20, from Water Problems: https://lamfo-unb.github.io/2017/07/27/tres-tipos-am/

[6]Machine Learning e Ciência de dados com IBM Watson. IBM, 2021. Disponível em: <http://bit.ly/MachineLearningCiênciaDadosIBMWatson>. Acesso em: 30 de jan. de 2021

Quais são os componentes do aprendizado de máquina?

Basicamente, existem quatro métodos: aprendizado supervisionado, aprendizado não supervisionado, aprendizado semi supervisionado e aprendizado por reforço.

Quais os 3 tipos de aprendizagem de máquina?

3 tipos de aprendizado de máquina que você precisa conhecer!.
Aprendizado de máquina supervisionado..
Aprendizado de máquina não supervisionado..
Aprendizado por reforço..

Como se realiza o processo de aprendizado de máquina?

O aprendizado de máquina (em inglês, machine learning) é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana.

Quais os tipos de aprendizado de máquina?

Quais são os tipos de aprendizagem?.
Musical. A habilidade musical ou auditiva é encontrada em pessoas que relacionam músicas e sons ao seu processo de aprendizagem. ... .
Lógico-Matemática. ... .
Interpessoal. ... .
Intrapessoal. ... .
Corporal-cinestésica. ... .
Espacial. ... .
Linguística..