Definição – O que significa Problema de Aprendizagem de Valor?
O problema do aprendizado de valores é uma questão fundamental específica no desenvolvimento de tecnologias de aprendizado de máquina e inteligência artificial que aborda a diferença entre humanos e computadores, e a maneira como eles pensam.
Em suma, o problema de aprendizado de valor é baseado em quão difícil é para os computadores descobrir o que “valorizar” (em termos de dados e política) e como agir em uma rede de aprendizado de máquina, e como os programadores podem otimizar como o programa atua de acordo com suas intenções originais quando o criou.
Definirtec explica o problema de aprendizado de valor
A chave para o problema do aprendizado de valor é que é extremamente importante para os programadores serem capazes de fazer programas de aprendizado de máquina que executem os valores pretendidos. No entanto, o problema é que os valores não podem ser declarados explicitamente de maneira que atrapalhe o próprio aprendizado do programa.
As pessoas às vezes falam sobre a ‘convergência’ das tecnologias de aprendizado de máquina como o foco bem-sucedido em dados de valor, mas o problema de aprendizado de valor é, em alguns aspectos, um pouco diferente. É a ideia de que deve haver alguma maneira básica de mostrar ao programa de aprendizado de máquina o que é desejado, em vez de apenas explicá-lo, que é uma maneira determinística de executar o ML.
Por exemplo, veja este artigo sobre o problema de aprendizado de valor que sugere que os programas de aprendizado de máquina podem ter um conjunto de armazenamento de entradas mostrando respostas humanas positivas a estímulos. Ao ler esses tipos de endereços para o problema de aprendizado de valor, fica claro que há uma grande lacuna no aprendizado de máquina que não é fácil de corrigir – essencialmente – como as pessoas criam máquinas que podem realmente pensar como pessoas? Outra maneira de explicar isso é que o problema do aprendizado de valores atinge o cerne de como pensamos como humanos, e como nossos pensamentos nem sempre se baseiam em informações rotineiras.
Para os computadores modelarem nossa intuição, nosso instinto, nossas inclinações sociais e nossos valores éticos mais profundos é uma tarefa difícil, mesmo quando os computadores podem aprender a jogar xadrez de uma maneira humana, ou nos ultrapassar na solução de difíceis problemas matemáticos. Os profissionais podem esperar que o programa de aprendizado de valor continue a ser central no desenvolvimento de tecnologias de aprendizado de máquina.