Bot de ‘Minecraft’ ajuda no desenvolvimento de nova inteligência artificial

Treinamento da ferramenta foi executado com 70 mil horas de vídeo de ações e interações humanas reais.

Quem muito subestima o jogo “Minecraft” pela simplicidade de seus gráficos não vê o potencial dele para grandes descobertas. Isso porque, recentemente, cientistas treinaram um bot capaz de jogar “Minecraft” tão bem quanto os humanos e essa descoberta pode ser um novo pontapé para o desenvolvimento da tão falada inteligência artificial (IA).

Mas vamos entender esse processo, o.k.? Antes de qualquer coisa, saiba que existem vertentes de pesquisa que trabalham com a intenção de conseguir reproduzir ou pelo menos simular uma inteligência artificial com a capacidade de um cérebro humano.

De lá para cá, o desafio tem sido encontrar a melhor forma de fazer isso. Agora, veja a seguir o porquê do sucesso desse bot ser muito relevante.

Para cada ação representada na imagem que a IA desenvolve, é necessária uma descrição; ou seja, se pensarmos em um vídeo, cada quadro de imagem que, em sequência, vira o movimento precisa de uma descrição. E isso significa um extensíssimo trabalho de programação e banco de dados!

Para resolver esse impasse, os pesquisadores da OpenAI alimentaram uma rede neural com 2 mil horas de vídeos feitos a partir da gravação de ações de teclados, mouse e imagens de tela de jogadores reais.

A partir desses dados, a primeira rede neural (rede de processamento de dados) aprendeu a rotular vídeos de “Minecraft” com os comandos, ou seja, essa rede é capaz de reagir às imagens em tela que o jogo propõe.

Depois dessa rotulação, a IA foi capaz de tratar 70 mil horas de vídeos que seriam usados no treinamento da segunda rede neural. O treinamento da segunda rede tinha por objetivo fazer ela agir a partir dos dados que captava no jogo.

Etapas de treinamento da inteligência artificial

Considerando que a inteligência artificial aprendeu a jogar “Minecraft” por meio da observação das ações de outros jogadores, podemos dizer que ela usou duas técnicas de aprendizagem: o aprendizado por imitação e o aprendizado por reforço. Mas como isso acontece?

Primeiro, os cientistas fizeram a IA imitar as instruções. Em seguida, os pesquisadores passaram uma instrução complexa para a máquina, que deveria realizar a tarefa por tentativa e erro à exaustão.

Dessa forma, esse treinamento foca em limitar as possibilidades de erro e acerto no aprendizado por reforço, garantindo melhores resultados em menos tempo.

Assim, os cientistas perceberam a eficácia de utilizar bases de dados imensas de vídeos, como o YouTube, para treinar diversos modelos de IA.

Desafios dessa técnica

Apesar de essa técnica reduzir muito a demanda de trabalho humano, ela ainda enfrenta alguns desafios e limitações técnicas. Entretanto, embora esse avanço seja significativo, ele está muito distante de garantir o desenvolvimento de robôs humanoides treinados por tutoriais do YouTube.

EM suma, o melhor que pode ser esperado dessa descoberta é que essa tecnologia seja aplicada na execução de tarefas digitais, como preencher formulários ou planilhas.

você pode gostar também