A Association for Computing Machinery anunciou os ganhadores da edição de 2025 do Prêmio Turing: Andrew Barto e Richard Sutton
Dupla que ganhou Prêmio Turing de 2025, aplicou comportamento hedonista da inteligência humana à IA.
Em 1977, Andrew Barto, então pesquisador na Universidade de Massachusetts, começou a explorar a teoria de que neurônios se comportavam como hedonistas. A ideia era: as bilhões de células nervosas no cérebro humano tentavam maximizar o prazer e minimizar a dor.
Um ano depois, o pesquisador Richard Sutton começou a trabalhar com Barton. Juntos, eles explicaram o comportamento hedonista da inteligência humana. Dessa maneira, aplicaram à inteligência artificial. O resultado: aprendizado por reforço – maneira dos sistemas de IA aprenderem a partir do equivalente digital a prazer e dor.
Barto e o Sutton que começaram a explorar a matemática de como isso poderia funcionar
Psicólogos estudam há muito tempo como humanos e animais aprendem por meio de suas experiências.
Na década de 1940, o cientista britânico Alan Turing, sugeriu que as máquinas poderiam aprender de maneira semelhante.
No entanto, foram Barto e o Sutton que começaram a explorar a matemática de como isso poderia funcionar, baseando-se numa teoria proposta pelo cientista da computação A. Harry Klopf, segundo o New York Times.
Ao longo da última década, o aprendizado por reforço desempenhou um papel crucial no desenvolvimento de plataformas como o ChatGPT, da OpenAI, e seu rival chinês DeepSeek. As técnicas que criaram esse tipo de ferramenta têm raízes no trabalho de Barto e Sutton. Elessão considerados pioneiros da IA, e agora, premiados por isso.