Эндрю Барто и Ричард Саттон, два пионера в области обучения с подкреплением, были удостоены премии Тьюринга имени А.М., высшей награды в области компьютерных наук. Их исследования, начавшиеся в 1970-х годах, проложили путь к недавним прорывам в области искусственного интеллекта, включая компьютерную программу Google, победившую людей в игре Го, и усовершенствование инструментов искусственного интеллекта, таких как ChatGPT. Обучение с подкреплением подразумевает адаптацию машинами своего поведения в ответ на положительные сигналы, подобно тому, как дрессировщики формируют поведение собак или лошадей. Работа Барто и Саттона изначально была встречена со скептицизмом, но с тех пор стала центральным столпом бума искусственного интеллекта, стимулируя инвестиции и привлекая молодых исследователей. Эти два ученых разработали теории и алгоритмы, которые позволили машинам учиться на опыте, концепция, предложенная Аланом Тьюрингом в 1947 году. Подход Барто и Саттона заимствовал идеи из психологии и нейронауки, и они опубликовали широко используемый учебник по обучению с подкреплением. Хотя они не согласны во мнениях относительно рисков, связанных с агентами искусственного интеллекта, они отличают свою работу от генеративных технологий искусственного интеллекта, которые имитируют человеческое письмо и другие медиа. Саттон оптимистично настроен в отношении потенциала искусственного интеллекта, ожидая, что он приведет к созданию существ, превосходящих человека по интеллекту, в то время как Барто более осторожен, предупреждая о возможных неожиданных последствиях. Премия, спонсируемая Google, отмечает вклад дуэта в развитие искусственного интеллекта.
fastcompany.com
AI pioneers win the Turing Award, tech’s top prize
Create attached notes ...
