Reward is enough

[[Google DeepMind\| DeepMind 딥마인드 ]]
{{{#!wiki style="min-height: calc(1lh + 5px); margin: 0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px"	<colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델		Gemini · Gemma · Imagen · Veo · Gemini Live
과학 인공지능
	생물학	AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo
	지구환경	WeatherNext · AlphaEarth Foundations · Perch
	물리·화학	TORAX · GNoME · AlphaQubit · DeepMind 21 · FermiNet
	수학·컴퓨터공학	AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip · FunSearch · AlphaDev
게임 인공지능		알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero
관련 인물		데미스 허사비스 · 무스타파 슐레이만
관련 문서		DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고

}}}}}}}}} ||

Reward is enough
<colbgcolor=#646464><colcolor=#fff> 논문 저자	Silver\
분야	인공지능
발표 년도	2021
논문 링크

1. 개요2. 요약3. 논문이 미친 영향4. 외부 링크

1. 개요

[1]

2021년 Google DeepMind에서 보상으로 지능의 구성 요소를 학습할 수 있는지를 검증한 논문.

지능은 지식, 학습, 인지, 사회적 지능, 일반화, 모방 등을 모두 포함하여 보상을 늘리는 에이전트다.

지식과 학습, 인지, 사회적 지능, 언어, 일반화, 모방으로 일반 지능의 구성요소를 나누고, 각각에 대해 보상만으로 학습할 수 있는지를 검증했다.

보상 기반의 인공지능으로 AGI를 만들 수 있는 가능성에 대해서 검증했다.

[1] Silver, David, et al. "Reward is enough." Artificial Intelligence 299 (2021): 103535.