최근 수정 시각 : 2025-06-12 08:28:01

Reward is enough


[[Google DeepMind|
파일:Google Deepmind 로고 화이트.svg
DeepMind
딥마인드
]]
{{{#!wiki style="min-height: calc(1lh + 5px); margin: 0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델 Gemini · Gemma · Imagen · Veo · Gemini Live
과학
인공지능
생물학 AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo
지구환경 WeatherNext · AlphaEarth Foundations · Perch
물리·화학 TORAX · GNoME · AlphaQubit · DeepMind 21 · FermiNet
수학·컴퓨터공학 AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip · FunSearch · AlphaDev
게임 인공지능 알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero
관련 인물 데미스 허사비스 · 무스타파 슐레이만
관련 문서 DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고
}}}}}}}}} ||
Reward is enough
<colbgcolor=#646464><colcolor=#fff> 논문 저자 Silver\
분야 인공지능
발표 년도 2021
논문 링크

1. 개요2. 요약3. 논문이 미친 영향4. 외부 링크

1. 개요

파일:Reward_is_enough_fig1.png[1]

2021년 Google DeepMind에서 보상으로 지능의 구성 요소를 학습할 수 있는지를 검증한 논문.

2. 요약

지능은 지식, 학습, 인지, 사회적 지능, 일반화, 모방 등을 모두 포함하여 보상을 늘리는 에이전트다.
지식과 학습, 인지, 사회적 지능, 언어, 일반화, 모방으로 일반 지능의 구성요소를 나누고, 각각에 대해 보상만으로 학습할 수 있는지를 검증했다.

3. 논문이 미친 영향

보상 기반의 인공지능으로 AGI를 만들 수 있는 가능성에 대해서 검증했다.

4. 외부 링크


[1] Silver, David, et al. "Reward is enough." Artificial Intelligence 299 (2021): 103535.