최근 수정 시각 : 2025-06-12 08:28:01

Reward is enough


파일:Google Deepmind 로고 화이트.svg
{{{#!wiki style="min-height: calc(1.5em + 5px); margin: 0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델 Gemini · Gemma · Imagen · Veo · Gemini Live
과학
인공지능
생물학 AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo
날씨 예측 GenCast · WeatherNext
수학·
컴퓨터 과학
AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip
물리·화학 GNoME · Google DeepMind · AlphaQubit · FermiNet
게임 인공지능 알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero
관련 인물 데미스 허사비스 · 무스타파 슐레이만
관련 문서 DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고
}}}}}}}}} ||
Reward is enough
<colbgcolor=#646464><colcolor=#fff> 논문 저자 Silver\
분야 인공지능
발표 년도 2021
논문 링크

1. 개요2. 요약3. 논문이 미친 영향4. 외부 링크

1. 개요

파일:Reward_is_enough_fig1.png[1]

2021년 Google DeepMind에서 보상으로 지능의 구성 요소를 학습할 수 있는지를 검증한 논문.

2. 요약

지능은 지식, 학습, 인지, 사회적 지능, 일반화, 모방 등을 모두 포함하여 보상을 늘리는 에이전트다.
지식과 학습, 인지, 사회적 지능, 언어, 일반화, 모방으로 일반 지능의 구성요소를 나누고, 각각에 대해 보상만으로 학습할 수 있는지를 검증했다.

3. 논문이 미친 영향

보상 기반의 인공지능으로 AGI를 만들 수 있는 가능성에 대해서 검증했다.

4. 외부 링크


[1] Silver, David, et al. "Reward is enough." Artificial Intelligence 299 (2021): 103535.