| | |||
| {{{#!wiki style="min-height: calc(1.5em + 5px); margin: 0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px" | <colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델 | Gemini · Gemma · Imagen · Veo · Gemini Live | |
| 과학 인공지능 | |||
| 생물학 | AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo | ||
| 날씨 예측 | GenCast · WeatherNext | ||
| 수학· 컴퓨터 과학 | AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip | ||
| 물리·화학 | GNoME · Google DeepMind · AlphaQubit · FermiNet | ||
| 게임 인공지능 | 알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero | ||
| 관련 인물 | 데미스 허사비스 · 무스타파 슐레이만 | ||
| 관련 문서 | DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고 | ||
| Reward is enough | |
| <colbgcolor=#646464><colcolor=#fff> 논문 저자 | Silver\ |
| 분야 | 인공지능 |
| 발표 년도 | 2021 |
| 논문 링크 | |
1. 개요
2021년 Google DeepMind에서 보상으로 지능의 구성 요소를 학습할 수 있는지를 검증한 논문.
2. 요약
지능은 지식, 학습, 인지, 사회적 지능, 일반화, 모방 등을 모두 포함하여 보상을 늘리는 에이전트다.
3. 논문이 미친 영향
보상 기반의 인공지능으로 AGI를 만들 수 있는 가능성에 대해서 검증했다.4. 외부 링크
- 논문(ScienceDirect) - open access이다.
- 딥마인드 연구 결과
- 유튜브 논문 리뷰 영상
[1] Silver, David, et al. "Reward is enough." Artificial Intelligence 299 (2021): 103535.