| | |||
| {{{#!wiki style="min-height: calc(1.5em + 5px); margin: 0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px" | <colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델 | Gemini · Gemma · Imagen · Veo · Gemini Live | |
| 과학 인공지능 | |||
| 생물학 | AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo | ||
| 날씨 예측 | GenCast · WeatherNext | ||
| 수학· 컴퓨터 과학 | AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip | ||
| 물리·화학 | GNoME · Google DeepMind · AlphaQubit · FermiNet | ||
| 게임 인공지능 | 알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero | ||
| 관련 인물 | 데미스 허사비스 · 무스타파 슐레이만 | ||
| 관련 문서 | DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고 | ||
1. 개요
Deep Deterministic Policy Gradient (심층 결정론적 정책 경사법)강화학습의 한 방법으로써 2016년에 구글 딥마인드 연구진 TP. Lillicrap등에 의해 제안되었다.