||<table align=center><table bordercolor=#000000><table width=100%><bgcolor=white> GPU 마이크로아키텍처 ||
}}}}}}}}} ||
{{{#!wiki style="margin: 0 -10px -5px;min-height:26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" | <rowcolor=#fff,#000> 설계 기반 | CUDA 연산 능력 | 칩셋명 | 등장 시기 | 인코더 | 디코더 | 사용 제품 | 공정 노드 |
<colcolor=black,white> Tesla | <colcolor=black,white> 1.0 | <colcolor=black,white> G80 | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | |
Fermi | 2.0 | GF100 | 2010년 | TSMC 40 nm | ||||
GF110 | 2010년 | TSMC 40 nm | ||||||
2.1 | GF104 | 2010년 | TSMC 40 nm | |||||
Kepler | 3.0 | GK104 | 2012년 3월 | GeForce 600 GeForce 700 GeForce GTX TITAN | TSMC 28 nm | |||
GK106 | 2012년 9월 | TSMC 28 nm | ||||||
GK107 | 2012년 6월 | TSMC 28 nm | ||||||
3.5 | GK110 | 2012년 11월 | TSMC 28 nm | |||||
Maxwell | 5.0 | GM107 | 2014년 2월 | GeForce GTX 750/750 Ti | TSMC 28 nm | |||
GM108 | 2014년 3월 | GeForce 800M | TSMC 28 nm | |||||
5.2 | GM200 | 2015년 3월 | GeForce GTX TITAN X GeForce GTX 980 Ti | TSMC 28 nm | ||||
GM204 | 2014년 9월 | GeForce 900 | TSMC 28 nm | |||||
GM206 | 2015년 1월 | TSMC 28 nm | ||||||
Pascal | 6.1 | GP102 | TSMC 16 nm | |||||
GP104 | 2016년 5월 | GeForce 10 | TSMC 16 nm | |||||
GP106 | 2016년 7월 | TSMC 16 nm | ||||||
GP107 | 2016년 10월 | Samsung 14 nm | ||||||
GP108 | 2017년 5월 | Samsung 14 nm | ||||||
Turing | 7.5 | TU102 | GeForce 20 | TSMC 12 nm | ||||
Ampere | 8.6 | GA102 | GeForce 30 | Samsung 8 nm | ||||
Ada Lovelace | 8.9 | AD102 | GeForce 40 | TSMC 4 nm | ||||
서버/HPC용 (배정밀도 연산 성능 특화) | ||||||||
Kepler | 3.7 | GK210 | 2014년 11월 | Tesla K80 | TSMC 28 nm | |||
Pascal | 6.0 | GP100 | 2016년 4월 | Tesla P100 Quadro GP100 | TSMC 16 nm | |||
Volta | 7.0 | GV100 | 2017년 5월 | TSMC 12 nm | ||||
Ampere | 8.0 | GA100 | TSMC 7 nm | |||||
Hopper | 9.0 | GH100 | TSMC 4 nm | |||||
저전력 |
1. 개요
2014년 2월 18일에 출시된 NVIDIA GeForce 750Ti, 750의 마이크로아키텍처.2. 공개된 정보
2.1. 주요 변경점
- 코어(SMM) 레벨 (Kepler 대비)
- SMX → SMM으로 명칭 변경
- Compute Capability: 3.x → 5.0
- 프론트 엔드
- 백 엔드
- 단정밀도 처리량이 사이클당 192 → 128로 감소
- 배정밀도 처리량이 크게 감소 (단정밀도 성능에 집중)
- 메모리 서브시스템
- 공유 메모리와 L1 캐시가 분리됨
- L1 캐시와 텍스처 캐시가 통합됨
- 기타
- 프로세서 레벨
- 메모리 서브시스템
- L2 캐시의 용량이 크게 증가
- NVENC 개선
- 공유 메모리의 크기가 SM당 16 KB~48 KB → 64 KB(GM107)/96 KB(GM204)로 증가
(단, 스레드 블록당 최대 용량은 48 KB로 동일하며 이후 GPU와의 호환성을 위해 최대 32 KB 사용을 권장)
기존 케플러 마이크로아키텍처의 병목을 개선하여 전성비를 크게 향상시켰다.
3. 사용 제품
3.1. GeForce 700
자세한 내용은 GeForce 700 문서의 GM107 부분을
참고하십시오.