최근 수정 시각 : 2024-04-18 22:39:15

인텔 Arc

인텔 아크에서 넘어옴

파일:관련 문서 아이콘.svg   관련 문서: 인텔/GPU
,
,
,
,
,


||<table align=right><table width=400><tablebordercolor=#0068b5>
파일:intel-arc-logo-hi.png.png
||
intel® ARC
파일:intel ARC Graphics Badge.webp
intel® ARC GRAPHICS 배지
공식 홈페이지

1. 개요2. 정식 발표 전 타임라인3. 마이크로아키텍처 및 제품군 목록
3.1. Xe HPG (Alchemist) : Arc A-시리즈3.2. Xe2 HPG (Battlemage)3.3. Xe3 HPG (Celestial)3.4. Xe Next HPG (Druid)
4. 여담5. 관련 문서

[clearfix]

1. 개요

2022년 3월 30일에 런칭된 인텔의 고성능 게이밍 전용 그래픽스 솔루션.

i740이후 거의 24년만의 외장형 그래픽카드이며 동시에 인텔의 첫 외부 파운더리를 사용해서 제조하는 인텔 제품인데 현재 모든 Arc 라인업은 전부 TSMC를 통해 6nm로 제조한다.[1] 또한 라자 코두리를 영입하면서 본격적인 개발을 한 브랜드라 그런지 경쟁사의 Graphics Core Next처럼 메인이 되는 Xe 코어를 게이밍 제품과 연산용 제품이 설계를 공유하는 형태로 만들어져 있다. 어떻게 보면 라데온과의 배다른 형제스러운 제품이기도 하다.

특이하게도 코드네임이 모두 롤플레잉 게임에나 나올법한 직업명으로 이루어져 있다.

경쟁사들처럼 각자 상징하는 대표 색상이 있는 것처럼[2] 인텔 아크도 파란색을 대표 색상으로 사용하고 있는데, 이로서 3원색 RGB가 전부 모인 셈. 정확히는 남색 계열이 주로 쓰이는 편이다.

2. 정식 발표 전 타임라인

인텔의 전용 그래픽스에 관한 떡밥은 1998년 2월에 발표된 Intel740으로부터 20년 뒤에 시작되었다. 2010년에 중단된 Larrabee 프로젝트랑 그 후신으로 2012년부터 2020년까지 판매된 인텔 제온 파이 시리즈는 게이밍에 필수적인 그래픽스 기능이 없기 때문에 인텔의 전용 그래픽스 계보에 포함된다고 보기에는 애매하다.
  • 2018년 1월 14일 : AMD 라데온 RX Vega M 그래픽스 및 HBM2이 탑재된 8세대 코어 i 시리즈(카비 레이크 G)가 정식 발표된지 1주일밖에 안 되었을 즈음에 Ashraf Eassa(@TMFChipFool)라는 트위터리안이[3] 개별 GPU에 관한 정보가 처음 언급되었다. 코드네임 Arctic Sound와 Jupiter Sound가 이때 처음 알려졌다.
  • 2019년 10월 26일 : 인텔의 CEO였던 밥 스완이 개별 GPU를 처음 작동시켰다고 알렸으며, 인텔의 그래픽스 및 비주얼 기술 마케팅 책임자인 크리스 후크가 트위터를 통해 '살아있어!(It’s alive!)'라고 강조함으로써 존재감을 부각시켰다. 이때 Xe 및 DG1이라는 이름으로 처음 알려졌다.
  • 2020년 8월 13일 : 인텔 아키텍처 데이 2020에서 게이밍용 그래픽 카드에 채택될 Xe HPG(High Performance Gaming) 마이크로아키텍처가 정식으로 소개되었다.
    파일:xe hpg01.png
  • 2021년 8월 19일 : 인텔 아키텍처 데이 2021에서 Xe HPG 마이크로아키텍처에 관한 자세한 정보가 소개되고, 코드네임은 DG2가 아닌 Alchemist로 밝혀졌다. 발표된 코드네임은 D&D 판타지 세계관의 직업/종족명에서 따왔으며,[4][5] 전용 그래픽스의 브랜드 네임도 ARC 그래픽스로 확정됨과 동시에 로드맵에 2022년 1분기로 명시되었다.
    파일:xe hpg03.png

3. 마이크로아키텍처 및 제품군 목록

3.1. Xe HPG (Alchemist) : Arc A-시리즈

파일:intel Xe HPG microarchitecture block diagram 2021.png

파일:intel Xe HPG microarchitecture block diagram 2022.png

파일:Intel-Arc-Xe-HPG-1.jpg

파일:Intel-Arc-Xe-HPG-2.png

|Xe HPG (Alchemist)|<-3><tablewidth=100%><tablealign=center><tablebordercolor=#0068b5><bgcolor=#0068b5><color=white> 최대 내부 구성 요소 ||
{{{#!wiki style="margin:0 -10px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -15px"
<colbgcolor=#9addf7,#00285a><colcolor=#00285a,#9addf7> 패밀리 Alchemist
이름 ACM-G10 ACM-G11 ACM-G12
공정 노드 (㎚) TSMC N6 TSMC N6 TSMC N6
면적 (㎟) 406 157 ???
트랜지스터 (개) 217억 72억 ?
트랜지스터 밀도 (MTr/㎟) 53.448 45.860 ?
호스트 인터페이스 PCI Express 4.0 ×16 PCI Express 4.0 ×8 PCI Express 4.0 ×16
Render Slice 8 2 4
Geometry Pipeline 8 2 4
Rasterization Pipeline 8 2 4
Xe-Core 32 8 16
명령어 캐시 메모리 (KB) 96×32 96×8 96×16
Xe Vector Engine 512 128 256
레지스터 파일 (KB) 32×512 32×128 32×256
FP32 Unit 4096 1024 2048
INT32 Unit 4096 1024 2048
Xe Matrix eXtensions Engine 512 128 256
L1 데이터 캐시 & 공유 로컬 메모리 (KB) 192×32 192×8 192×16
텍스처 캐시 메모리 (KB) 64×32 64×8 64×16
Thread Sorting Unit 32 8 16
Ray Tracing Unit 32 8 16
Texture Sampler 32 8 16
Texture Unit 256 64 128
Pixel Backend 16 4 8
Render Output Pipeline 128 32 64
L2 캐시 메모리 (MB) 16 4 8
외부 메모리 규격 GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM
외부 메모리 컨트롤러 (bit × 채널) 32×8 32×3 32×6
}}}}}}}}} ||
이론적인 클럭당 최대 성능
{{{#!wiki style="margin:0 -10px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -15px"
<colbgcolor=#9addf7,#00285a><colcolor=#00285a,#9addf7> 패밀리 Alchemist
이름 ACM-G10 ACM-G11 ACM-G12
삼각형 생성 (개/clock) 16 4 8
래스터화 (pixels/clock) 128 32 64
FP32 연산 (FLOP/clock) 8192 2048 4096
FP16 연산 (FLOP/clock) 16384 4096 8192
INT8 연산 (OP/clock) 32768 8192 16384
XMX FP16 연산 (FLOP/clock) 65536 16384 32768
XMX BF16 연산 (FLOP/clock) 65536 16384 32768
XMX INT8 연산 (OP/clock) 131072 32768 65536
XMX INT4 연산 (OP/clock) 262144 65536 131072
XMX INT2 연산 (OP/clock) 262144 65536 131072
Ray Traversal (회/clock) 64 16 32
Ray Box Intersection (회/clock) 384 96 192
Ray Triangle Intersection (회/clock) 32 8 16
텍스처 필레이트 (texels/clock) 256 64 128
픽셀 필레이트 (pixels/clock) 128 32 64
L2 캐시 메모리 대역폭 (Byte/clock) 2048 512 1024
외부 메모리 대역폭 (Byte/clock) 32 12 24
}}}}}}}}} ||
API 지원 레벨
{{{#!wiki style="margin:0 -10px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -15px"
<colbgcolor=#9addf7,#00285a><colcolor=#00285a,#9addf7> 패밀리 Alchemist
이름 ACM-G10 ACM-G11 ACM-G12
그래픽 가속 DirectX 12 (FEATURE_LEVEL_12_2), OpenGL 4.6, Vulkan 1.3
GPGPU 가속 OpenCL 3.0
미디어 가속 Quick Sync Video 9
디스플레이 출력 HDMI 2.0b, DisplayPort 2.0
}}}}}}}}} ||


2022년 4월 1일에 정식 출시된 1세대 Xe HPG 마이크로아키텍처. 1년 반이나 먼저 출시된 Xe LP 마이크로아키텍처를 계승하면서도 차이점들이 적지 않으므로, Xe LP의 단순 확장판이 아니다. 변경된 사항은 다음과 같다.
  • 기존에 사용된 단위 용어의 변경
    • Execution Unit → Xe Vector Engine
    • Subslice → Xe-Core
    • Slice → Render Slice
  • Xe Vector Engine 레벨
    • Xe Vector Engine당 4 KB 레지스터 파일이 7개 → 8개로 증가 : 2개씩 묶어서 작동하는 4스레드 모드도 지원하게 되었다.
    • Xe Vector Engine당 레지스터 파일 용량이 28 KB → 32 KB로 확장
    • FP (Floating Point) Execution Port와 INT (Integer) Execution Port의 서로 독립화 : 경쟁사의 Turing 마이크로아키텍처처럼 동시 연산이 가능해졌다.
  • Xe-Core 레벨
    • XMX (Xe Matrix eXtensions) Engine 1개씩 추가
    • Load/Store : 클럭 사이클당 512 바이트의 대역폭을 제공한다.
    • 텍스처 및 L1 캐시 메모리 64 KB + 셰어드 로컬 메모리(SLM) 128 KB → 텍스처 캐시 메모리 64 KB + L1 캐시 및 셰어드 로컬 메모리 192 KB로 재구성 : XMX 엔진 추가에 따른 용량 확장으로 보이지만, 당대 경쟁사들의 128 KB보다 더 많은 용량이 탑재되었다.
  • 어느 계층 구조에 포함 되어 있는지 불분명한 블록 : ANANDTECH에 따르면 Xe-Core와 1:1로 구성되어 있기 때문에 Xe-Core에 포함되어 있을 것으로 보인다.
    • Thread Sorting Unit 1개씩 추가 : 일관성 향상을 위한 기능으로, 비동기 레이 트레이싱을 구현할 수 있는 비결이기도 하다.
    • Ray Tracing Unit 1개씩 추가 : GDC 2022에서 연설한 내용을 따르면 Thread Sorting Unit을 이용하여 기능적으로 AMD의 Ray Accelerator는 물론이고 NVIDIA의 2세대 RT Core보다 더 진보된 Bounding Volume Hierarchy (BVH) with Coherency Sort 처리 구조를 지니고 있다. 그리고 인텔 게이밍 액세스에 따르면, NVIDIA의 2세대 RT Core와 같은 광선 탐색 전용 가속기가 탑재되어 있고, AMD의 Ray Accelerator보다 3배 빠른 박스 교차 성능을 보여준다고 한다. 단, 삼각형 교차 성능은 NVIDIA의 2세대 RT Core의 절반이자 AMD의 Ray Accelerator와 같은 수준. BVH 탐색 데이터는 기존의 캐시 메모리 계층에 공유 캐싱되는 경쟁사들과는 다르게 BVH 전용 캐시 메모리에 캐싱된다고 한다. BVH 전용 캐시 메모리의 용량은 불명.
      • Ray Traversal 가속 지원 : 클럭 사이클당 2회 순회
      • Ray Bounding Box Intersection 가속 지원 : 클럭 사이클당 12회 교차
      • Ray Triangle Intersection 가속 지원 : 클럭 사이클당 1회 교차

      {{{#!wiki style="word-break: keep-all"

    레이 트레이싱 전용 하드웨어별 스펙 비교
    지포스의 2세대 RT 코어 라데온의 레이 엑셀러레이터 아크의 RTU

    Ray Box Traversal 전용 하드웨어로 이용 스트림 프로세서로 이용 전용 하드웨어로 이용
    (클럭당 2회)

    Ray Box Intersection 클럭당 2회 클럭당 0~4회 클럭당 12회

    Ray Triangle Intersection 클럭당 2회 클럭당 0~1회 클럭당 1회

    자원 SM의 L1 캐시 겸 공유 메모리 WGP의 L0 벡터 캐시 메모리 RTU의 BVH 전용 캐시 메모리

    자원 공유 FP32 CUDA 코어, INT32 코어, 텐서 코어 텍스처 유닛 (불명)

    }}}
  • Render Slice 레벨
    • Texture Sampler의 재구성 : 경쟁사들과 다르게 Xe-Core와 별개로 구성할 수 있게 되었다.
    • Texture Sampler 6개씩 (Texture Unit 48개씩) → 4개씩 (Texture Unit 32개씩)으로 1/3 축소
    • Pixel Backend 3개씩 (ROP 24개씩) → 2개씩 (ROP 16개씩)으로 1/3 축소
  • L2 캐시 메모리 최대 16 MB까지 구성 가능 : CPU 내장 그래픽스의 L3 캐시 메모리에 대응되는 라스트 레벨 캐시 메모리 계층으로, Xe LP에서도 이론상 16 MB까지 가능했으나 실제로는 3.75 MB로 탑재되었는데 Xe HPG에서 실현되었다고 볼 수 있다. 경쟁사들과는 다르게 GPU 외부 메모리 버스 폭에 종속되지 않고 렌더 슬라이스 개수에 종속되어 있다. 대역폭은 ACM-G10 기준, 클럭 사이클당 2048 바이트.
  • Xe Media Engine : AV1 인코딩 기능이 추가
  • Xe Display Engine : DisplayPort 2.0 사양을 부분적으로 지원 (10G Ready) : 10G가 무엇을 의미하는지 불분명하지만, 총 40 Gbps인 UHBR 10 (Ultra High Bit Rate 10) 사양을 의미할 가능성이 높다. 총 10 Gbps는 이미 DisplayPort 1.0 버전부터 지원했기 때문. HDMI의 경우에는 발표 직후에는 HDMI 2.1 지원이 빠져있고 HDMI 2.0b만 지원한다고 써있었지만 실제 제품출시 이후 업데이트된 스펙에는 HDMI 2.1 지원이 포함되어 있으며 제조사가 지원수준을 정할수 있다고 언급하고 있다. #

Xe LP 대비 전용 고성능 게이밍용으로써 당연히 다른 점들을 제외하고 봐도 나머지 다른 점들이 많다. 이렇게 다를 정도면 Xe LP를 1세대 Xe로 보았을 때, Xe HPG를 1.5세대 Xe로 취급할 수도 있는데, 차세대 인텔 CPU 내장 그래픽스에서 Xe HPG에 처음 도입된 요소들이 반영될 수 있기 때문.

제품군에 대한 자세한 내용은 인텔 Arc A-시리즈 참조.

3.2. Xe2 HPG (Battlemage)

2세대 Xe HPG 마이크로아키텍처로, 2세대 Arc 시리즈에 채택될 가능성이 높다. 라자 코두리가 본격적으로 직접 감독을 하여 제작된 GPU 아키텍처로 2024년 출시를 목표로 한다고 한다. 플래그쉽 제품이 포함되어 있어서 본격적인 인텔 GPU의 성능을 보여준다고 하며 문제가 발생할때마다 해결이 느린 AMD를 제압하고 성능면에서도 AMD를 압도하여 업계 2위를 장악할 계획이라고 한다. 꿈같은 이야기 일지도 모르지만 현재 경쟁사의 라데온 RX 7000 시리즈가 출시 초부터 구설수에 오르고 있기에 AMD가 빠르게 드라이버 안전성을 확보하지 못할 경우와 배틀메이지의 출시일이 빨라진다면 불가능한 상황은 아니다.

2022년 12월 13일, 경쟁사의 라데온 RX 7000 시리즈 출시 당일에 라자 코투리의 언급에 의하면 225 W에 그래픽카드 수요층이 많기에 이쪽에 더 중점을 둘 거라는 언급을 했다. 이로 인해 앞으로 출시할 배틀메이지의 성능이 경쟁사의 지포스 RTX 4070 Ti급 성능일 것이라는 추측을 하고 있다. 라자 코투리가 퇴사하였기에 그에 마지막으로 개발된 인텔 그래픽칩이 되었다.

현재 비공개로 알려진 정보로 차세대 메모리 서브 시스템과 압축, 레이트레이싱과 아키텍처 개선, 차세대 머싱러닝기반 렌더링 기술 그리고 최신 딥 링크 호환으로 예상된다.

현재까지 루머로 공개된 예상되는 출시일은 2024년 하반기로 보고 있다. 4nm 수율 등을 고려하면 어느정도는 일리가 있다는 상황이며 문제는 이렇게 발매가 늦어진다면 이때쯤에 지포스 RTX에 슈퍼 또는 차세대 RTX5000시리즈에 출시일이 겹쳐질 것으로 예상되기에 가격이 저렴하지 않는 이상 매우 힘든 싸움이 될 것으로 보인다.

2023년 1월 6일, 인텔 Arc 로드맵이 유출되었는데, 출시일이 2024년 1분기로 표시되어 있다.#

파일:Battlemage intel.jpg

2023년 12월 말에 로드맵이 공개되면서 2024년 중에 배틀메이지 출시를 명확하게 보여주었다.

이번 2024 CES에서 인텔의 배틀메이지 제품은 공개되지 않았지만 지포스 4070S의 등장으로 대략적인 배틀메이지에 성능을 유추를 짐작하는 부분이라 할수 있는데 드라이버 최적화나 소비 전력을 감안해서 대략 4070~4070S사이의 성능으로 추측되고 있다.

CES 2024에서 인텔과 PCWorld인터뷰를 통해 배틀메이지에 칩이 완성되었고 연구소에서 30%의 개발팀[6]인력이 투입되어 소프트웨어 개발에 전념하고 있으며 나머지 70%의 개발팀은 3세대 Celestial개발에 투입되었다고 한다. CES 2025 전에는 발매할 것이라고 한다. 꽤나 놀라운 기능이 있지만 아직 언급할 수 없다고 한다.

2024년 2월 15일 인텔에서 라데온의 Radeon Image Sharpening와 비슷한 샤프닝 필터 기능을 루나레이크에 Xe2[7]칩에 들어갈 기술을 개발중이라고 한다. 소프트웨어 방식이 아닌 내장된 미디어 엔진에서 처리하는 방식이기에 인텔 Xe2에서만 사용가능하다고 한다.

2024년에도 수많은 루머가 나왔지만 공통적으로 2024 말에 배틀메이지가 발매한다는 것이 공통된 루머이다.

3.3. Xe3 HPG (Celestial)

3세대 Xe HPG 마이크로아키텍처로, 3세대 Arc 시리즈에 채택될 가능성이 높으며, 2022년 10월 뉴스에 의하면 이미 소수의 개발팀이 투입되었다고 한다.

인텔의 Tom Petersen은 CES 2024 인터뷰를 통해 배틀메이지 첫 실리콘 칩이 인텔 연구소에 들어갔고 그래픽 개발팀 30%는 배틀메이지 소프트웨어 개발팀으로 투입되었고 나머지 70%의 하드웨어 개발팀 인원이 Celestial개발에 투입되었다고 밝혔다

2024년 2월까지 알려진 정보에 따르면 셀레스티얼은 2025년말 출시될 모바일 프로세서인 펜서 레이크의 내장그래픽으로 탑제될 예정이며 데스크탑용 그래픽카드의 출시일은 빨라도 26년으로 예상된다

3.4. Xe Next HPG (Druid)

Xe4가 아닌 Xe Next로 표기된 점을 고려하면 Xe가 아닌 전혀 다른 이름의 HPG 마이크로아키텍처가 될 가능성을 배제할 수 없다. 그때에도 제품군 이름이 Arc 시리즈일 경우, 4세대 Arc 시리즈에 해당될 수도 있다.

4. 여담

  • 인텔 공식 홈페이지에 따르면, 2020년 11월에 출시된 Iris Xe MAX 그래픽스에 이어서 Arc 그래픽스도 Dedicated Graphics Family로 분류하고 있다. 하지만, 전용(Dedicated)이라는 표현이 어떤 형태의 제품인지 쉽게 연상되지 않는 편이기 때문에, 보통 쉽게 연상되는 외장(external), 개별(Discrete)이라는 표현으로 통용되고 있으며, 일각에서는 독립(Independent)이나 분리(Separate)라고 표현하기도 한다.
  • 인텔 커뮤니티를 통해 드라이버 버그 신고를 한다면 SSU라는 인텔에서 제공하는 시스템 로그를 출력해주는 소프트웨어로 로그 TEXT파일을 추출해야 한다. 그리고 이것과 함께 버그 신고를 하는 것이 좋다. 글은 오직 영어로 작성해야 하며 영어를 못한다면 번역기나 챗 GPT로 번역해서 보내면 된다.
  • 일반 소비자의 입장에서 전체적으로 요약하면, 인텔 Arc는 프리미어 영상편집용 GPU라고 할 수 있다. 애초에 인텔 내장그래픽이 영상편집 관련해서 뛰어난 성능을 보여왔고, 이것이 인텔 Arc에서도 이어지고 있다.https://youtu.be/x0bLytMdV24?si=ofsKMJaOFRNE1LzP&t=258 체험판 영상을 기준으로, 3080이 7분 50초가 걸리던 인코딩이 a770에서 4분 37초에 완료되었다. 사실상 어도비가 인텔의 자회사가 아닌지 의심해볼만한 부분

5. 관련 문서


[1] 라자 코두리가 삼성에 방문한적이 있었는데 아마도 그 수율이 만족스럽지 못하여 TSMC로 돌아선 것으로 보인다.[2] NVIDIA 지포스는 녹색, AMD 라데온은 빨간색.[3] 지금은 이미 존재하지 않는 계정으로 나타난다.[4] 사진을 잘 보면 해당하는 직업/종족의 사진이 깨알같이 그려져있으며 알케미스트는 발표에는 안 나와 있지만 인텔의 Arc 홈페이지에 갈 경우 그려져 있다.[5] 또한 Alchemist, Battlemage, Celestial, Druid의 첫 번째 글자가 각각 A,B,C,D인데 인텔 관계자에 따르면 알파벳 순서로 가는것은 의도된 것이라고 언급한다.[6] 소프트웨어팀으로 추정[7] 배틀메이지 칩명

분류