Arm의 마이크로 아키텍처 IP | |||
Arm Cortex 시리즈 | |||
A 시리즈 | R 시리즈 | M 시리즈 | X 시리즈 |
Arm Neoverse 시리즈 | |||
Arm AE 시리즈 |
1. 개요
ARM사의 프로세서는 2015년경을 기점으로 고성능/중간급/고효율 이라는 3단계 라인업으로 구성이 정리되었었다. 이는 일반적으로 언급되는 하이엔드-메인스트림-엔트리 개념으로 봐도 무방하다.
그러나 스마트폰의 발달과 데스크톱 컴퓨터와 서버 같은 거치형 컴퓨터에도 고성능 ARM 아키텍처에 대한 요구가 높아져서 기존 ARM Cortex-A 시리즈보다 더 고성능 제품을 출시하기로 하였다.
CXC(Cortex-X Custom)프로젝트의 시작은 ADP(Advanced Development Program)였으며, 중간에 ELP(Enhanced Lead Partner) 프로그램을 거쳐 현재에 이르고있다. ADP는 기반이 되는 코어나 Interconnect에서 굉장히 제한된 부분만을 수정해주는 Semi-custom 방식이었다. ELP 프로그램은 더 많은 요청을 수용하여 광범위한 변경이 반영되고 이에 따라 제품명과 코드네임, CPU ID까지 다른 별도의 프로세서 취급을 받는다.
이러한 프로그램의 변경에 따라 Hercules는 ADP를 통해 커스터마이즈 되어 Hera가 되었으며, 이후 ELP 프로그램에 의해 Cortex-X1으로 리브랜딩 되었다.
Cortex-X 시리즈는 동급 ARM Cortex-A 시리즈 보다 30% 가량 높은 성능을 가지고 있으며, Cortex-X로만 구성되어 서버나 데스크탑용 CPU로 사용될 수 있을것으로 보인다. Cortex-X2부터 Cortex-X로만 구성된 8코어 CPU가 가능해진다.#
Cortex-X 시리즈에 적용된 명령어 셋은 Cortex-X1만 ARMv8-A이고, 이후 X2부터는 모두 ARMv9-A 이상이다.
2. ARMv8-A
2.1. Cortex-X1
ARM Cortex-A 시리즈의 A78을 기반으로 디자인된 고성능 커스텀 코어로서 성능은 공식 발표에 따르면 SPECint2006 기준 A77 대비 30%, A78 대비 20% 상승했으며, FP/ASIMD 연산 유닛이 두배가 되어 머신러닝 성능이 2배가 되었다. 빅리틀 코어 구성 시 1~2 개의 고성능 코어를 넣을 때 주로 사용될 것으로 보인다. 권장하는 설정은 한개의 Cortex-X와 세개의 big, 그리고 4개의 LITTLE 코어로 구성된 1+3+4 구성이다. 코드네임은 Hera.
아난드텍에서 spec 벤치마크 성능을 기준으로 예상한 성능으로만 보면 Apple의 A13 Lightning 칩과 성능이 비슷하고 전성비는 더 뛰어날 것으로 예상되었지만 2021년 2월 8일 아난드텍의 단일 스레드 성능 및 전력효율 측정결과 실제로는 A13 Lightning의 성능에 근접하지 못하였고 A14 Firestorm과 비교 시에는 SPECfp2006 433.milc 등 일부 항목을 제외하면 성능과 전력효율이 모두 크게 밀린다.
3. ARMv9-A
ARMv9부터 32비트 지원을 완전히 중단하고 64비트로 완전하게 전환된다. 이로서 32비트 지원에 사용하던 트렌지스터까지 64비트에 할당해 20% 추가 성능향상이 있을것으로 기대한다.# 실제 Apple의 Apple M1은 ARMv9는 아니지만 32비트 레이어를 빼버려서 동세대 ARM CPU인 ARM Cortex-X1를 압도하는 성능을 보여주었다.
하지만 안드로이드는 32비트 전용 앱이 남아있는 상황이기 때문에 Cortex-A710까지 32비트 지원을 없애지 못하고 있다가 2022년 하반기 도입된 Cortex-A715에 가서야 완전히 64비트로 전환하였다.
3.1. Cortex-X2
ARM Cortex-A 시리즈의 A710을 기반으로 디자인된 고성능 커스텀 코어. 코드네임은 Matterhorn-ELP. ARMv9 아키텍처를 지원하는 arm CXC 프로그램의 첫 결과물이다. OoOE(Out-of-Order Execution) 방식이고, 백엔드 구조가 변경되었는데, 로드/스토어 유닛이 33% 늘어났고, L1 d-TLB(Translation Lookside Buffer)가 기존의 40 엔트리에서 48 엔트리로 늘었다. 최대성능은 전작 X1 대비 16% 상승했으며, 머신러닝 성능이 두 배 향상되었다.
다만, 16%의 향상치는 권장사양인 8MB L3캐시 디자인 기준으로, 삼성 엑시노스 2100이나 퀄컴 스냅드래곤 888의 사례처럼, 제조사들의 칩셋 개발 상황에 따라 캐시메모리를 온전히 탑재하지 못 할 수도 있어서 실제 제품화됐을 경우, 성능 향상폭이 arm에서 제시하는 만큼 달성하지 못할 가능성이 있다.
3.2. Cortex-X3
ARM Cortex-A 시리즈의 ARMv9 CPU인 Makalu를 기반으로 하는 고성능 커스텀 코어. 코드네임은 Makalu-ELP.Cortex-X2 대비 IPC는 11% 향상되고 클럭포함 성능 향상은 최대 25%[1]라고 발표되었다.
3.3. Cortex-X4
ARM Cortex-A 시리즈의 ARMv9.2 CPU인 Hunter를 기반으로 하는 고성능 커스텀 코어. 코드네임은 Hunter-ELP.
무려 10-Wide Decoder를 가진다. X3의 6-wide에서 4나 증가한 것으로, 종전의 최대였던 Apple의 Everest (9-Wide)를 제쳤으며 현용 CPU 사상 최초로 두자릿수 Decoder width를 가지는 아키텍처가 되었다.[2]
Cortex-X3 대비 최대 성능은 15% 향상, 전력 효율은 40% 향상되었다.
미디어텍의 Dimensity 9300과 9400은 특이하게 big뿐만 아니라 middle코어로도 채택하였다.
3.4. Cortex-X925
코드네임 Blackhawk. 기존에 Cortex-X5로 알려졌던 코어로, Cortex-X4 대비 최대 성능이 36% 향상되었다.
===#
코드네임 Travis. ELP코어와 mid코어의 성능 차이를 메꾸기 위해 Alto가 추가되었다.