Intel, Nvidia, AMD에 심각한 피해를 입힐 수 있음

요약

기존 로드맵 지연(2016~2019년)을 인텔이 따라잡으면서 인텔의 경쟁력은 훨씬 높아지고 있다.
인텔은 가까운 미래에 그러한 제품들을 무수히 많이 출시할 것이다. 이로써 인텔은 AMD와 엔비디아 모두에게 피해를 입힐 수 있는 큰 위치에 놓이게 됐다.
조류는 인텔에 유리하게 변하고 있다. 투자자는 "우측"을 선택(또는 전환)하는 것이 권장될 수 있다.
인텔은 우수한 매출과 실적에도 불구하고 엔비디아 시가총액의 2배 이하에 거래되고 있다.

게티 이미지를 통한 liorpt/iStock 편집

인베스트먼트

지난 몇 년 동안 나는 투자자들 사이에서 인텔의 기술에 대한 심각한 의구심을 보아왔다. 인텔(Intel)이 정말 아직도 기술의 선두에 있는가? 나는 투자자들에게 인텔이 매우 유능한 하드웨어와 기술을 개발했다고 말하고 싶다. 내가 예상한 것은 엔비디아(NVDA)와 AMD(AMD) 모두에게 심각한 피해를 줄 것이다. 이 제품들은 기화기가 아니며 곧 시장에 출시될 것이며, 많은 면에서 경쟁사보다 한 단계 높은 수준이다(CPU와 GPU 모두).

이 기사는 개선된 제품 라인업이 AMD 위협뿐만 아니라 인텔과 엔비디아 사이의 지속적인 충돌 과정을 중단시켰다는 내 논문의 일환으로 인텔이 어떤 진전을 이루었는지 살펴볼 것이다. 따라서, 나는 상황이 변하면서 투자자는 받는 쪽에 있기 보다는 피해를 줄 회사에 투자되고 싶어할 것이라고 주장한다.

이를 위해 나는 현재 인텔의 주가를 상당히 매력적인 진입점으로 보고 있다. 인텔이 당시 7nm 공정을 미뤘던 1년 전과 비교하면 큰 차이가 없다. 그때에 비해 인텔은 현재 상당히 유리한 위치에 있다.

2021년 건축의 날: 고객

1. 알더호수(CPU)

몇 달 전에, 나는 이미 인텔이 특히 게임을 변화시키는 알더 레이크에 아주 강력한 제품을 가지고 있다고 투자자들에게 경고했었다. 구체적으로 말하자면 인텔은 고성능(골든코브) 아키텍처와 더불어 보다 효율적인(Gracemont) 아키텍처의 독특한 조합을 개발했다고 예측했다. 이를 통해 인텔은 코어 수를 경제적으로 확장할 수 있다. 즉 효율적인 코어는 크기가 4배 작아져 mm2당 훨씬 더 높은 성능을 제공한다. 따라서, 주어진 트랜지스터/실리콘 예산에서, 더 작은 코어를 사용하는 것이 덜 큰 코어를 사용하는 것보다 더 많은 성능을 제공한다. AMD는 오직 하나의 아키텍처, Zen을 가지고 있기 때문에, 나는 이 기능을 비교할 수 없다고 불렀다.

Intel: 효율적인 코어는 처리량 기계를 제작하고 가장 효율적인 컴퓨팅 밀도를 제공하도록 설계되어 있다.

인텔이 2021년 아키텍처데이 프레젠테이션에서 확인한 내용이다. Alder Rake는 두 개의 아키텍처를 사용함으로써 절충 없이 단일 스레드 성능은 물론 멀티 스레드 성능을 하나의 CPU에 결합할 것이다. 내가 이미 예상했듯이, 이것은 인텔이 단 한 세대 만에 코어 카운트에서 AMD를 도약시킬 것이다: 타이거 레이크의 4, 8개 코어에서 알더 레이크의 6+8 코어까지.

골든 코브

위의 주장들은 우리가 그 기술에 뛰어들기 시작하면 확인된다. 가장 주목할 만한 것은 애플(AAPL) M1 이후 x86이 아마도 4개의 디코더에 갇힐 것이라는 주장이 있었다. 이를 4폭 아키텍처라고 한다(성능이 선형적으로 확장되지는 않지만, 와이드란 클록당 더 많은 성능을 의미한다). 반면 애플의 M1은 8폭의 아키텍처다.

하지만, 골든 코브가 M1과의 격차를 줄이고 있기 때문에 인텔은 이 신화를 깨뜨리고 있다: 그것은 6폭의 건축이다. 아직 애플에 비해 적은 수준이지만 애플의 M1은 주파수가 최대 3GHz인 반면 알더레이크는 5.5GHz까지 올라갈 것으로 예상된다는 점을 명심해야 한다.GHz.

CPU의 두 번째 키 사양은 "Out-of-Order" 창 또는 재주문 버퍼라고 불리는 것이다. (이 창이 클수록 CPU는 병렬로 실행할 수 있는 명령을 더 많이 검색해야 한다.) 그런 점에서 애플이 600개가 넘는 지시사항을 담은 창을 갖고 있다는 사실이 알려지자 많은 사람들은 아연실색했다. 비교하자면, 두 번째로 큰 것은 인텔의 써니 코브(Sunny Cove)로 300개가 조금 넘는 지시사항이었다. 그러나 골든 코브 역시 500개 이상의 지침으로 증가하면서 상당한 향상을 보았다.

전체적으로 인텔은 클록 사이클당 평균 19%의 성능 향상을 내세우고 있다. 그럼에도 불구하고 언급될 수 있는 한 가지 비판은 골든 코브가 젠3보다 50% 더 넓고 또한 고장난 윈도우의 두 배 정도임에도 불구하고 시계당 성능의 차이는 그리 크지 않을 것으로 예상된다는 것이다(인텔이 젠3보다 19% 미만이기 때문에 인텔이 리더십을 가질 가능성이 가장 높다). 어떤 성능은 아직 개발되지 않은 채 남겨두고 있을 수 있으며, 이는 다음 세대에 '떨어지게' 될 수 있다.

요약하면, 애플은 여전히 가장 앞선 아키텍처를 보유하고 있지만, 인텔은 더 높은 빈도로 인해 전반적인 성능 리더십(애플과 AMD 모두에 반대)을 주장할 가능성이 높다. 물론 이러한 작동 빈도의 차이는 애플의 우월한 공정 노드와 결합되어 M1(그리고 몇 달 안에 M2)이 훨씬 전력 효율이 높을 것이라는 것을 의미하지만, 그것이 그레이스몬트 코어가 작용하는 부분이다.

그레이스몬트

그레이스몬트는 (1) 전력 효율(고성능 유지 중)과 (2) 소형 실리콘 영역이라는 두 가지 주요 목표에 최적화되었다.

첫째로, 인텔의 가장 큰 주장은 그레이스몬트 4개 클러스터가 두 개의 스카이레이크 코어(Hyper 포함)와 동일한 피크 성능을 제공할 수 있다는 것이었다.전력 소비량의 20%에 불과한 스레딩). 두 번째로, 인텔은 그레이스몬트가 스카이레이크 코어보다 4배 작다고 주장하는데, 2년 전까지만 해도 14nm의 인텔의 대표 아키텍처였다.

10코어 골든코브 CPU를 만드는 대신 그레이스몬트의 작은 크기를 고려해 인텔은 8개의 골든코브와 8개의 그레이스몬트를 결합하는 방식을 택했다. 노트북 공간에서는 인텔이 4코어 알더레이크 대신 이 하이브리드 기술을 활용해 2+8코어로 CPU를 만들었다. 인텔은 후자의 조합(2+8)이 4코어 골든 코브보다 50% 이상 높은 성능을 제공한다고 주장했다.

스레드 디렉터

비록 이질적인 CPU는 몇 년 동안 모바일에서 흔하게 사용되어 왔지만, 그것은 x86과 PC 세계에서는 대부분 새로운 것을 나타낸다. 이와 같이 Intel은 워크로드가 올바른 코어로 스케줄링되도록 하기 위한 새로운 기술을 개발했다. Intel은 워크로드에 대한 동적 런타임 정보를 사용하는 하드웨어 기반 솔루션으로 Thread Director를 개발했으며, 마이크로소프트와 협력하여 Windows 11이 해당 정보를 스케줄링에 사용할 수 있도록 지원했다.

한 예로 인텔은 비 AI 코드를 실행할 때 AI 워크로드(일반적으로 코브에서 실행됨)를 몽으로 이동하고, AI 코드 실행을 시작할 때 코브로 다시 일정을 변경할 수 있다고 밝혔다.

다른 물건

인텔도 DDR5, PCIe 5.0, Thunderbolt 4, Wi-Fi 6E로 I/O 기술의 선두로 나아가고 있다.

불과 2년 전만 해도 AMD 팬들은 인텔이 PCIe 4.0에 늦었다고 놀리고 있었다는 사실을 기억하라. 따라서 불과 2년 만에 AMD가 조만간 이러한 전환을 하지 않을 것으로 예상되기 때문에 상황은 이미 바뀌었다.

예

건축의 날 직후에 이어진 핫칩스 회의에서 인텔은 나의 "게임 변화 알더 레이크" 논문을 확증하는 예를 제공했다. 나는 그 글에서 암이 큰 것과는 반대로 그렇게 주장했다.리틀, 인텔은 저전력에 하이브리드 아키텍처를 사용하는 것이 아니라 주로 AMD를 따라잡기 위해 멀티 스레드 성능을 사용하는 것이었습니다.

이 예에서 4코어 골든 코브의 성능을 2코어 골든 코브 + 8코어 그레이스몬트와 비교했다. 이 두 구성의 물리적 실리콘 영역은 거의 동일하다는 점에 유의하십시오. 그러나 인텔은 두 번째 구성이 50% 이상의 멀티스레드 성능을 제공한다고 주장했다.

이것은 인텔의 하이브리드 장점을 보여준다. 인텔이 곧 출시할 4코어 알더 레이크는 타이거 레이크보다 19%(IPC가 19% 더 높기 때문에) 빠른 대신 2+8 구성을 통해 2배 가까운 성능을 제공할 예정이다.

인텔도 코어 카운트를 6이나 8로 늘림으로써 (그레이스몬트 코어를 사용하지 않고) 이러한 성능 향상을 달성할 수 있었지만, 빅 코어는 본질적으로 면적 효율성이 떨어진다. 따라서 인텔은 따라잡기 위해 총 마진을 포기해야 했을 것이다.

고급 노트북 공간에서 인텔은 가상의 8코어 CPU보다 더 큰 성능을 제공할 수 있는 6+8 구성을 선택했다.

요약

알더 레이크에 대한 나의 이전 기사 이후 인텔은 내가 추측했던 것을 확인했다. 인텔은 대형 코어의 코어 수를 늘리는 데 관심이 없다. 대신, 앞으로 인텔은 그레이스몬트 코어를 사용하여 매우 효율적인 "스루풋 머신"을 제공할 것이다.

예를 들어, 다음 몇 세대 동안 인텔은 소형 코어 클러스터의 코어 수를 8개에서 16개에서 32개로 4배 증가시킬 것이다. 몬츠가 크기가 4배 작기 때문에 인텔은 곧 코브스만큼이나 많은 실리콘 영역을 몬츠에 바칠 것이다.

그레이스몬트는 스카이레이크만큼 빠르며, 전력의 극히 일부분이다. 골든 코브와 젠 3-4와 같은 보다 현대적인 아키텍처는 이미 스카이레이크보다 한 단계 높은 수준이지만, 이러한 작은 코어의 많은 부분을 ("스팸")을 사용함으로써 추가적인 멀티스레드 성능은 상당해야 한다. 따라서 몬츠와 코브스의 이 하이브리드 조합은 리더십의 싱글 스레드 및 멀티 스레드 성능을 모두 전달하는 레시피다.

2. 제 HPG와 연금술사(GPU)

인텔은 또한 향후 출시될 이산 GPU에 대해 꽤 많은 정보를 제공했다. 고급 GPU를 출시하겠다고 발표한 지 4년 만에 드디어 이런 일이 벌어지고 있다. 그러나, 1분기 22로 약간 지연되었기 때문에 아직 몇 달은 걸릴 것이다.

가장 중요한 정보:

DG2 칩의 이름을 "Alchemist"로 바꾸었다.
알파벳을 따르는 칩 로드맵을 제공했고, 지금은 드루이드에게 간다.
Xe HPG는 통합된 Xe LP 그래픽의 1.5배 주파수와 와트당 1.5배의 성능을 달성한다고 표시하였다.
칩은 TSMC(TSMC) N6에서 제조되었다고 발표하였다.
XeSS 업스케일링 기술 발표. 엔비디아의 DLSS 2.0과 비슷하게작동하지만 인텔은 대부분의 GPU에서 작동해야하는 비수용 버전 XeSS(따라서 ADM의 FSR과 경쟁한다)도 만들었다.
인텔이 보여준 웨이퍼에서 칩 크기가 400㎜2에 약간 못 미치는 것으로 계산·확인돼 인텔이 하이엔드 부문이 아닌 중형을 겨냥하고 있음을 (예상대로) 보여주고 있다.

성능 면에서는, 최상의 경우, 상위 중거리 부문에서 경쟁할 수 있는 최상의 경우. 그런 다음 가격 책정에 따라 검토 사이트들이 달러당 성능을 기준으로 칩을 추천할지 여부를 결정할 것이다. 이와 같이, 연금술사는 더 경쟁력을 갖추어야 하는 노트북 부문에는 가장 설득력이 있어 보인다.

그러나, 인텔의 공개에 대해 내가 가장 안심하는 것은 연금술사 칩이 아니라, 이미 3개의 GPU를 (드루이드와 함께) 미래로 가는 로드맵이었다. 이것은 인텔이 연간 간부직을 목표로 하고 있을 수도 있다는 것을 나타낸다. 지난해 AMD와 엔비디아의 GPU 사이클 중간에 알케미스트가 출시되기 때문에 필요하다. 인텔이 2023년 초까지 5nm GPU를 출시할 수 있다면 시장 진출 시차를 더욱 좁히고 경쟁력을 높일 수 있다는 얘기다.

인텔이 단기적으로 노트북 분야에서 더 성공할 수 있었던 또 다른 이유는 기존 OEM 파트너십을 더 효과적으로 활용할 수 있기 때문이다.

2021년 아키텍처의 날: 데이터 센터

1. 사파이어 래피드(CPU)

투자자가 이 토론에서 인지할 수 있는 한 가지 측면은 인터넷 상의 많은 논쟁과는 달리 데이터 센터 CPU의 핵심 개수보다 훨씬 더 많은 것이 사실이라는 것이다.

알더 레이크처럼 인텔은 사파이어 래피드를 10년 만에 가장 중요한 CPU라고 불렀다. 사파이어 래피드는 하이브리드 구성을 가지고 있지 않지만 CPU는 전체 스택에서 업데이트된다. 나는 전에 사파이어 래피드에 대해 논의한 적이 있기 때문에 하이라이트만 제공할 것이다.

마지막으로 인텔의 타일/치플릿으로의 전환을 시작하는 사파이어 래피드는 최대 4개의 타일로 구성되며, 단일 망막 한계치인 ~800mm2의 약 2배가 될 것이다.
EMIB 패키징을 활용함으로써 CPU는 획일적인 성능을 갖췄다. 인텔이 설명한 대로 물리적으로 타일링된 CPU지만 논리적으로 단일화된 CPU다. 예를 들어, 모든 (골든 코브) 코어는 어떤 타일의 모든 캐시에 접근할 수 있다.
DDR5, PCIe 5.0, CXL 1.1, Optane 및 통합 HBM은 리더십 I/O 및 메모리를 제공한다.

기본적으로 Sapfire Rapids는 동일한 Golden Cove 아키텍처를 사용하지만 데이터 센터를 위한 몇 가지 추가적인 개선사항이 있다. 예를 들어, Intel은 멀티 테넌트(Multi-tenant) 사용 사례에 대한 일관된 성능뿐만 아니라 탄력적인 컴퓨팅 모델과 마이크로 서비스에 대한 강력한 성능 개선을 강조했다. 인텔은 IPC가 19% 증가한 아이스레이크에 비해 36%가 개선됐다고 주장했다.

게다가 인텔은 사파이어 래피드에서 새로운 도메인 액셀러레이터 엔진에 많은 중점을 두었다. 이는 주요 영역에서 단계적 기능 개선을 제공할 수 있다.

AMX(첨단 매트릭스 확장): 딥러닝/인공지능의 핫 영역을 위해 인텔은 8배 이상의 성능 향상을 통해 이미 의심의 여지가 없는 리더십을 더욱 공고히 했다. 나는 AMX가 사파이어 래피즈에게 300 TOPS(int8)에 가까운 성능을 제공한다고 추정하는데, 이는 가격표가 1만 달러나 되고 일반 CPU 코드를 실행할 수 없는 엔비디아 A100과 그리 멀지 않은 수준이다. 본질적으로, 당신은 모든 사파이어 래피드 CPU와 함께 V100이나 A100의 반을 공짜로 얻을 수 있다.
AiA(가속기 인터페이스 아키텍처): 이를 통해 연결된 가속기와의 동기화 및 신호와 같은 작업을 오프로드할 수 있다.
DSA(데이터 스트리밍 가속기): 이는 본질적으로 일반적인 데이터 이동 작업을 오프로드하기 위한 온칩 IPU(자세한 내용 참조)의 일종이다. 인텔은 패킷 교환 애플리케이션에서 활용도가 39포인트 줄어든 사례를 제시했다. 소켓당 최대 4개의 인스턴스를 지원한다.
QAT(퀵 어시스트 기술): 이 액셀러레이터는 암호화 및 (디)압축 기능을 오프로드합니다. 이것은 새로운 가속기는 아니지만, 4배에서 400Gbps로 업그레이드되었다. 인텔은 1000개의 CPU 코어에 해당하는 성능을 제공한다고 밝혔다. 예를 들어 CPU 활용률을 100%에서 2%로 낮출 수 있다.

요약

인텔은 Sapfire Rapids가 데이터 센터 성능의 새로운 표준을 정립하고 있으며, 확실히 새로운 기능과 업데이트된 기능의 목록이 인상적이라고 주장한다. AMX, DSA, AIA, 통합 HBM, 차세대 옵테인, CXL 1.1 등의 기능이 타의 추종을 불허한다. (특정 가속기를 사용하지 않는) 표준 벤치마크의 정기적 성능에 관한 한, 사파이어 Rapids는 56개의 코어에서만 최대화되겠지만, 위에서 설명한 것처럼, Golden Cove는 선도적인 CPU 아키텍처다.

그런 만큼 사파이어 래피드가 AMX와 같은 액셀러레이터를 통해 더 나아가 타의 추종을 불허하는 부가 가치를 제공하는 동시에 일반 성능에서도 극도의 경쟁력을 갖추기를 기대한다. 이는 대부분의 벤치마크에서 볼 수 없지만, 그럼에도 불구하고 고객에게 실질적인 (세계) 가치를 제공할 것이다.

나는 투자자들에게 위의 트윗에서와 같은 비교를 하지 말라고 경고할 것이다. 주요 이슈는 이 트윗의 저자가 AMD에게 유리한 비교를 골랐다는 것이다. 제노바보다 몇 달 일찍 사파이어 래피드가 출시될 것으로 알려져 있기 때문에, 더 유효한 비교는 사파이어 래피드 대 사파이어 래피드 대라고 주장할 수 있다. 밀라노와 화강암 래피드 vs. 제노바

2. 에반스 마운트(IPU)

투자자들은 데이터 센터에서 새로운 종류의 가속기가 등장하고 있다는 것을 알아차렸을 것이다. 엔비디아는 이를 멜라노스 인수를 통해 인수한 DPU나 데이터 처리 유닛이라고 부른다. 최근까지 인텔은 이들을 스마트라고 불렀다.NIC. 그러나 IPU 또는 인프라 처리 장치라는 용어로 선회하고 있다. 인텔의 IPU 용어는 그것이 하는 일에 있어서 훨씬 더 명확하다. 왜냐하면 지금까지 제조된 모든 칩은 DPU라고 주장될 수 있기 때문이다. 데이터가 없다면 당신은 칩으로는 아무것도 할 수 없다.

용어에서 알 수 있듯이 IPU는 인프라 처리 작업을 CPU에서 오프로드하는 임무를 맡는다. 이는 특히 클라우드 서비스 프로바이더의 전체 비즈니스 모델이 CPU 코어를 임대하는 것을 기반으로 하는 클라우드 시대에 적합해졌다. 이러한 일반 인프라 작업에 사용되는 CPU 사이클은 수익화할 수 없으므로 낭비된다. 인텔은 CPU 활용률의 30-80%가 이러한 오버헤드라고 주장한다.

인텔은 호텔과 유사하게 제공했다: 세입자의 공간(호텔 방)과 인프라 사이에는 명확한 구분이 있어야 한다. 이것이 IPU가 제공하는 것이다: 인프라 코드는 IPU에서만 실행되어야 한다. 이를 통해 CPU를 완전히 수익화할 수 있다.

인텔의 IPU 전략은 인공지능 전략과 매우 흡사하다. 즉, 한 가지 사이즈가 모두 들어맞지 않는다는 것이다. 이처럼 인텔은 이더넷과 FPGA 기반 스마트NIC에 지속적으로 투자하고 있다. 또한, 위에서 제시한 바와 같이 사파이어 래피드는 QAT, AiA, DSA와 함께 다양한 온CPU 오프로드 기능도 갖추고 있다.

인텔이 새롭게 발표한 퍼즐의 마지막 조각도 이산형 ASIC 기반 IPU의 분야로 들어가는 것이다. 이를 위해 인텔은 에반스 산을 발표했다. 인텔은 선도적인 클라우드 서비스 제공업체와 제휴해 개발했다고 밝혔다.

인텔은 "동급 최고" 프로그램 가능한 패킷 처리 엔진을 포함한 칩의 다양한 특징/기능을 공개했다. 이는 인텔이 몇 년 전 인수한 맨발네트웍스가 개발한 P4 언어를 바탕으로 한 것이다. 주목할 만한 세부 사항 중 하나로, 이 칩에는 16개의 Arm Neoverse N1 코어도 포함되어 있다. 이 칩은 200G 네트워킹 처리가 가능하고 최대 4개의 호스트 Xeons를 지원한다.

요약

인텔은 이미 시장점유율 1위라고 주장하며 고성능 전용 IPU로 리더십과 포트폴리오 확대를 꾀하고 있다.경쟁사가 ASIC로 옮겨갔기 때문에 이 공간과 관련성을 유지하기 위해 필요한 조치였다.

하지만 일각에서는 엔비디아가 앞으로 DPU/IPU에 AI 역량을 대거 투입하고 있지만 인텔의 에반스 마운트는 그런 능력을 갖추지 못하고 있다는 지적도 나온다. 이 분야의 두 주요 경쟁사인 엔비디아와 마벨도 이미 400G DPU/IPU를 발표했지만 인텔 측은 이 칩이 최상위 클라우드 서비스 제공업체와 함께 설계돼 400G 네트워크가 아직 보편화되지 않았다고 주장했다.

3. 폰테 베키오 (GPU)

마지막으로 중요한 것은 인텔이 폰테 베키오에 대해 더 자세한 정보를 공개했다. 가장 주목할 만한 점은 인텔이 컴퓨터 타일이 TSMC(TSMC) N5에서 제조된다는 점이다. 폰테 베키오가 최신 공정기술을 기반으로 구축된 HPC와 AI의 첫 GPU가 돼 내재적 우위를 제공한다는 의미다. 폰테 베키오 이전에, 제온 파이 선(그리고 네르바나 선)의 단종을 감안하면, 인텔은 이미 몇 년 동안, 이 공간에 존재하지 않았던 것이다. AI 전용 하바나 라인은 여전히 TSMC 7nm로 전환되지 않아 폰테 베치오는 내년 인텔의 AI·HPC 주력 제품이 될 전망이다.

칩이 전달되는가? 나는 인텔의 공시를 바탕으로 폰테 베키오가 2000 TOPS인 int8(2GHz) 성능의 최대 2 POP를 달성할 수 있다고 계산했다. 비교하자면, 엔비디아의 최신 A100은 600 TOPS를 조금 넘는 정도밖에 제공하지 못한다. 이는 폰테 베키오가 3배의 피크 성능을 편안하게 전달한다는 것을 의미한다. 엔비디아 역시 2022년 후반 5nm로 전환될 가능성이 높지만 인텔은 경쟁력 있는 제품을 내놓으며 입지가 매우 좋아 보인다.

50여 년 만에 처음으로 엔비디아가 진정한 경쟁을 받게 될 것이고, 엔비디아의 고객들은 적어도 인텔을 가격 인하를 위한 협상 책략으로 활용하기를 열망할 것이다. 이것은 엔비디아의 상당한 총 마진을 잠식할 수 있다.

그러나, 이러한 이론적 처리량에도 불구하고, 인텔이 공유한 실제 숫자로 볼 때, 인텔이 그것의 소프트웨어를 최적화하는데 아직 약간 뒤처져 있는 것은 분명하다. 특히 인텔이 보여준 유일한 벤치마크는 A100을 물리친 구 레스넷-50뿐이지 가능한 최대 3배까지가 아니라 아주 작은 표차로 겨우 이겼다.

덜 성숙된 소프트웨어 생태계는 채택을 늦출 수 있다. 따라서 폰테 베키오가 모든 분야에서 엔비디아보다 한 수 위라고는 하지만, 나는 엔비디아의 데이터 센터 수익이 하룻밤 사이에 붕괴할 것이라고 반드시 예상하지는 않을 것이다: 어떻게 인텔의 시장 점유율이 AMD로 인해 붕괴되지 않았는지와 유사하다.

투자자들은 이에 대해 걱정해야 하는가? 특별히 그렇지는 않다. 하드웨어를 최대한 활용할 수 있도록 소프트웨어를 최적화함으로써 엄청난 성능 향상을 달성할 수 있다고 알려져 있다. 엔비디아는 분명히 벌써 몇 년째 이 일을 해오고 있다. 인텔도 벌써 몇 년째 이 일을 해오고 있지만, 대부분 CPU 쪽에 있다. 인텔도 A0 실리콘을 사용하고 있다고 강조했다.

요약

인텔은 폰테 베키오(Ponte Vecchio)를 문샷이라고 불렀는데, 이는 경쟁을 뛰어넘어 인텔을 한 세대 만에 AI/HPC와 다시 연관시킬 수 있는 GPU이다. 트랜지스터의 2배 이상, 이론적 처리량의 2배 이상이면, 이것은 확실히 인텔이 제공한 것이다(부분적으로는 N5 공정의 장점 때문이다). 인텔은 'oneAPI'로 오픈 산업 소프트웨어 생태계에 많은 투자를 해왔지만, 여전히 일감이 남아 있는 것으로 보인다.

파이낸셜스

이 모든 것이 인텔의 상위 및 하위 라인과 주식 성과에 어떤 영향을 미치는지에 대한 보다 심도 있는 논의를 위해 분기별 수익 논의를 참고하겠다.

그러나 인텔에 대한 나의 논문은 시간이 지남에 따라 특히 데이터 센터에서 전반적인 반도체 시장 성장을 주로 기반으로 하고 있다. 그러나 늘어나는 반도체 수요(PC, 클라우드 등)를 활용하기 위해서는 인텔이 지난 몇 년간 주요 관심사였던 리더십 제품을 선호한다.(인텔이 강력한 포트폴리오를 제공하지 못하면 시장점유율보다 더 많이 잃을 수 있다)

나는 여전히 AMD가 최악의 경우 어느 정도 점유율을 계속 얻을 것으로 예상하지만, AMD 역시 총 마진 증가를 목표로 하는 것으로 알려져 AMD 역시 가격과 시장 점유율 사이에서 절충을 해야 할 것이다. 그러나 특히 데이터 센터에서 논의된 인텔의 CPU는 앞으로 크게 개선될 것이며, 인텔은 IPU, FPGA, NPU, GPU와 같은 나머지 포트폴리오와 함께 여전히 결합할 수 있다.

그런 점을 벗어났고, 나는 현재 인텔의 주가를 상당히 매력적인 진입점으로 보고 있다. 인텔이 당시 7nm 공정을 미뤘던 1년 전과 비교하면 큰 차이가 없다. 그때에 비해 인텔은 현재 상당히 유리한 위치에 있다(7nm/4 고정, 파운드리 신사업, 위에서 논의한 제품, 신임 CEO 및 경영진 등).

예를 들어 TSMC(TSMC)와 엔비디아 모두 인텔이 여전히 더 많은 매출과 수익을 올리고 있으며, GPU/AI 공간뿐만 아니라 (위에서 논의한 바와 같이) 파운드리 공간(TSMC가 현재 선도하고 있는 곳) 모두에서 주도권을 확보하기 위해 경쟁하고 있다.

인텔 약점

인텔이 아키텍처 데이에 뛰어난 기술을 선보였지만 투자자들도 어떤 약점이나 리스크를 찾아 나설 것이다.

고객측에서는 인텔의 전략에 동의한다. 지금까지 몇 년 동안 인텔 CPU의 핵심 개수가 쟁점이 되어 왔다. 하이브리드 아키텍처는 총 이윤을 희생하지 않고 동급 최고의 단일 및 다중 스레드 성능을 모두 제공하는 최고의 솔루션이다.

그러나 데이터 센터 쪽에서는 사파이어 래피드의 검토와 벤치마크를 기대하고 있을 것이다. 특히 사파이어 래피드는 대형 P코어만을 사용하기 때문에 코어카운트 56개(아직 AMD 이하)에 도달하는데 필요한 실리콘 면적의 양이 어마어마하다. 인텔은 타일형 칩렛 설계로 수율/비용에서 다소 앞서지만 사파이어 래피드는 가능한 최대 단일 칩의 두 배 규모를 갖췄다.

이와 같이, 칩의 다이 면적을 증가시킨 가속기의 일부를 사용하지 않는 애플리케이션의 경우, 유휴/소거된 실리콘이 상당히 있을 수 있다. 반면 인텔은 임의의 벤치마크만을 위해 사파이어 래피드를 설계한 것이 아니라 실제 데이터센터 워크로드를 위해 설계한 것이라고 명시적으로 밝혔다. 대부분의 투자자들은 중앙처리장치의 핵심만 보고 판단하지만 인텔은 장문의 기사에서 피상적인 관점을 대변한다고 주장했다.

하지만 나는 사파이어 래피드가 인텔의 칩렛 디자인 접근법에서 단지 첫 번째 반복을 대표할 것이라고 기대한다. 미래에는 세 가지 해결책이 있을 수 있다. 첫째, 인텔은 훨씬 작은 칩을 가진 폰테 베키오처럼 CPU를 설계할 수 있다. 둘째, 인텔은 데이터 센터에 E코어를 E코어 전용 CPU 또는 하이브리드 CPU의 일부로 도입할 수 있다. 셋째, 일부 고객은 Intel의 IP를 자신의 요구사항에 맞게 조정하기 위해 Intel Foundry Services로 눈을 돌릴 수 있다.

투자자 테이크어웨이

인텔은 최신 제품으로 두 주요 경쟁사에 심각한 피해를 입힐 가능성이 있다. 이 글에서 나는 기술에 대한 개요를 제공했다.

인텔은 알더 레이크와 사파이어 래피드스에서 모두 사용할 새로운 리더십 x86 아키텍처를 제공하고 있다. 고객 측면에서 인텔은 하이브리드 아키텍처의 혁신적인 사용으로 가장 시급한 당면 과제(다중 스레드 성능)를 해결하고 있다. 데이터센터에서는 코어당 성능이 더 높아 인텔의 낮은 코어 수를 만회할 수 있었고, 인텔은 AMD가 갖추지 못한 가속기 등 리더십 기능도 많이 갖추고 있다. 그럼에도 불구하고 이러한 가속기는 실제로 사용되는 경우에만 유용하다. 전체적으로 인텔은 AMD가 지난 몇 년 동안 창출한 격차를 최종적으로 좁힐 수 있는 매우 설득력 있고 차별화된 기능 세트를 제공할 것이다.

또한 인텔은 IPU 포트폴리오에 투자하여 데이터센터를 더욱 재설계하는 한편, 폰테 베키오(Ponte Vecchio)와 함께 수년 만에 엔비디아의 GPU 독점에 실질적인 첫 번째 경쟁도 제공하고 있다.

마지막으로, GPU 판매가 호조를 보이고 있지만, 많은 게이머들은 가격 책정 환경뿐만 아니라 공급 문제 때문에 불만족스러워하고 있다. 이것은 인텔이 제3의 GPU 제공자가 될 기회를 제공한다. 인텔의 초기 GPU는 성능에서 주도권을 갖지 못하기 때문에 가격 결정에 따라 경쟁력이 좌우될 것이다. 인텔이 OEM과의 파트너십을 활용할 수 있다면(어느 쪽이든 Nvidia를 대체해야 하지만) 노트북 부문에서 초기 활용도가 가장 높을 수 있다고 언급했다.

요약하자면, 이 기술은 향후 몇 년 안에 인텔이 다시 부상할 수 있는 초석이 될 것이다; 인텔은 자사의 팹이 경쟁력을 회복하기를 기다릴 필요가 없다. 이 제품들은 팻 겔신저가 인텔에 재입사하기 훨씬 전에 이미 출시되었지만, 강력한 IDM 2.0 전략과 결합하면, 이것은 수익 증대를 위한 다년간의 여정의 기반이 될 수 있고, 따라서 아마도 주주들이 복귀하고 P/E의 다중 확장이 될 것이다.

증권가에서는 인텔이 엔비디아와 TSMC를 제치고 1조 달러 규모의 반도체 기업으로 발돋움할 수 있는 위치에 있다는 시각이 여전하다.

저작자표시

'주식' 카테고리의 다른 글

아마존 인수를 고려할 때 팔란티르의 주가가 폭발할 것이다. (0)	2021.09.05
팔란티르: 40의 법칙 (0)	2021.09.05
알리바바와 텐센트의 위험성을 설득한 조지 소로스 (0)	2021.09.05
AMD가 저평가됨 (0)	2021.09.05
페이스북: 성장 둔화에 대해 걱정해야 한다 (0)	2021.09.04

Intel, Nvidia, AMD에 심각한 피해를 입힐 수 있음

Intel, Nvidia, AMD에 심각한 피해를 입힐 수 있음

요약

인베스트먼트