상세 컨텐츠

본문 제목

[권순우, 이동수, 권세중, 유지원] AI반도체 혁명(2024)

독서일기/테크놀러지

by 태즈매니언 2024. 12. 2. 11:47

본문

 
 
한국의 금융과 전략산업들을 중심으로 다양한 경제이슈에 대해, 저같은 무식한 문돌이 아재의 눈높이에 맞춰서 잘 설명해주는 삼프로TV 권순우 취재팀장님, 그리고 한국에서 유일하게 AI 초거대언어모델을 만들고, 서비스를 운영하는 네이버클라우드에서 업무를 담당하시는 이동수, 권세중, 유지원 세 분의 공학자들께서 공저한 책입니다.
AI반도체 시장의 90% 이상을 차지한 엔비디아의 AI가속기를 많이 이용해봤고, 더 나은 반도체를 찾기 위해 전 세계 수많은 반도체 회사들의 제품을 구매하고 테스트해본 분들이 일반인을 위해 바쁜 시간을 쪼개 쉽게 설명해준 귀한 글들이더군요.
저는 ChatGPT-4o와 DeepL을 유료로 사용하면서 그 유용성에 감탄하고 있고, 연구 리서치에 도움을 크게 받고 있습니다. 두 개 합쳐서 월 50달러도 안되는 돈을 지출하는 데 비하면 말이죠.
하지만, 주식도 ETF 위주로 투자하고 있다보니 큰 기대와 관심 없이 교양서로 읽었는데, 분량에 비해 내용이 무척 충실해서 지금 경제활동을 하는 한국인들이 꼭 알았으면 하는 내용들을 쉽게 풀어서 잘 담았더군요.
이런 책이 교양서로 나올 수 있다는게 한국의 저력이 아닐까 싶고요. 그래서 제 올해의 책 후보로 올려봅니다.
컴퓨터와 반도체의 역사를 엮어서 간결한 스토리텔링으로 전달해주는 점은 정지훈님의 <거의 모든 IT의 역사>(개정판, 2020)와 비슷한 느낌이었고요. 그 과정에서 세계의 빅테크 기업들이 어떻게 경쟁하고 협력하며 흥망성쇠를 겪어왔는지도 곁들여서, 마치 춘추오패와 전국칠웅의 쟁패사처럼 문외한들에게 현재 반도체와 빅테크들의 상황과 전략의 큰 구도를 이해하게 해주네요. 그래서 기록해두고 싶은 구절들이 참 많았습니다.
(1998년 3월에 거의 컴맹이던 제가 <PC사랑>을 사서 보면서 CISC와 RISC의 개념을 이해하던 때도 떠오르더군요. ㅋㅋ)
그나저나 2012년 제프리 힌튼 교수팀의 <이미지 인식 대회 3회차> 우승을 가져온 딥러닝 모델 '알렉스넷'이 엔비디아 GPU 두장으로 구축된 걸 파악하고 엔비디아 주식을 사신 분들은 얼마나 부자가 되셨을지. ㅎㅎ
아래 132페이지 인용부분을 보고나서 만약에 중국이 미국의 견제를 뚫고 엔비디아 제품에 필적할 AI반도체 개발에 성공한다고 가정해보면, 한국이 속한 서구권 세계에는 얼마나 격량이 닥칠지 두려워지네요. 중국공산당이 필사적으로 매달릴 이유들이 너무 많아서요.
그리고 일반 개인들에게는 고객의 개인정보를 팔아먹어서 돈을 버는 회사인 메타나 구글같은 사업모델을 가진 회사보다는 온디바이스 모델을 구현하는 편이 본인에게도 유리한 애플이 제일 강력한 엔비디아의 경쟁자가 아닐까 싶은데, 특유의 비밀주의로 인해 내부에서 어떻게 준비하고 있는지 궁금합니다.
----------------------------------
13쪽
(권순우) 이 책은 인공지능에 대한 가장 밑바닥, 가장 기본이 될 AI 반도체를 다루고 있다. 인공지능 데이터 처리의 기본적인 원리와 그에 필요한 특성들을 살펴봄으로써 앞으로 펼쳐질 인공지능 시대의 기반을 이해하는 데 도움이 되고자 한다.
39쪽
최첨단 반도체를 비싸게, 대량으로 구매할 수 있는 고객은 전 세계에서 손에 꼽는다. 중국을 제외하면 애플, 퀄컴, 엔비디아, 인텔, AMD, 삼성전자, 미디어텍, 테슬라 정도다. TSMC가 반도체 파운드리 분야에서 압도적 1위를 지켜가고 있는 가장 중요한 요소 중 하나는 고객, 바로 애플이다.
53쪽
우리가 모바일폰으로 사진을 찍을 때 우리가 보는 건 1장이지만 사실 기기는 여러 장의 사진을 찍는다. 그리고 그중 잘 나온 사진을 사용자에게 골라준다. 어떤 사진을 고를지 정하는 기술도 인공지능을 활용한다. 삼성전자 갤럭시와 애플 아이폰으로 찍은 사진에서 차이가 나는 것은 카메라 하드웨어의 차이가 아니라 어떤 사진을 선택해서 소비자들에게 보여줄지를 결정하는 소프트웨어의 차이다.
59쪽
디바이스와 디바이스에 들어가는 반도체, 통신, 클라우드 데이터 센터가 서로 주도권을 쥐기 위한 싸움은 지속될 것이다.
87쪽
반도체 수율 개선은 수없이 반복되는 시행착오와의 싸움이다. 화학적 작용이 일어나는 모든 상황에서 온도와 압력을 미세하게 조절하며 가장 수율이 높은 조합을 찾아내는 과정이다. 왜 그런 반응이 일어나는지를 이론적으로 입증하는 것은 사치다. 현실 세계에는 중력, 온도, 습도, 눈에 보이지 않는 먼지 등 수많은 요소들이 작용한다. 수없이 반복되는 실패 속에 최적의 조합을 찾아내고, 찾아낸 조합들을 노하우로 축적해 가는 것이다.
106쪽
AMD가 CPU를 만들 수 있었던 것은 로버트 노이스가 AMD를 설립한 제리 샌더스에게 8086 칩을 제조할 수 있도록 허락해 줬기 때문이다. 둘은 페어차일드 반도체에서 함께 근무했던 동료다.
112쪽
애플은 손에 들고 다닐 수 있는 모바일 단말기를 만들고자 했고 저전력 반도체가 필요했다. 애플은 ARM이 만든 저전력 반도체 ARM610을 기반으로 1993년에 세계 최초의 개인정보 단말기 뉴튼 메시지 패드를 만들었다. 아이폰과 아이패드의 조상이라고 할 수 있는 제품이다.
(아이패드가 아이폰보다 먼저 구상되었다더니 이 제품이었네요.)
120쪽
애플은 외부에 반도체를 한 개도 판 적이 없지만 애플이 만든 애플실리콘 제품들의 매출 추정치를 고려하면 애플은 인텔, 삼성전자에 이어 세계 3위 반도체 업체라고 할 수 있다.
132쪽
반도체 시장은 매우 강력한 과점 시장이면서 전문화된 영역별 파트너십이 중요하다. 최고의 설계 기술 기업과 제조 기업이 파트너십을 가져야 한다. 이들은 서로의 목을 겨누면서 손잡고 수직계열화를 하면서 각 영역별 사업을 주고받는다. 생태계가 구축되면 영원히 무너지지 않을 것 같은 공고한 성채가 구성된다.
하지만 패러다임 전환의 시기가 오면 그동안 수면 아래에 존재했던 수많은 기술들이 새로운 파도를 타고 수면 위로 올라온다.
210쪽
결국 AI반도체는 연산기와 메모리, 이를 연결하는 통신 기술이 모두 완벽하게 갖춰질 때 제대로 된 성능을 낼 수 있다.
245쪽
데이터센터에서 소비되는 전력 중 약 절반은 서버를 운영하는 데 쓰고, 나머지 절반은 서버를 운영하며 나오는 열을 식히는 데 사용된다. 냉각은 반도체를 설계할 때부터 고려해야 할 매우 중요한 요소다.
260쪽
CUDA는 엔비디아 생태계를 지키는 중요한 방어막이지만 절대적이지는 않다. 어차피 CPU가 아닌 AI반도체에서 소프트웨어 호환성의 한계가 발생한다는 점은 엔비디아 GPU나 다른 AI 반도체를 만들더라도 동일하다.
293쪽
본격적인 초거대언어모델의 시작이라고 볼 수 있는 오픈AI의 GPT-3모델의 전체 데이터 학습량 중 영어 비중은 97%, 한국어는 0.02% 정도인 것으로 알려졌다. 한국 문화를 바탕으로 만들어진 한국어 데이터로 학습된 거대모델과 영어로 된 데이터를 주로 학습한 거대모델이 내놓는 답은 일정한 차이가 있을 수밖에 없다.
363쪽
서비스 업체들은 당연히 자신들이 사용한 환경에서의 반도체 실제 성능, 안전성, 전력 사용량 등을 알고 있다. 이를 기반으로 서비스 원가를 추정하고 서비스 가격을 책정한다. 하지만 서비스 업체들은 반도체 성능에 대한 구체적인 언급을 꺼린다. 반도체의 실제 성능에 대해 이야기를 하려면 어떤 조건에서 어떤 서비스를 구동할 때 어느 정도 성능이 나왔는지를 언급해야 한다. 그러려면 자신들이 어떤 인프라를 기반으로 어떤 서비스를 기획했는지, 현재 기술 수 준이나 상황이 어떤지를 함께 공개해야 하는 문제가 생긴다. 또 어떤 소프트웨어를 기반으로 최적화를 했는지 등 매우 중요하고 최우선으로 기밀로 해야 할 정보들도 공개해야 한다.

관련글 더보기

댓글 영역