반응형

독자들로부터 DeepSeek에 대한 내 생각을 묻는 이메일을 받았다. 두 가지 경고부터 시작해야겠다. 첫째, 일반적인 경고이지만, 나는 기술 전문가가 아닌 가치 투자자로서 AI 모델에 대한 지식이 깊지 않다. 둘째, 다소 이례적인 경고지만, 우리는 아직 모든 사실을 알지 못한다.

 

 

DeepSeek, AI 패러다임을 깨다  

 

나는 최근 독자들로부터 DeepSeek에 대한 의견을 묻는 이메일을 받았다. 먼저 두 가지 경고부터 해야겠다. 첫째, 나는 기술 전문가가 아닌 일반적인 가치 투자자로서 AI 모델에 대한 지식이 깊지 않다. (지난주에는 한 은행과 석유 회사를 분석하고 있었다.) 둘째, 그리고 더 중요한 점은, 우리는 아직 모든 사실을 알고 있지 않다는 것이다.  

그럼에도 불구하고, 이 이야기는 AI와 지정학 양측에서 큰 변화를 의미할 수 있다. 우리가 알고 있는 사실은 다음과 같다.  

DeepSeek은 중국에서 설립된 지 1년 된 스타트업으로, 헤지펀드에서 분사하여 독립한 기업이다. 이 회사는 최신 AI 모델과 동등한 성능을 내는 대형 언어 모델(LLM)을 개발했다. 업계에서도 이를 확인했으며, DeepSeek은 다른 최상위 LLM과 비교 테스트를 거쳤다. 나는 지난 며칠 동안 DeepSeek을 직접 사용해 봤는데, 그 결과는 ChatGPT나 Perplexity가 생성하는 답변과 매우 유사했으며, 속도는 더 빨랐다.  

이것만으로도 충분히 인상적이다. 특히 불과 6개월 전, 전 구글 CEO인 에릭 슈미트(분명히 기술에 대한 이해가 깊은 인물)가 "중국은 AI에서 미국보다 2~3년 뒤처져 있다"고 말했던 점을 고려하면 더욱 그렇다.  

그러나 정말 충격적이며 아직 검증되지 않은 부분이 있다. DeepSeek은 단 560만 달러의 비용으로 모델을 훈련했다고 주장하고 있다. 반면, 미국의 AI 기업들은 수억~수십억 달러를 투자하는 것으로 알려져 있다. 비용 차이는 20배에서 최대 200배에 달한다.  

이 주장이 사실이라면 그 의미는 엄청나다. 미국 정부가 AI 반도체의 중국 수출을 통제하는 가운데, DeepSeek은 구형 칩을 사용하여 극히 적은 컴퓨팅 파워와 전력만으로 LLM을 훈련했다고 한다. AI의 미래가 더 빠르고 강력한 칩(사실상 Nvidia의 독점적 지위)에 달려 있다고 생각한 가운데, DeepSeek이라는 알려지지 않은 회사가 엄청난 자금과 최신 Nvidia 칩을 장착한 미국 기업들과 거의 대등한 수준을 달성한 것이다.  

DeepSeek은 (추정컨대) 막대한 컴퓨팅 자원의 제약을 받았고, 따라서 다른 접근 방식을 택해야 했다. 결과적으로, 더 낮은 성능의 하드웨어를 사용하면서도 더 효율적인 AI를 만들었으며, 기존 경쟁사들이 "힘"에 집중하는 동안 "두뇌"를 활용해 AI에게 실제로 "추론하는 법"을 가르친 것이다.

 

 

핫도그 먹기 대회에 참가하라  

 

미국인들은 (정크) 음식과 스포츠를 사랑한다. 그래서 나는 음식과 스포츠의 비유를 들어 설명해 보겠다. 네이선스 유명 국제 핫도그 먹기 대회는 1916년에 시작되었다고 주장하지만, 이는 일부 전설적인 이야기일 수도 있다. 공식 기록이 시작된 1970년대에는 우승자들이 평균적으로 약 15개의 핫도그를 먹었다. 이후 점진적으로 25개 정도로 증가했지만, 2001년 일본에서 온 다케루 고바야시가 등장하면서 기존의 패러다임을 완전히 깨뜨렸다. 그는 무려 50개의 핫도그를 먹어 치웠는데, 이는 당시 불가능하다고 여겨졌던 기록이었다.  

그의 비결은 단순히 엄청난 식욕이 아니라 독창적인 방법론에 있었다. 그는 핫도그와 빵을 분리하고, 빵을 물에 적셔 먹는 전략을 사용함으로써 기존의 접근 방식을 완전히 새롭게 재창조했다.

 

 

그로부터 몇 년 후, 조이 체스넛이 등장했다. 그는 고바야시의 혁신을 기반으로 기록을 70개를 넘어 83개의 핫도그까지 끌어올렸다. 고바야시가 기존의 틀을 깨뜨리자 한계라는 개념이 사라졌고, 모든 사람이 방법을 다시 고민해야 했다. 조이 체스넛은 이 점을 활용했다.  

 

 


DeepSeek은 AI 업계에서 ‘고바야시’와 같은 역할을 하며, 산업 전체를 ‘조이 체스넛’ 시대의 혁신으로 이끌 수도 있다. 만약 기존의 구형 칩을 사용하면서도 비용을 대폭 절감했다는 주장이 사실이라면, AI 기업들은 단순히 더 강력한 컴퓨팅 성능을 쫓는 대신, 모델 설계 개선에 초점을 맞추게 될지도 모른다.  

나는 미래의 GPU 칩 수요를 설명하면서 스토아 철학자를 인용하게 될 줄 몰랐지만, 에픽테토스는 이렇게 말했다.  
"행복은 더 많은 것을 원하는 데서 오는 것이 아니라, 지금 가진 것을 원할 때 온다."

 

2000년 전 그는 GPU에 대해 이야기한 것이 아니었겠지만, 마치 지금의 상황을 예견한 듯하다. ChatGPT, Perplexity, 그리고 구글의 Gemini는 더 강력한 컴퓨팅 성능을 향한 욕망을 재고하고, 지금 가진 것으로 더 많은 성과를 낼 수 있는지를 고민해야 할 것이다.  

그렇지 않으면, 수백 개의 신생 스타트업, 대기업, 그리고 아마도 정부 기관들에 의해 도태될 것이다. 이제 ‘수십억 달러’를 ‘수백만 달러’로 쓸 수 있는 시대가 오면, 시장 진입 장벽이 급격히 낮아진다.  

DeepSeek 이전까지 AI는 최신 엔비디아 칩을 갖춘, 극도로 자금력이 풍부한 몇몇 기업들(‘위대한 자들’)만이 다룰 수 있는 영역이었다. 하지만 DeepSeek은 이 패러다임마저 깨뜨렸을지도 모른다.

 

 

엔비디아의 딜레마  

엔비디아에 미치는 영향은 아직 명확하지 않다. 한편으로는, DeepSeek의 성공이 엔비디아 칩에 대한 수요를 줄이고 마진을 낮출 가능성이 있다. 기업들이 AI의 밝은 미래가 단순히 더 많은 엔비디아 프로세서를 연결하는 것이 아니라, 모델을 더 효율적으로 실행하는 데 있다는 사실을 깨닫게 될 수도 있기 때문이다. DeepSeek은 데이터 센터를 더 많이 구축해야 할 필요성을 낮추고, 그 결과 엔비디아 칩에 대한 수요를 줄일 수 있다.  

반면에(경제학자들이 자주 하는 양손 논법을 빌리자면), 진입 장벽이 낮아지면 더 많은 기업이 시장에 참여하게 되어 GPU에 대한 전반적인 수요가 증가할 것이다. 또한 DeepSeek은 자사의 모델이 더 효율적이기 때문에 추론(모델 실행) 비용이 ChatGPT를 실행하는 비용의 일부 수준이며, 메모리도 훨씬 적게 필요하다고 주장한다. 이는 AI 채택을 가속화할 가능성이 있으며, 결과적으로 GPU 수요를 더욱 증가시킬 수도 있다. 따라서 상황에 따라서는 엔비디아에게 긍정적인 소식이 될 수도 있다.  

나의 엔비디아에 대한 생각은 본질적으로 변하지 않았다. 결국 메타, 구글, 테슬라, 마이크로소프트, 그리고 수많은 스타트업들이 GPU를 대중화하여 가격을 낮추는 것은 시간문제일 뿐이다.  

마찬가지로, 경쟁이 치열해지면서 대형 언어 모델(LLM) 자체도 점차 일반화될 가능성이 높다. 경쟁이란 원래 그런 것이며, 그 결과 ChatGPT의 가치가 하락하는 것은 당연한 결과일 수 있다.

 

 

지정학적 충격파

 

지정학적 결과는 엄청나다. 수출 통제 조치가 의도치 않게 새로운 혁신을 촉진했을 가능성이 있으며, 앞으로는 그 효과가 이전만큼 크지 않을 수도 있다. 미국이 AI에 대한 통제력을 가진 것으로 많은 사람들이 믿어왔지만, 이제는 미국을 달가워하지 않는 국가들도 자체적인 AI를 개발하게 될 것이다.

우리는 오랫동안 제조업을 중국으로 이전한 후에도 스스로를 ‘혁신의 요람’이라 위안해 왔지만, AI는 이러한 균형을 미국에 불리한 방향으로 기울게 할 수 있다.

예를 하나 들어보겠다. 최근 *월스트리트 저널*과의 인터뷰에서 OpenAI의 제품 책임자는 다양한 버전의 ChatGPT가 익명으로 프로그래밍 대회에 출전했다고 밝혔다. 전 세계 약 2,800만 명의 프로그래머 중에서 초기 모델들은 상위 2~3%에 해당하는 성적을 기록했다. 최신 공개 버전인 ChatGPT-o1은 상위 1,000위 안에 들었으며, 몇 달 후 출시될 ChatGPT-o3는 상위 175위에 올랐다. 이는 전체의 0.000625%에 해당하는 성과다! 만약 ChatGPT-o3가 작곡가라면, 모차르트와 같은 수준이라고 할 수 있을 것이다.

뛰어난 개발자는 우수한 개발자보다 10배, 어쩌면 평균적인 개발자보다 100배 더 가치가 있다고들 한다. 대략적인 수치이긴 하지만, 의미는 충분히 전달될 것이다. 방갈로르나 아이오와에 사는 19세 청년이 몇 달 전 프로그래밍을 처음 접했더라도 최신 ChatGPT를 활용하면 마치 모차르트처럼 코딩할 수 있게 된다. 이제 어린아이들이 몇 개의 유튜브 영상을 본 후 곧바로 이런 수준의 코드를 작성할 수 있다고 상상해 보라. 지식과 경험의 격차는 급속도로 좁혀지고 있다.

물론 나는 상당한 일반화를 하고 있으며(이 점을 충분히 강조하고 싶다), 하지만 요지는 변하지 않는다. 과거에는 수십 년이 걸리던 ‘프로그래밍의 모차르트’가 되는 과정이 이제는 몇 달로 단축되었으며, 이런 모차르트들이 기하급수적으로 증가하고 있다. 만약 내가 소프트웨어 회사를 운영하고 있다면, 지금쯤 불안감을 느꼈을 것이다. AI가 기존 기업들의 진입 장벽을 허물고 있기 때문이다.

투자(그리고 일반적으로 인생에서도)에서 중요한 것은 변화에 적응하고, 기존의 생각을 검증하거나 폐기할 수 있는 열린 태도를 가지며, 자신의 아이디어를 정체성의 일부로 여기지 않는 것이다. AI 시대에는 이런 태도가 더욱 중요해지고 있다. 우리는 상상했던 것보다 더 빠르게 SF 영화 같은 현실로 진입하고 있다. *DeepSeek*은 이러한 변화의 촉매제가 될 수 있으며, 투자자와 기술 전문가들로 하여금 오랜 신념을 다시 검토하고, 실시간으로 경쟁 환경을 재평가하도록 강요할 것이다.

 

 

출처 :  " DeepSeek Breaks the AI Paradigm" , Vitaliy Katsenelson, THE INTELLECTUAL INVESTOR

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기