반도체 투자 심층 분석 / 온디바이스 AI 생태계

데이터센터 밖으로 나온 AI: 온디바이스 AI 반도체 생태계 분석 | 머니 인사이트 Vol.22
9.1억 2028년 AI폰 출하 전망 (IDC)
85 퀄컴 스냅X2 엘리트 NPU TOPS
25.8조 2026년 온디바이스 반도체 부가가치
21.6% AI 반도체 시장 CAGR 2022→2028

엔비디아의 GPU가 데이터센터를 장악하는 동안, 진짜 전쟁은 손안에서 이미 시작됐다. NPU라는 작은 칩 하나가 수억 대의 스마트폰과 PC와 자동차를 AI 연산 노드로 전환시키고 있다. 이 글이 다루는 세 가지 핵심 가치를 먼저 제시한다.

① NPU 설계 경쟁 구도와 로열티 경제학 ② 모바일 DRAM 수요 구조의 질적 전환 ③ 한국 투자자를 위한 수혜 밸류체인 지도

왜 AI는 클라우드를 떠나기 시작했는가

오픈AI의 서버 운영 변동비는 2022년 월 600억 원 수준에서 불과 1년 만에 910억 원으로 치솟았다. 사용자가 쿼리 하나를 날릴 때마다 데이터센터의 GPU 클러스터가 수십 와트를 태운다. 이 구조적 비용 압박이 AI의 엣지 이동을 강제하는 근본 동력이다. 클라우드 AI는 스케일이 커질수록 단위 경제가 악화되는 반면, 온디바이스 AI는 기기가 이미 구매된 이후엔 추가 연산 비용이 사실상 제로에 수렴한다.

2019년의 반도체 산업은 데이터센터 GPU에 집중된 자본 배분이 압도적이었다. 당시 NPU는 애플의 뉴럴 엔진이나 퀄컴의 헥사곤 프로세서 정도가 고작이었고, 시장의 주류 담론에서 밀려나 있었다. 그런데 2024년 삼성 갤럭시 S24 시리즈가 ‘최초의 온디바이스 AI 스마트폰’을 선언하면서 판이 뒤집혔다. 엑시노스 2400에 탑재된 NPU의 성능은 전전 세대인 2200 대비 14.7배 향상됐다. 하드웨어의 혁신 속도가 소프트웨어의 수요를 끌어당기는 시대가 열린 것이다.

PC가 인터넷 혁명을 낳고, 스마트폰이 IoT 혁명을 낳았다면, 온디바이스 AI를 탑재한 기기는 세 번째 IT 혁명의 기반 인프라가 될 것이다. 문제는 그 혁명의 수익을 누가 포획하느냐다.

가트너는 2027년까지 AI 관련 데이터 유출의 40% 이상이 클라우드 기반 생성형 AI의 오용에서 발생할 것이라고 경고했다. 개인정보 보호와 레이턴시(지연) 제거라는 두 가지 명제가 온디바이스 AI를 단순한 비용 절감 수단이 아니라, 엔터프라이즈와 소비자 모두에게 필수 인프라로 격상시키고 있다.


NPU 설계 전쟁: 퀄컴·애플·ARM의 삼각 구도

NPU(Neural Processing Unit)는 신경망 연산, 특히 스칼라·벡터·텐서 수학으로 구성된 AI 워크로드를 CPU나 GPU 대비 수십 배 낮은 전력으로 처리하도록 특화 설계된 반도체다. 핵심 지표는 TOPS(테라 연산/초)이며, 생성형 AI를 스마트폰에서 실시간 구동하려면 최소 30 TOPS 이상이 요구된다.

퀄컴: 헥사곤 NPU와 이기종 컴퓨팅의 패권

퀄컴의 접근법은 이기종 컴퓨팅(Heterogeneous Computing)이다. 헥사곤 NPU를 중심에 두고, 오라이온(Oryon) CPU와 아드레노 GPU가 워크로드에 따라 협력하는 구조다. 2026년 퀄컴 스냅드래곤 X2 엘리트는 NPU 단독으로 85 TOPS에 도달했으며, 회사 측은 경쟁사 대비 NPU 성능이 약 100배 향상됐다고 밝혔다. PC 시장에서 인텔을 전력 소비 기준 3분의 1 수준으로 압도하면서 AI PC 생태계의 주도권을 선점하고 있다. 스냅드래곤 8 엘리트는 130억 개 이상의 파라미터를 가진 LLM을 클라우드 없이 온디바이스로 실행하는 첫 모바일 칩이 됐다.

애플: 폐쇄 생태계가 만드는 AI 해자

애플의 전략은 다르다. A17 Pro에 35 TOPS NPU를 탑재하고, M3 칩에 16코어 18 TOPS 뉴럴 엔진을 심었다. 단순 수치만 보면 퀄컴에 밀리는 것처럼 보이지만, 애플의 진짜 강점은 하드웨어-소프트웨어 수직 통합이다. 애플 인텔리전스는 온디바이스 모델과 클라우드 모델을 원활하게 교차하는 ‘하이브리드 AI 아키텍처’를 채택했고, 사용자의 디바이스를 떠나지 않는 개인 데이터 처리로 경쟁사와 차별화했다. 반도체 성능 지표가 아닌 생태계 잠금(ecosystem lock-in)이 애플의 진정한 해자다.

ARM: 로열티 모델로 설계 전쟁에서 모든 파이를 차지하다

ARM은 싸우지 않고 이긴다. 퀄컴이 오라이온 CPU를 자체 설계하든, 삼성이 엑시노스를 만들든, 미디어텍이 디멘시티를 내놓든, 거의 모든 모바일 칩은 ARM 아키텍처에 라이선스 로열티를 지불한다. ARM은 최근 AI 중심 칩 설계와 관련한 로열티 및 라이선스 수요 급증으로 기록적인 성장을 달성했다. 분석가들은 2028년까지 ARM의 연간 매출이 74억 달러에 달할 것으로 전망하며, AI 시대의 수혜를 가장 구조적으로 누릴 기업으로 지목한다.

주요 NPU 설계 경쟁사 비교
기업 대표 칩셋 NPU 성능 비즈니스 모델 AI 전략 강점 투자 리스크
퀄컴 스냅드래곤 X2 엘리트 ~85 TOPS 최강 칩 판매 (팹리스) 이기종 컴퓨팅, PC 침투 ARM 라이선스 분쟁 리스크
애플 A19 Pro / M4 35~40 TOPS 고효율 수직 통합 (하드+소프트) 생태계 잠금, OS 최적화 폐쇄형 생태계 성장 한계
ARM Armv9 아키텍처 IP 라이선스 제공 IP 로열티 / 라이선스 산업 표준, 전방위 수혜 고객사 자체 설계 확대
삼성 엑시노스 엑시노스 2500 ~50 TOPS 경쟁중 내재화 + 외부 공급 삼성 갤럭시 공급 안정성 퀄컴 대비 성능 격차 지속
미디어텍 디멘시티 9400 ~35 TOPS 칩 판매 (팹리스) 중저가 시장 AI 침투 수익성·ASP 낮음

모바일 DRAM 시장의 조용한 혁명: LPDDR5X에서 LPDDR6로

온디바이스 AI가 불러온 가장 과소평가된 변화는 바로 모바일 메모리 시장의 질적 전환이다. AI 추론 워크로드는 학습(Training) 대비 약 3배의 메모리 사용량을 요구한다. 실시간으로 거대 파라미터를 불러오고 처리해야 하므로, 용량과 대역폭 모두에서 기존 모바일 DRAM의 규격을 밀어붙이고 있다.

2025년까지 모바일 기기 제조업체의 78% 이상이 LPDDR5 또는 LPDDR5X로 전환을 완료했다. LPDDR5X는 이전 세대 대비 성능을 최대 25% 향상시키면서 전력은 25% 절감하는 규격으로, 스마트폰의 배터리 수명을 지키면서도 AI 연산을 가능하게 하는 핵심 기술이다. 삼성의 LPDDR5X는 단일 패키지로 최대 32GB를 지원하며, 10.7 Gbps의 데이터 전송 속도를 달성했다.

그리고 그 다음 세대인 LPDDR6의 표준이 이미 확정 단계에 들어서 있다. LPDDR6는 단순한 공정 미세화가 아닌, 회로·전력 관리 단계부터 AI 시대 요구에 맞게 전면 재설계된 메모리로, CES 2026에서 삼성이 혁신상을 수상했다. 자동차, AI PC, 엣지 서버까지 응용처가 확장된다. 퀄컴 스냅드래곤 8 차기 세대부터 LPDDR6를 지원할 것으로 업계는 내다보고 있다.

시장 인사이트

여기서 흥미로운 역설이 발생한다. HBM을 향한 생산 자원 집중이 역설적으로 모바일 DRAM(LPDDR) 공급 부족을 심화시키고 있다. 메모리 제조사들이 고마진의 HBM 라인을 확충한 결과, LPDDR 공급 여력이 줄었고, 이는 LPDDR 가격과 출하량이 동시에 오르는 강한 수퍼사이클로 이어지고 있다. 씨티는 AI 슈퍼사이클이 2026년까지 이어질 것으로 보고 있으며, 트렌드포스는 LPDDR5X를 포함한 범용 DRAM 가격이 18~23% 상승할 것으로 전망했다.

더욱 주목할 만한 변화는 LPDDR의 서버 침투다. 엔비디아의 Grace Superchip이 LPDDR5X를 채택한 이후, 구글·아마존·메타 등 하이퍼스케일러들도 서버용 LPDDR 도입을 검토하기 시작했다. AI 서버 한 대가 모바일 기기보다 30~40배 많은 LPDDR을 탑재하며, 서버용 LPDDR의 이익률은 HBM에 준하는 40~50%에 달한다. 모바일에서 출발한 저전력 메모리가 데이터센터를 역침투하는 아이러니한 흐름이 전개되고 있다.


PC·자동차까지 확장되는 AI 엣지 컴퓨팅 생태계

온디바이스 AI 전쟁은 스마트폰 하나로 끝나지 않는다. AI의 스마트폰 침투율은 2024년 9%에서 2027년 39%로, PC 침투율은 11%에서 53%로 확장될 전망이다. 2026~2027년은 이 기기들이 본격 상용화되는 전환점이다.

자동차 전자 부문도 새로운 전선이 열렸다. 새로 출시된 전기차의 47%가 ADAS와 인포테인먼트 시스템에 LPDDR 메모리를 탑재하며, 자동차 부문 LPDDR 수요는 2024년 한 해만 41% 급증했다. 자율주행 시스템은 클라우드로의 데이터 전송 지연이 생사를 가를 수 있기 때문에, 온디바이스 AI가 단순한 편의 기능이 아닌 안전 필수 요소가 된다. 퀄컴은 이미 ADAS(첨단 운전자 보조 시스템) 플랫폼을 고도화하며 BMW를 시작으로 고객사를 확대하고 있다.

삼성증권에 따르면, 향후 3년간 스마트폰 3억 900만 대와 PC 1억 8천만 대가 온디바이스 AI 기기로 공급될 전망이다. 이를 반영하면 2026년 기준 모바일과 PC 중심의 시스템 반도체 시장에서만 약 25조 8천억 원의 부가가치가 창출될 것으로 추산된다. AI 반도체 전체 시장은 2022년 411억 달러에서 2028년 1,330억 달러로 연평균 21.6% 성장이 전망된다.


온디바이스 AI의 진짜 수혜자는 엔비디아가 아닌 삼성전자와 SK하이닉스일 수 있다

시장은 온디바이스 AI 하면 NPU 설계사를 먼저 떠올린다. 퀄컴, 애플, ARM. 하지만 20년간 반도체 사이클을 분석해온 필자의 시각은 다르다. NPU 설계 경쟁이 치열해질수록, 정작 TOPS 경쟁에서 구조적으로 이기는 건 메모리 제조사들이다.

이유는 단순하다. NPU의 연산 성능이 올라갈수록, 그 성능을 실제로 발휘하려면 더 빠르고 더 넓은 대역폭의 메모리가 반드시 뒤따라야 한다. 10B 파라미터 모델을 구동하려면 최소 10GB 이상의 고속 메모리가 필요하다. TOPS 경쟁이 격화될수록 메모리 수요는 구조적으로 증가하는 구조인 것이다.

여기에 HBM 공급 집중에 따른 LPDDR 공급 타이트닝, LPDDR의 서버 침투, 그리고 LPDDR6라는 차세대 규격의 개화까지 겹치면, 삼성전자와 SK하이닉스의 모바일 DRAM 사업부는 단순 스마트폰 교체 수요가 아닌, AI 시대의 구조적 성장 수혜를 받는다. 글로벌 LPDDR DRAM 시장 규모는 2035년까지 150억 달러를 목표로 연평균 6.8% 성장이 전망된다. NPU 주가가 이미 선행 반영됐다면, 다음 저평가 자산은 모바일 메모리 밸류체인일 수 있다.

반론과 재반론: 온디바이스 AI 투자의 함정

⚠ 비판 — 성능 한계

온디바이스 AI는 파라미터 수와 모델 복잡도 면에서 클라우드 AI에 근본적으로 열등하다. 70B 이상의 대형 모델은 스마트폰에서 실행 불가능하며, 사용자 경험의 천장이 낮다.

✔ 재반론 — 하이브리드 아키텍처

실제 배포 모델은 이미 하이브리드 구조로 진화 중이다. 개인정보 관련 경량 작업은 온디바이스로, 복잡한 추론은 클라우드로 분산하는 방식이 표준이 되고 있다. 성능의 천장이 아닌 비용의 최적화가 핵심이다.

⚠ 비판 — 교체 주기 불확실성

NPU 성능이 아무리 개선돼도 소비자가 매년 스마트폰을 교체하지 않는다면 수혜는 제한적이다. 글로벌 스마트폰 교체 주기는 이미 3~4년으로 늘어났다.

✔ 재반론 — AI가 교체 주기를 당긴다

IDC는 AI 기능이 스마트폰 업그레이드 주기를 촉진하는 새로운 변수로 작동한다고 분석한다. 실제로 AI 기능을 경험한 사용자는 기존 기기와의 체감 격차가 커 교체 유인이 높아진다. 생성형 AI폰 출하량은 2025년 전년 대비 73.1% 증가가 전망된다.

⚠ 비판 — 배터리·발열 제약

고성능 NPU가 탑재돼도 지속적인 AI 연산은 배터리를 급격히 소모하고 기기 온도를 높인다. 소비자가 실제로 일상에서 AI 기능을 상시 사용하기엔 제약이 크다.

✔ 재반론 — NPU의 전력 효율 혁신

NPU는 CPU·GPU 대비 동일 연산을 수행할 때 전력 소비가 극적으로 낮다. 인텔의 NPU 탑재 칩은 동일 작업 대비 배터리를 38% 더 오래 유지하는 성과를 입증했다. AI 연산의 발열 문제는 이기종 컴퓨팅 구조가 해결해나가고 있다.


온디바이스 AI 반도체 투자를 위한 5단계 로드맵

  1. 1

    NPU 세대별 사양 기반 ‘성능 갭’ 모니터링

    투자 판단의 출발점은 현세대 대비 차세대 NPU의 TOPS 향상률이다. 스냅드래곤 서밋(10월), 애플 이벤트(9월), ARM 테크 데이(11월) 등 연간 발표 일정에 맞춰 분기별 포지션을 점검하라. NPU 성능 향상률이 전년 대비 30% 이상인 해는 교체 수요 급증 사이클의 전조다.

  2. 2

    LPDDR 가격 지수 및 공급 타이트닝 지표 추적

    DRAMeXchange와 트렌드포스의 LPDDR5X 계약 가격 변동을 월별로 모니터링하라. HBM 생산 비중이 상승하는 분기는 LPDDR 공급 타이트닝이 동반되는 경향이 있다. 삼성전자·SK하이닉스의 모바일 DRAM 사업부 가이던스도 연동해서 분석해야 한다.

  3. 3

    ARM 주가와 로열티 증가율의 괴리 분석

    ARM 홀딩스 주가는 AI 테마와 함께 급등했으나, 실제 로열티 수익 성장률(전년 대비)을 분기마다 대조하라. 주가가 이익 성장률 대비 과도하게 선행할 경우 밸류에이션 부담이 생긴다. ARM의 공정 가치를 독립적으로 산정하는 18가지 이상의 추정 방법이 존재하며, 현재 시장 컨센서스와의 괴리를 정기 점검하는 것이 필수다.

  4. 4

    국내 AI 경량화·소부장 밸류체인 편입 검토

    온디바이스 AI의 확산은 모델 경량화(On-Device Optimization) 기술 수요를 동반한다. 삼성·엔비디아·퀄컴과 기술 협력 관계를 구축한 국내 AI 경량화 플랫폼 기업들(노타 등)과, 엑시노스·스냅드래곤 공급망에 편입된 PCB·반도체 후공정 기업들의 수주 파이프라인을 분기별로 점검하라. 가온칩스, 칩스앤미디어, 오픈엣지테크놀로지 등이 주목할 만한 소부장 밸류체인이다.

  5. 5

    포트폴리오 내 온디바이스 vs 데이터센터 AI 비중 균형 설정

    데이터센터 AI(엔비디아·TSMC 중심)와 온디바이스 AI(퀄컴·ARM·모바일 DRAM)는 사이클 타이밍이 다르다. 전자는 2023~2025년에 급격한 주가 상승이 선행했다. 온디바이스 AI는 2026~2028년이 실제 수익 실현 구간으로 예상된다. 리밸런싱 관점에서 온디바이스 비중을 현재보다 10~15%p 높이는 전략을 검토할 시점이다.

결론

GPU가 데이터센터에서 권력을 쌓는 동안, NPU는 이미 수억 명의 손 안으로 침투했다. 다음 AI 반도체 수익의 원천은 엔비디아의 서버룸이 아니라, 퀄컴의 스냅드래곤과 삼성의 LPDDR이 결합된 엣지 생태계에서 구조적으로 창출될 것이다.

당신의 포트폴리오는 아직 클라우드만 바라보고 있지 않은가?

자주 묻는 질문

온디바이스 AI가 진짜로 클라우드 AI를 대체할 수 있나요?

대체가 아닌 분업이 현실적 전망이다. 2026년 현재 온디바이스 AI는 개인정보 처리, 실시간 번역·사진 편집, 음성 인식 같은 경량 추론 작업을 독립적으로 수행하는 반면, 복잡한 추론이나 대규모 생성형 AI 작업은 여전히 클라우드에 의존한다. 하이브리드 아키텍처가 표준이 되는 방향으로 진화 중이며, 온디바이스의 역할 비중은 NPU 세대가 거듭될수록 지속적으로 확대된다.

ARM 홀딩스에 지금 투자해도 늦지 않았나요?

밸류에이션 부담이 실재하지만, 구조적 성장 스토리는 여전히 유효하다. ARM의 낙관적 시나리오(2028년 매출 86억 달러)와 보수적 시나리오 모두 AI 중심 로열티 수익의 지속 성장을 전제한다. 다만 현재 주가는 중간 컨센서스(74억 달러)를 이미 일정 부분 반영하고 있다. 분할 매수와 분기별 로열티 성장률 확인을 병행하는 접근이 바람직하다.

한국 개인 투자자가 온디바이스 AI에 투자할 수 있는 현실적인 방법은 무엇인가요?

국내에서 가장 직접적인 접근법은 세 갈래다. 첫째, 삼성전자와 SK하이닉스를 통한 모바일 DRAM(LPDDR) 수혜 투자. 둘째, 국내 AI 경량화 및 반도체 설계 검증(EDA) 관련 소부장 기업 편입. 셋째, 미국 상장 주식을 통한 퀄컴(QCOM)·ARM(ARM) 직접 투자다. 이 세 축을 병행하면 온디바이스 AI 밸류체인 전체에 분산 노출이 가능하다. 단, 개별 종목 투자 전 최신 실적과 밸류에이션을 반드시 독립적으로 검증해야 한다.

투자 유의사항 — 이 콘텐츠는 정보 제공 목적으로만 작성되었으며, 특정 종목의 매수·매도를 권유하지 않습니다. 모든 투자 결정은 본인의 판단과 책임하에 이루어져야 하며, 투자 원금 손실 가능성이 있습니다. 시장 상황 및 규제 변화에 따라 본문의 수치와 전망이 달라질 수 있습니다. © 2026 The Axis · 머니 인사이트

댓글 남기기