최근 AI PC 성능 경쟁이 단순히 칩 개별 사양을 넘어 GPU, NPU 등 시스템 전체를 아우르는 하드웨어 효율화로 이동하는 가운데, 국내 스타트업이 의미 있는 기술적 돌파구를 마련했다는 평가다.
|
이기종 컴퓨팅은 서로 다른 특성을 가진 프로세서를 유기적으로 결합해 연산 효율을 극대화하는 방식이다. 하나의 프로세서에 전적으로 의존하는 대신, CPU·GPU·NPU가 각자 가장 잘 지연 없이 처리할 수 있는 역할을 나눠 맡도록 설계하는 것이 골자다.
성능 평가 결과는 압도적이다. 노타의 분리형 추론 방식을 적용했을 때, 단일 GPU 실행 방식 대비 토큰당 에너지 소비는 약 32% 줄었고, 생성 처리량(Throughput)은 약 12% 향상됐다. 초기 구동 속도를 좌우하는 첫 응답 지연 시간 역시 단일 NPU 실행 방식과 비교해 약 89% 단축됐다.
빅테크 분리형 추론 도입 속도...온디바이스 AI 실행효율 높여갈 것
이번 성과는 단순한 하드웨어 병렬 연결이 아니라, AI 모델의 작업 특성을 세부적으로 분석해 최적의 포지셔닝을 찾아냈다는 점에서 주목받는다. 한정된 전력과 자원 안에서 구동해야 하는 ‘온디바이스(On-Device) AI’ 환경에서 사용자 경험(UX)을 결정짓는 핵심 키(Key)가 될 수 있기 때문이다.
노타는 이번 기술 구현을 통해 모델 경량화 단계를 넘어, 하드웨어 활용을 극대화하는 ‘풀스택 최적화’ 역량을 입증하게 됐다.
채명수 노타 대표는 “AI PC 시대에는 AI 모델을 기기 안에 올리는 것만으로는 충분하지 않으며 GPU, NPU 등 다양한 연산 장치를 모델 특성에 맞게 조합하는 최적화 역량이 실제 AI 경험을 좌우한다”며, “노타는 모델 경량화, 런타임 최적화, 하드웨어 최적화 기술을 결합해 AI PC 시대의 온디바이스 AI 실행 효율을 높여 나가겠다”고 말했다.





![[포토]신라호텔 영빈관에서 열린 코리아 AI 에코시스템 리셉션](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060801370t.jpg)
![[포토]손 잡은 엔비디아-네이버](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060801048t.jpg)
![[포토]코스피 지수 7484.41 마감](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800947t.jpg)
![[포토] 서울대 방문하는 젠슨 황](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800706t.jpg)
![[포토]'수도권 레미콘' 멈췄다](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800636t.jpg)
![[포토]질의 경청하는 젠슨 황](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800371t.jpg)
![[포토]한성숙 총리 후보자 "AI 대전환과 ‘모두의 성장’ 이끌겠다"](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800370t.jpg)
![[포토]'모두발언하는 장동혁 대표'](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060800352t.jpg)
![[포토]젠슨 황-최태원, '깐부치킨에서 러브샷'](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060701043t.jpg)
![[포토] 문동현, 만 20세 2개월 2일로 최연소 우승 기록](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/06/PS26060700896t.jpg)


