바이두, GPT-5 능가 주장하는 신작 AI 모델 공개
중국 기술 대기업 바이두가 11월 11일 ERNIE-4.5-VL-28B-A3B-Thinking 모델을 공개했다. 이 오픈소스 멀티모달 AI 모델은 OpenAI의 GPT-5와 구글의 Gemini 2.5 Pro를 여러 벤치마크에서 능가한다고 바이두는 주장했다. 특히 문서 및 차트 이해 분야의 VQA, MMBench, SEED-Bench 평가에서 우수한 성능을 보였다고 발표했다. 이번 출시는 중국과 서구 기술 기업 간 격화되는 인공지능 경쟁에서 중요한 전환점을 의미한다. Apache 2.0 라이선스로 공개되어 누구나 자유롭게 사용할 수 있다.
혁신적 아키텍처로 효율성과 성능 동시 달성
ERNIE-4.5-VL은 280억 개 파라미터를 가진 전문가 혼합(Mixture-of-Experts) 아키텍처를 채택했지만, 추론 시에는 30억 개만 활성화하여 계산 비용을 획기적으로 줄였다. 이를 통해 비슷한 수준의 전체 매개변수 모델보다 2~3배 빠른 추론 속도를 제공하면서도 메모리 사용량을 크게 절약한다. 특히 '이미지를 통한 사고(Thinking with Images)' 기능을 도입해 이미지의 특정 영역을 확대하고 분석하여 종합적인 답변을 생성할 수 있다. 바이두 연구진은 동적 난이도 샘플링을 적용한 GSPO 및 IcePop 등 고급 강화 학습 전략을 활용해 이 모델을 훈련했다.
중국 오픈소스 AI 전략, 글로벌 시장 판도 변화 주도
이번 출시는 중국이 미국 기업들과 경쟁하기 위해 오픈소스 AI 전략을 강화하는 가운데 이루어졌다. 최근 분석에 따르면 중국은 오픈소스 AI 다운로드에서 미국을 앞질렀으며, DeepSeek, Alibaba, Baidu 같은 기업들이 서구 경쟁사들보다 더 빠르고 저렴하게 고성능 모델을 생산할 수 있음을 입증하고 있다. 남가주대학교의 Sean Ren 교수는 CNBC에 '주요 연구소가 강력한 모델을 오픈소스로 공개할 때마다 업계 전체의 기준이 높아진다'고 평가했다. 이러한 움직임은 독점 API와 프리미엄 가격에 의존하는 OpenAI와 Anthropic 같은 비공개 소스 제공업체들에 상당한 압박을 가하고 있다.
바이두 월드 2025 컨퍼런스, AI 패권 경쟁 본격화
바이두는 11월 13일 베이징에서 열리는 Baidu World 2025 컨퍼런스에서 ERNIE 라인업과 추가 AI 발전 사항을 선보일 예정이다. 이는 중국의 경쟁적인 AI 환경에서 선두주자로서의 입지를 굳히기 위한 전략적 움직임으로 해석된다. ERNIE-4.5-VL은 시각적 추론, STEM 문제 해결, 시각적 그라운딩, 도구 활용, 비디오 이해 등 다양한 분야에서 뛰어난 성능을 발휘한다고 바이두는 강조했다. 글로벌 AI 시장에서 중국 기업들의 기술적 역량이 서구 기업들과 대등하거나 이를 능가할 수 있다는 신호로 받아들여지고 있다. 향후 AI 패권 경쟁은 더욱 치열해질 것으로 전망된다.