네이버클라우드 로고와 옴니모달 AI 기술을 시각화한 다중 입력 처리 이미지

출처 : SONOW

과기정통부 AI 파운데이션 모델 개발 사업 최종 선정

네이버클라우드(대표 김유원)가 과학기술정보통신부 주관 '독자 인공지능(AI) 파운데이션 모델 개발' 프로젝트의 최종 5개 컨소시엄 중 하나로 선정됐다고 14일 밝혔다. 이번 컨소시엄에는 네이버, 트웰브랩스, KAIST, 서울대학교, 포항공과대학교, 고려대학교, 한양대학교가 참여하여 산학연 협력 체계를 구축했다.

이번 선정은 국가 차원의 AI 주권 확보라는 정책적 목표와 맞닿아 있다. 정부는 ChatGPT와 같은 해외 AI 모델에 대한 의존도를 줄이고 독자적인 AI 기술 역량을 확보하기 위해 이 사업을 추진하고 있다. 네이버클라우드의 선정은 기존에 축적된 AI 기술력과 클라우드 인프라 운영 경험이 인정받은 결과로 해석된다.

특히 이번 컨소시엄 구성에서 주목할 점은 산업계와 학계의 균형 잡힌 협력이다. 네이버와 트웰브랩스가 실용적 기술 개발을 담당하고, 주요 대학들이 원천 기술 연구를 맡는 구조로 이론과 실무의 시너지 효과를 기대할 수 있다.

성낙호 네이버클라우드 하이퍼스케일AI 기술총괄은

"현재 AI는 사용자가 '좋은 질문'을 해야 원하는 답을 얻는 구조"
라며 "옴니모달 AI를 통해 누구나 직관적으로 AI를 활용할 수 있도록 하겠다"고 밝혔다. 이는 기존 AI의 한계를 극복하고 사용자 경험을 혁신적으로 개선하겠다는 의지를 보여준다.

다중모달 입력 통합 이해하는 옴니모달 AI 기술

옴니모달 AI는 텍스트뿐 아니라 표정, 말투, 이미지, 영상, 음성 등 다양한 형태의 입력을 통합적으로 이해하는 기술을 뜻한다. 기존의 AI가 주로 텍스트 기반으로 작동했다면, 옴니모달 AI는 인간이 소통하는 모든 방식을 이해하고 처리할 수 있다는 점에서 혁신적이다.

이 기술의 핵심은 사용자가 구체적인 질문이나 지시를 하지 않아도 의도를 파악해 필요한 작업을 수행할 수 있다는 것이다. 예를 들어 사용자가 단순히 "여행 가고 싶다"라고 말하면서 특정 장소 사진을 보여주기만 해도, AI가 그 맥락을 종합적으로 이해하여 여행 계획을 세워주는 것이 가능해진다.

네이버클라우드는 이를 실시간으로 처리해, 여러 AI 에이전트를 적재적소에 호출·연결해 결과물을 제공하는 구조를 구현할 계획이다. 이는 단순히 하나의 거대한 AI 모델을 만드는 것이 아니라, 각각의 전문 분야에 특화된 AI들을 유기적으로 연결하는 오케스트레이션 기술이 핵심이다.

기술적으로는 멀티모달 퓨전(Multimodal Fusion) 기술이 핵심이 된다. 서로 다른 형태의 데이터를 하나의 의미 공간에서 이해하고 처리하는 것으로, 텍스트의 의미와 이미지의 시각적 정보, 음성의 감정적 뉘앙스 등을 종합적으로 분석하는 고도의 기술이 필요하다.

역할 분담을 통한 효율적 개발 체계 구축

이번 프로젝트에서는 참여 기관별로 명확한 역할 분담이 이뤄진다. 네이버는 모델과 플랫폼 개발을 담당하며, 기존의 하이퍼클로바X 등에서 축적된 대규모 언어모델 기술을 바탕으로 옴니모달 기능을 확장한다.

트웰브랩스는 영상 데이터 등 고품질 학습 데이터 구축을 맡는다. AI 모델의 성능은 학습 데이터의 품질에 크게 좌우되는데, 특히 다중모달 AI의 경우 다양한 형태의 고품질 데이터가 대량으로 필요하다. 트웰브랩스의 데이터 처리 전문성이 이 부분을 뒷받침한다.

산학 협력단은 원천 기술 연구와 인재 양성에 나선다. KAIST, 서울대, 포항공대, 고려대, 한양대 등 주요 대학들이 참여하여 기초 연구부터 응용 기술까지 폭넓은 연구를 수행한다. 또한 AI 전문 인력 양성을 통해 장기적인 기술 경쟁력 확보에도 기여할 예정이다.

AI 에이전트 마켓플레이스와 서비스 혁신 계획

네이버클라우드는 이 기술을 자사 주요 서비스 전반에 적용해 서비스 자체를 'AI 에이전트를 위한 사용자 인터페이스'로 발전시킬 계획이다. 이는 기존의 앱이나 웹사이트 중심의 서비스 구조를 AI 중심으로 재편하겠다는 의미다.

구체적인 활용 예시로는 여행 계획 요청 시, 항공 예약·맛집 추천·일정 관리 에이전트를 동시에 연결해 완성된 제안을 제공하는 것이 있다. 사용자는 단순히 "부산 여행을 가고 싶다"라고 말하기만 하면, AI가 자동으로 관련된 모든 서비스를 조합해서 완전한 여행 계획을 제시할 수 있게 된다.

또한 의료·제조 등 분야별 특화 AI 에이전트를 안전하게 개발·유통할 수 있는 개방형 '마켓플레이스'도 구축한다. 이는 각 분야의 전문가들이 자신만의 AI 에이전트를 개발해서 다른 사용자들과 공유할 수 있는 플랫폼이다.

마켓플레이스의 핵심은 다양한 전문 AI 에이전트가 독립성을 유지하면서도 필요한 경우 안전하게 연동될 수 있도록 지원하는 것이다. 예를 들어 의료 AI 에이전트는 환자 정보 보안을 유지하면서도, 필요시 약국 AI나 보험 AI와 연결되어 통합적인 의료 서비스를 제공할 수 있게 된다.

이러한 접근법은 AI 생태계의 민주화를 의미한다. 대형 기술 기업만이 AI를 개발할 수 있는 것이 아니라, 각 분야의 전문가들이 자신의 도메인 지식을 AI로 구현하고 이를 다른 사람들과 공유할 수 있는 환경을 만드는 것이다.

2027년까지 '국가주권형 AI' 완성 목표

네이버클라우드는 올해 연말 1차 중간 평가에서 옴니모달 아키텍처와 실시간 처리 기술의 차별성을 구체적인 데모로 입증할 계획이다. 이는 이론적 연구에 그치지 않고 실제 작동하는 프로토타입을 통해 기술의 실현 가능성을 보여주겠다는 의미다.

장기적으로는 2027년까지 기술을 단계적으로 고도화해 산업 전반에서 활용 가능한 '국가주권형 AI(소버린 AI)' 완성을 목표로 하고 있다. 소버린 AI는 특정 국가나 지역의 언어, 문화, 법규, 가치관 등을 반영한 AI를 의미한다.

이는 단순히 한국어를 잘 이해하는 AI를 만드는 것을 넘어서, 한국의 문화적 맥락과 사회적 가치를 이해하고 반영할 수 있는 AI를 구현하겠다는 목표다. 예를 들어 한국의 정서나 예의, 사회적 관계 등을 고려한 응답을 제공할 수 있어야 한다.

또한 국가 차원의 데이터 주권 확보도 중요한 목표다. 해외 AI 서비스에 의존할 경우 국내 데이터가 해외로 유출될 위험이 있지만, 독자적인 AI 시스템을 구축하면 민감한 데이터를 국내에서 안전하게 처리할 수 있게 된다.

업계에서는 이번 프로젝트가 한국 AI 산업의 글로벌 경쟁력 확보에 중요한 전환점이 될 것으로 평가하고 있다. 특히 옴니모달 AI는 아직 글로벌적으로도 초기 단계인 기술인 만큼, 선제적 개발을 통해 기술 주도권을 확보할 수 있는 기회로 보고 있다.

AI 전문가들은 "네이버클라우드의 이번 도전이 성공한다면 한국이 AI 강국으로 도약하는 데 큰 기여를 할 것"이라며 "특히 실시간 다중모달 처리 기술은 차세대 AI의 핵심이 될 것"이라고 전망했다.