
출처 : SONOW
Wan 2.2 오픈소스 공개, 영상 AI 시장 판도 변화
알리바바가 2025년 7월 28일 공개한 Wan 2.2는 동영상 생성 AI 분야에서 획기적인 전환점을 제시하고 있다. 이전 버전인 Wan 2.1을 기반으로 대폭 업그레이드된 이 모델은 270억 개의 매개변수(활성 매개변수 140억 개)를 가진 Text-to-Video 모델을 중심으로, 다양한 크기의 모델 제품군을 완성했다.
특히 주목할 점은 완전한 오픈소스 공개를 통해 개발자와 크리에이터들이 자유롭게 접근할 수 있게 했다는 것이다. Image-to-Video 모델은 140억 개와 270억 개 매개변수의 두 가지 버전으로 제공되며, 50억 개 매개변수의 경량화 모델은 상대적으로 낮은 사양의 하드웨어에서도 720p 고화질 영상 생성이 가능하다.
현재 동영상 생성 AI 시장은 OpenAI의 Sora, Google의 Veo, Meta의 Movie Gen 등 주요 플레이어들이 경쟁하고 있는 가운데, 알리바바의 완전 오픈소스 전략은 시장 생태계에 상당한 변화를 가져올 것으로 예상된다.
혁신적 기술 아키텍처와 성능 향상
Wan 2.2의 핵심 기술력은 MoE(Mixture of Experts) 아키텍처에 있다. 이 시스템은 영상 생성 과정을 '고잡음(전체 구조)'과 '저잡음(세부 묘사)' 단계로 분리하여, 각 단계에 최적화된 전문가 모델을 활성화한다. 이를 통해 연산 효율성과 생성 품질을 동시에 극대화했다.
학습 데이터 측면에서도 대폭적인 개선이 이루어졌다. 기존 대비 영상 데이터 83.2%, 이미지 데이터 65.6% 증가시켰으며, 특히 영화적 미학 태그를 추가 학습하여 모델의 일반화 능력을 크게 향상시켰다. 이는 단순한 데이터 양적 확대를 넘어 질적 개선을 통한 성능 향상 전략이라 할 수 있다.
시네마틱 미학 제어 기능은 Wan 2.2의 차별화 요소 중 하나다. 조명(자연광/인공광, 소프트/하드 라이트), 시간대(낮/밤/황혼/일출), 구도(익스트림 클로즈업~와이드 샷), 렌즈 종류(표준/광각/망원/어안), 색조(웜톤/쿨톤, 고채도/저채도) 등 세분화된 영상 미학 요소들을 텍스트 프롬프트만으로 정밀하게 제어할 수 있다.
고품질 모션 구현 능력도 눈에 띈다. 브레이크 댄스, 농구 등 격렬한 스포츠 동작부터 분노, 슬픔, 놀람 등 미세한 얼굴 표정 변화까지 왜곡 없이 사실적으로 표현한다. 카메라 워크 측면에서는 기본적인 달리, 틸트부터 핸드헬드, 팔로우 샷, 오르빗 샷 등 고급 촬영 기술까지 지원한다.
실용적 활용성과 접근성 향상
Wan 2.2의 실용성을 높이는 요소는 ComfyUI와의 네이티브 연동 지원이다. 모델 출시와 동시에 ComfyUI에서 바로 사용할 수 있도록 최적화되어, 개발자들이 시각화된 워크플로우를 통해 쉽게 영상 생성 파이프라인을 구축할 수 있다. 최소 8GB VRAM의 상대적으로 낮은 하드웨어 사양에서도 구동 가능하여 접근성을 크게 개선했다.
UI/UX 측면에서도 상당한 개선이 이루어졌다. 기존 라이트 모드에서 다크 모드로 전환하여 크리에이터의 작업 집중도를 높였고, '완박스(WanBox)'라는 통합 대화창을 도입하여 텍스트/이미지 입력부터 영상 생성까지의 과정을 단순화했다. 새로 추가된 타임라인 편집기는 이미지 생성부터 영상 편집까지 모든 과정을 하나의 플랫폼에서 처리할 수 있게 해준다.
프롬프트 작성 방법론도 체계화되었다. '주체 + 장면 + 동작'의 기본 공식에 미학적 키워드를 추가하는 방식부터, 복잡한 다중 요소를 상세히 서술하는 고급 공식까지 제공하여 사용자의 창작 의도를 정확히 반영할 수 있도록 지원한다.
동영상 AI 생태계 변화와 향후 전망
Wan 2.2의 완전 오픈소스 공개는 동영상 생성 AI 시장에 상당한 파급효과를 가져올 것으로 분석된다. 기존에 폐쇄적 API 형태로만 제공되던 고품질 동영상 생성 기술이 누구나 접근 가능한 형태로 공개됨에 따라, 중소 스타트업과 개인 크리에이터들의 진입 장벽이 크게 낮아질 것으로 예상된다.
특히 ComfyUI와의 네이티브 연동은 이미 구축된 오픈소스 생태계와의 시너지를 통해 다양한 응용 솔루션 개발을 가속화할 것이다. 이는 결과적으로 동영상 제작 도구의 민주화를 이끌어 콘텐츠 산업 전반의 창작 환경을 변화시킬 가능성이 높다.
알리바바의 "Every Shot Wan Taken" 철학처럼, 창작자가 기술적 제약 없이 자신의 비전을 구현할 수 있는 환경이 조성되고 있다. 향후 다른 빅테크 기업들의 대응 전략과 오픈소스 생태계의 발전 방향이 업계 주목의 초점이 될 것으로 보인다.