리처드 서튼 교수와 강화학습 알고리즘 개념도

출처 : SONOW

"부적절한 학습 알고리즘이 초지능 개발의 가장 큰 병목 현상" 핵심 문제 제기

강화학습 분야의 대가인 리처드 서튼(Richard Sutton)이 초지능 에이전트 개발과 관련하여 현재 AI 연구의 근본적 한계를 지적했다. 서튼은 "가장 큰 병목 현상은 우리가 부적절한 학습 알고리즘을 가지고 있다는 것"이라고 말하며, 현재의 접근 방식에 대한 비판적 시각을 제시했다.

그는 초지능과 인간 지능을 증강하는 기술이 세상을 이롭게 할 것이라고 믿으며, AI 발전을 경주가 아닌 마라톤에 비유했다. 이러한 관점은 급속한 기술 발전 경쟁보다는 지속가능하고 근본적인 연구 접근의 중요성을 강조하는 것으로 해석된다.

"강화학습을 통해서만 완성된 초지능 달성 가능" LLM 한계 명확히 선 그어

서튼은 인공지능이 완성된 형태의 초지능으로 가는 길은 "강화학습을 통해 이루어진다"고 주장하며, 대형 언어 모델(LLM)과 같은 비경험적인 경로로는 한계가 있다고 선을 그었다. 이는 현재 ChatGPT나 GPT-4와 같은 대화형 AI의 급속한 발전에도 불구하고, 진정한 지능의 구현에는 다른 접근이 필요하다는 의견을 나타낸다.

강화학습은 에이전트가 환경과 상호작용하며 시행착오를 통해 학습하는 방식으로, 인간의 학습 과정과 유사한 특성을 가진다. 서튼의 주장은 단순히 대량의 데이터를 학습하는 것이 아닌, 실제 경험을 통한 학습이 초지능 개발의 핵심이라는 것이다.

"현재 딥러닝 알고리즘은 매우 조잡한 수준" 더 나은 알고리즘 개발 필요성 강조

서튼은 우리가 딥러닝 알고리즘에 대해 많은 것을 안다고 생각하지만, 실제로는 "우리의 알고리즘이 매우 조잡하며" 더 나은 알고리즘 개발에 집중해야 한다고 강조했다. 이러한 지적은 현재 AI 기술의 화려한 성과에도 불구하고, 근본적인 알고리즘 차원에서는 아직 개선의 여지가 크다는 것을 의미한다.

현재의 딥러닝 기술이 특정 작업에서 인상적인 성능을 보이고 있지만, 진정한 지능의 구현을 위해서는 보다 정교하고 효율적인 학습 메커니즘이 필요하다는 것이 서튼의 핵심 메시지다. 이는 AI 연구 커뮤니티가 단기적 성과에 만족하지 말고 장기적 관점에서 알고리즘의 본질적 개선에 집중해야 한다는 경고로 받아들여진다.

AI 발전의 패러다임 전환 필요성과 장기적 연구 관점의 중요성

서튼의 발언은 현재 AI 업계가 대형 언어 모델의 성공에 도취되어 있는 상황에서, 보다 근본적인 접근 방식을 제시한다는 점에서 주목된다. 그의 "마라톤" 비유는 AI 발전이 단기간의 급속한 진전보다는 지속적이고 체계적인 연구를 통해 이루어져야 한다는 철학을 담고 있다.

강화학습을 통한 초지능 개발 접근법은 현재의 주류 AI 연구 방향과는 다른 패러다임을 제시하며, 이는 AI 연구 커뮤니티 내에서도 활발한 논의를 불러일으킬 것으로 예상된다. 서튼의 관점은 AI 기술의 미래 발전 방향에 대한 중요한 시사점을 제공하며, 보다 근본적이고 지속가능한 AI 연구의 필요성을 부각시킨다.