출처: OpenAI
GPT-5, 하나의 통합 시스템으로 진화
OpenAI는 2025년 8월 GPT-5를 공식 발표하며 기존 GPT-4o와 o3 계열 모델을 전면 대체한다고 밝혔다. GPT-5는 '빠른 응답 모델', '깊은 사고 모델(GPT‑5 thinking)', '실시간 라우터'를 통합한 시스템으로, 질문의 복잡도와 사용자 의도에 따라 최적의 경로를 실시간 판단한다. 여기에 '미니 버전'까지 포함해 전 계층의 사용자를 고려한 설계가 특징이다.
코딩·작문·의료에서 비약적 도약
GPT-5는 특히 세 가지 핵심 영역에서 성능 향상을 이뤘다. 코딩에서는 복잡한 프런트엔드 설계, 다국어 리팩토링, 대규모 리포지토리 디버깅에서 최고의 정확도를 보이며 Aider Polyglot에서 88% 정확도를 기록했다. 작문 부문에서는 자유시, 보고서, 이메일 등 다양한 글쓰기에서 문체 적응성과 표현력이 개선되었고, 의료 영역에서는 HealthBench Hard 기준 46.2%를 기록해 현실적 시나리오 대응력이 비약적으로 향상됐다.
“GPT-5는 의학적 의사결정과 질문 설계, 맥락 대응까지 가능한 진짜 ‘헬스 파트너’로 진화했다.” — OpenAI
멀티모달·AGI에 한발 더 가까이
GPT-5는 이미지, 동영상, 도표 등 비정형 데이터 해석 능력도 강화됐다. MMMU Pro(대학원 수준 시각 문제)에서 78.4%, CharXiv-Reasoning(과학 시각 추론)에서 81.1%의 정확도를 보이며 '읽고 이해하는 AI'에 근접했다. 또한 GPQA, FrontierMath, SWE-bench 등에서 모두 OpenAI o3, GPT-4o를 능가하는 성능을 기록해 AGI로의 실질적 전진을 증명했다.
GPT-5 pro는 병렬 연산 기반 ‘생각의 시간’을 확장해, GPQA에서 88.4%라는 최고 정확도를 달성하며 전문가 평가에서도 기존 모델 대비 22% 오류율을 줄였다.
사고력과 안전성을 동시에 설계한 GPT-5
GPT-5는 단순한 응답 정확도만이 아니라 ‘거짓 응답(Deception)’과 ‘사실 오류(Hallucination)’를 획기적으로 줄였다. GPT-5 thinking 기준으로 hallucination 비율은 기존 GPT-4o 대비 80% 감소했고, multimodal 오류 응답률은 9% 수준으로 낮아졌다.
또한, 거절 훈련 대신 ‘Safe Completion’ 방식이 적용돼 민감한 질문에도 부분적 정보 제공, 설명, 대안 제시 등 보다 인간적인 응답 설계를 구현했다. 특히 바이오·화학 분야에서는 사전 위험 분석을 통한 대응 체계와 항상 작동하는 감지 시스템이 구축돼 있다.
사용자와 기업을 위한 GPT-5의 접근 방식
GPT-5는 지금 ChatGPT의 기본 모델로 설정돼 있으며, 무료 사용자는 소량 사용 후 GPT‑5 mini로 전환되고, Plus 및 Pro 사용자는 더 넓은 사용량과 GPT-5 pro에 접근할 수 있다. Team 및 Enterprise 이용자에게는 대규모 처리량과 CLI 기반 코딩 접근도 지원된다. GPT-5의 사고 모델은 '생각해줘' 등의 명령어로 직접 호출 가능하다.
OpenAI는 향후 GPT-5의 다양한 인격(Personality) 기능을 확대해 사용자의 스타일에 맞는 응답을 제공하고, 맞춤형 생산성 도구로 발전시켜 나갈 예정이다.