OpenAI: 12일간의 특별 이벤트 마지막 날, o3와 o3-mini 공개

OpenAI가 진행한 12일간의 특별 업데이트 이벤트가 대단원의 막을 내렸습니다. 마지막 날 공개된 것은 바로 차세대 추론 모델인 o3와 o3-mini였는데요, 이는 상당히 의미 있는 발표였습니다.

최근 인공지능 시장의 주도권을 놓고 구글과 OpenAI가 치열한 경쟁을 벌이고 있습니다. OpenAI가 ChatGPT의 검색 기능을 무료화한 날, 구글은 OpenAI의 'Sora'와 경쟁하는 동영상 생성 AI 'Veo2'를 공개했죠. 또한 구글은 에이전트 기능이 강화된 'Gemini 2.0'을 발표하며 OpenAI를 견제했습니다.

이런 경쟁 구도는 이번이 처음이 아닙니다. 지난 5월 구글 I/O 행사 직전, OpenAI는 새로운 모델 '4o'와 'Advanced Voice Mode'를 전격 공개하며 구글 I/O에 쏠린 관심을 분산시킨 바 있습니다. 이러한 양사의 눈치게임은 이번 연말에도 계속되었는데요.

그런데 마지막 날 발표된 o3와 o3-mini는 이런 경쟁 구도를 뛰어넘는 놀라운 성능을 보여주었습니다. 특히 수학, 코딩, 추론 능력에서 기존 모델들을 크게 앞서는 결과를 보여주었는데요, 자세한 내용을 살펴보겠습니다.

왜 o2가 아닌 o3일까?

이번에 발표된 새로운 추론 모델의 이름이 특히 흥미롭습니다. 논리적으로 o1 다음은 o2가 되어야 할 것 같은데, OpenAI는 이를 o3로 명명했는데요.

Sam Altman은 이에 대해 재미있는 설명을 했습니다. "텔레포니카의 친구들을 존중하는 마음과 함께, OpenAI가 이름 짓기에 정말 서툴다는 전통을 이어가며 o3라고 부르기로 했다"라고 말했죠. 이는 스페인의 통신회사 텔레포니카가 이미 'O2'라는 브랜드를 보유하고 있기 때문입니다.

이런 위트 있는 작명 비하인드 스토리는 OpenAI의 겸손한 태도와 함께, 기업 간의 상표권을 존중하는 모습을 보여주는 좋은 사례가 되었네요.

o3와 o3-mini의 놀라운 성능

특히 주목할 만한 점은 ARC AGI 벤치마크에서의 성과입니다. 이 벤치마크는 2019년에 만들어진 AI 지능 측정 도구로, 5년간 깨지지 않던 기록을 o3가 마침내 경신했는데요. ARC AGI의 독특한 점은 매번 완전히 새로운 유형의 문제를 제시한다는 것입니다. 예를 들어, "빈 공간에 파란색 사각형 채우기"처럼 간단해 보이는 문제부터 "노란색 사각형 내의 색칠된 사각형 수를 세어 테두리로 표현하기"와 같은 복잡한 문제까지 다양합니다. 이러한 문제들은 인간에게는 직관적으로 해결할 수 있지만, AI에게는 매우 어려운 과제였습니다. 단순히 이전에 학습한 패턴을 반복하는 것이 아니라, 새로운 규칙을 즉석에서 이해하고 적용해야 하기 때문이죠. o3는 이 벤치마크에서 87.5%라는 놀라운 성능을 보여주며, 인간 수준(85%)을 뛰어넘었습니다.

먼저 o3의 핵심적인 성능 지표를 살펴보면:

SweetBench Verified: 71.7% 정확도 (o1 대비 20% 이상 향상)
CodeForces ELO: 2727 (경쟁 프로그래밍 전문가 수준)
AMI 수학 점수: 96.7% (o1의 83.3% 대비 큰 폭 상승)
PhD 수준 과학 문제 GPQA: 87.7% (전문 PhD 평균 70% 대비 월등)

특히 주목할 만한 점은 ARC AGI 벤치마크에서의 성과입니다. 5년 동안 깨지지 않던 기록을 경신하며 87.5%라는 놀라운 점수를 기록했는데요, 이는 인간 수준의 성능(85%)을 뛰어넘는 결과입니다.

o3-mini: 효율성의 새로운 기준

o3-mini는 비용 효율적인 추론의 새로운 지평을 열었습니다. 특히 주목할 만한 특징은:

3단계 추론 강도 조절 (Low/Medium/High)
o1 대비 동등하거나 더 나은 성능
대폭 감소된 지연 시간 (1초 미만의 응답 속도)
모든 API 기능 지원 (함수 호출, 구조화된 출력 등)

안전성에 대한 새로운 접근

이번 발표에서는 'Deliberative Alignment'라는 새로운 안전성 검증 기술도 함께 공개되었습니다. 이는 단순한 예시 기반의 안전성 검증을 넘어, 모델이 스스로 추론하며 안전성을 판단하는 혁신적인 접근방식입니다.

출시 계획

현재 o3와 o3-mini는 안전성 테스트 단계에 있으며, 연구자들의 검증을 거친 후 단계적으로 출시될 예정입니다:

o3-mini: 2024년 1월 말 출시 예정
o3: o3-mini 출시 직후 공개 예정
안전성 테스트 참여 신청: 2024년 1월 10일까지 가능

이번 12일간의 OpenAI 특별 이벤트는 단순한 신기능 공개를 넘어, AI 기술의 새로운 지평을 보여주었습니다. 특히 마지막 날 공개된 o3와 o3-mini는 구글과의 경쟁 구도를 뛰어넘어, AI 기술의 미래가 어떤 방향으로 발전할 수 있는지를 보여준 의미 있는 발표였다고 평가할 수 있겠네요.

저작자표시

'Insights > IT Trends' 카테고리의 다른 글

구글의 AI 혁신: Gemini 2.0부터 Veo2까지 (0)	2024.12.28
OpenAI: 12일간의 업데이트 총정리 (1)	2024.12.22
OpenAI, Santa Mode와 영상 통화가 가능한 Advanced Voice 공개 (0)	2024.12.14
OpenAI: 강력한 추론 엔진 o1 출시 (0)	2024.12.06
Anthropic의 프롬프트 엔지니어링 도구: Prompt Improver 출시 (0)	2024.11.17

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

OpenAI: 12일간의 특별 이벤트 마지막 날, o3와 o3-mini 공개

왜 o2가 아닌 o3일까?

o3와 o3-mini의 놀라운 성능

o3-mini: 효율성의 새로운 기준

안전성에 대한 새로운 접근

출시 계획

'Insights > IT Trends' 카테고리의 다른 글

댓글

이 글 공유하기

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

왜 o2가 아닌 o3일까?

o3와 o3-mini의 놀라운 성능

o3-mini: 효율성의 새로운 기준

안전성에 대한 새로운 접근

출시 계획

'Insights > IT Trends' 카테고리의 다른 글

댓글

이 글 공유하기

다른 글

구글의 AI 혁신: Gemini 2.0부터 Veo2까지

OpenAI: 12일간의 업데이트 총정리

OpenAI, Santa Mode와 영상 통화가 가능한 Advanced Voice 공개

OpenAI: 강력한 추론 엔진 o1 출시

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역