이번 주, 인공지능 업계에 놀라운 소식이 전해졌다. 인공지능이 국제수학올림피아드(IMO)에서 인간 참가자와 겨뤄 금메달에 해당하는 성과를 거뒀다. 세계 최고 수준의 고등학생들도 풀기 어려운 수학 문제 여섯 개 중 다섯 개를 인공지능이 정확히 풀어낸 것인데, 이를 해낸 주인공은 구글 딥마인드의 최신 AI 모델 제미나이 딥 싱크(Gemini Deep Think)와 오픈AI의 미공개 실험용 LLM이다. 두 모델 모두 사람처럼 대회에 참가해 금메달 커트라인 점수를 획득했는데, 이는 대회 참가자 상위 8% 정도에 해당하는 뛰어난 성적이었다.


사실 그런 의문이 들 수도 있다. 지금까지 인공지능이 다양한 벤치마크에서 좋은 성적을 거두었고, 2024년에도 구글 딥마인드의 인공지능이 IMO에서 은메달에 해당하는 성적을 받은 바 있다. 고작(?) 은메달에서 금메달로 업그레이드된 것뿐인데 이리 호들갑 떨 일일까?
이번 성과가 놀라운 점을 한번 정리해 보자.
사람과 동일한 조건에서 거둔 쾌거
인공지능 업계가 놀란 건 인공지능이 인간과 최대한 똑같은 조건에서 시험을 치렀다는 점이다. 영어로 된 문제지를 받고, 하루 4시간 30분 제한 시간 안에 손으로 풀듯 서술형 답안을 제출했다. 단순히 정답만 단답형으로 제출한 것이 아니라, 올림피아드에 참가한 학생처럼 풀이 과정을 논리적으로 작성했다.
여기서 또 하나 중요한 점. 계산기나 인터넷 검색 같은 도구는 일절 사용하지 않았다. 지난해만 해도 인공지능이 IMO 문제를 풀게 하기 위해 사람이 ‘문제를 인공지능 맞춤형으로 번역해 주는 도움(lean)’이 필요했다. 풀이에도 3일이 걸렸다.
즉, 올해 인공지능은 사람과 동일한 조건하에 평문의 문제를 바로 이해하고 즉석에서 풀어낸 것이다. 그것도 인공지능 모델 홀로 말이다. 한 마디로, 인공지능이 수학 경시대회에서 ‘인간처럼 생각하고 쓰는’ 경지에 도달했음을 보여준다.

IMO 문제는 단순히 공식을 대입해서 풀 수 있는 문제가 아니다. 새로운 발상과 창의적 사고가 필요한 도전적인 문제들이다. 그래서 많은 전문가들은 인공지능이 이런 문제를 풀기까지 오랜 시간이 걸릴 것이라 예상했다. 셀제로 유명 투자자이자 팔란티어를 이끌고 있는 피터 틸은 작년에 “AI가 수학 올림피아드 문제를 풀려면 최소 3년은 더 걸릴 것”이라 전망했다.
하지만 인공지능은 예상을 깨고 단기간에 이 벽을 넘어섰다. 구글과 오픈AI의 모델 모두 6문제 중 5문제를 정확히 풀어내며 35점을 획득했다. (마지막 6번 문제는 더욱 창의성이 요구되는 최고 난도 문제였고, 마치 짠 듯 두 모델은 이 문제에서 0점을 받았다) IMO 채점위원들은 이들 모델의 답안이 “명확하고 정밀하며 전개를 따라가기 쉬웠다”라고 평가했다. 마치 인간 수상자들의 답안처럼 논리적이고 이해하기 쉬웠다는 것이다.
또 놀라운 거 하나. (놀랄 게 이번엔 좀 많다) 인공지능이 자기 한계를 인지하는 모습을 보였다는 점이다. 오픈AI모델은 가장 어려운 6번 문제에서 완벽한 해결책을 찾지 못했다. 그런데 얻지 못한 해답을 억지로 꾸며내지 않고, 스스로 판단을 내렸다.
기존 AI 챗봇들이 모르는 문제에도 그럴듯한 답을 지어내곤 했던 것과 비교하면 상당한 진전이다. 잘못 아는 척하지 않고 모른다고 인정하는 인공지능의 등장은 향후 더 신뢰할 수 있는 인공지능으로 발전할 가능성을 보여준다.
두 거인의 미묘한 신경전
구글과 오픈AI 모두 금메달, 같은 점수를 기록했다. 하지만 내세우는 강점에는 조금 차이가 있다. 구글 딥마인드는 이번 성과가 공식 IMO 채점위원들의 검증을 거친 것임을 강조했다. 반면 오픈AI의 결과는 아직 자체 평가 단계였다. 이 때문에 구글 측은 오픈AI 결과가 “공식적으로 충분히 검증된 것이 아니다”라고 견제했다. 거기에 오픈AI가 결과를 미리 발표하면서, 공개 시점에 대한 논쟁도 상당했다.
오픈AI는 구글이 작년까지 인공지능에게 여러 가지 ‘추가 도움’을 줬던 점을 지적하며 맞받아쳤다. 구글은 2024년 시도에서 전문가가 문제를 일일이 번역해 주는 작업과 사흘 간의 연산 시간이 필요했는데, 오픈AI는 그런 도움 없이 우리는 해냈다고 이야기했다.
여기서 흥미로운 건 구글과 오픈AI가 전혀 다른 방식으로 문제에 접근했다는 점이다. 구글의 딥 싱크는 기존 제미나이가 쓰던 방식인 병렬추론 방식을 채택했다. 반면 오픈AI 모델은 완전 새로운 아이디어로 만든 실험적 모델이라고 알려졌다. 두 회사 모두 계산기나 외부 도구 없이 금메달 수준의 성과를 냈지만, 그 내부 작동 방식은 완전히 달랐던 것이다. 구글도 대단하고, 오픈AI도 대단하지만, 새로운 패러다임을 발견했을 가능성이 있는 오픈AI에 더 흥미가 가는 건 사실이다.
오픈AI의 한 연구원은 흥미로운 힌트를 흘렸다. IMO에서 금메달을 딴 새로운 학습 방법의 비결은, 기존의 지식과 추론만으로는 시간 내에 도저히 문제를 풀 수 없다는 것을 ‘미리’ 알 수 있는 능력에 있다는 것이다. 이게 어떻게 가능한 걸까? 아직 공개되지 않아 파악할 수는 없지만, 이 연구원은 심지어 이것을 ‘생명의 초기 징후(early signs of life)’라고까지 표현했다. 이 표현은 보통 어떤 것이 활성화되거나 깨어나기 시작하는 초기 단계를 비유적으로 나타낼 때 쓰인다. 마치 인공지능이 진정한 지능의 싹을 틔우기 시작했다는 의미로 들린다.

전문가들의 엇갈린 반응
이 사건에 대해 전문가들은 찬사와 우려를 함께 표하고 있다. 샘 알트먼 오픈AI CEO는 이번 성과가 인공일반지능(AGI)에 다가가는 중요한 진전이라고 강조했다. 특히 그는 이번에 금메달을 딴 모델이 특정 수학 문제 전용 프로그램이 아니라 범용 언어 모델이 수학적 사고를 해낸 것이라는 점을 부각했다.
AI 업계의 대표적 회의론자인 뉴욕대 게리 마커스 교수 역시 X(구 트위터)에서 오픈AI의 인공지능 모델이 다른 도구를 사용했는지를 물었으며, 별도의 번역 작업도 거치지 않았다는 사실을 확인한 후 “that’s impressive”라는 포스팅을 남겼다. 평소 인공지능의 한계를 날카롭게 지적하며 비판해 온 마커스 교수가 이번만큼은 인공지능의 성과를 인정한 것에 많은 이들이 놀라워했다. 누구는 항복 선언이라는 말까지 할 정도였다.
전 세계 수학 1황이라 평가받는 IMO 금메달리스트이자 UCLA 교수인 테렌스 타오 교수의 반응도 화제였다. 그는 인공지능 문제를 풀 때 투입되는 자원과 지원, 결과를 보고하는 방식에 따라 성능에 엄청난 차이가 생길 수 있다고 강조했다. 쉽게 말해, 인공지능이 어떤 환경과 도움을 받았느냐에 따라 금메달도 딸 수 있고 동메달도 못 딸 수 있다는 것이다. 이런 반응에 일부 사람들은 “마치 알파고가 바둑을 이겼을 때 ‘컴퓨터를 사용해서 이긴 거 아니냐’라고 비난하던 바둑계 인사들을 보는 것 같다”는 코멘트를 남기기도 했다.
IMO 금메달리스트 출신인 토론토대 다니엘 릿 교수는 “AI도구가 IMO 금메달을 딴 건 엄청난 일”이라 인정하면서도, 그렇다고 수학이 풀렸다는 뜻은 아니다라며 선을 그었다. 그는 리만 가설 증명을 인공지능이 당장 해내리라고 보는 건 섣부르다며, 최고 수준의 수학 연구에는 몇 달, 몇 년에 걸친 긴 호흡과 계획이 필요한데 이런 점들이 아직 인공지능에겐 큰 장애라고 지적했다.
우리에게 미칠 영향은?
이번 사건은 인공지능이 인간을 넘어선다는 막연한 이야기들이 구체적 현실로 다가오고 있음을 보여준다. 체스나 바둑에 이어, 이제 인간 두뇌의 마지막 보루로 여겨졌던 창의적인 수학 문제에서도 인공지능은 정상급 실력을 입증했다.
앞서 언급한 테렌스 타오는 최근 한 매체를 통해 “AI가 완전히 수학자를 대체하기는 어렵겠지만, 수학자의 연구를 활발히 도와줄 AI 동료가 등장할 것”이라고 전망했다. 구글 딥마인드 역시 인류 지식을 진보시키는데 기여할 인공지능 동료 시대의 도래를 예고했다.
물론 이러한 미래가 장밋빛으로만 보이는 것은 아니다. 인공지능이 수학 문제를 풀어주는 시대에 인간은 무엇을 해야 하는가라는 근본적인 질문이 제기된다. 교육 현장에서 올림피아드 문제를 푸는 훈련은 창의력과 논리력을 기르는 수단이었다. 이제 학생들이 인공지능과 어떻게 공존하며 배워야 할지 고민이 필요하다.
한편으로는 인공지능이 어려운 문제를 해결하는 과정을 통해 인간이 새로운 통찰을 얻을 수도 있다. 실제로 이번에 인공지능은 한 난제를 고등학교 수준의 기본 개념만으로 풀어냈다. 이는 대학 수준 개념을 쓴 인간 참가자들과 대조적이었다. 인공지능이 제시한 기발한 풀이법이 오히려 우리에게 영감을 주는 시대가 울지도 모른다.
이제 인공지능은 단순 계산 능력을 넘어, 창의적인 문제 해결과 자기 한계 인지라는 인간 지능의 영역으로까지 성큼 들어섰다. 문제는 속도다. 인공지능은 계속해서 추론 방식을 발전시키고 있다. 오픈AI의 추론 모델인 o1이 o3까지 가는데 3개월도 채 걸리지 않았다. 그래서 어떤 이들은 우리가 지수적 시대를 지나 3주마다 혁신이 쏟아지는 쌍곡선적 시대로 접어들었다고 말한다.
분명한 것은 인공지능과 사람이 함께 만들어갈 지식의 미래가 성큼 다가왔다는 사실이다. 우리가 던져야 할 질문은 이제 “AI가 인간을 대체할까?”가 아니라 “AI와 함께 우리는 어떤 불가능을 가능으로 만들 것인가?”가 아닐까.
최재운님의 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.


![[MOBI-INSIGHT] ‘메타코리아와 함께 보는 2026 비즈니스 트렌드’ 발표 현장 리뷰](https://mobiinsidecontent.s3.ap-northeast-2.amazonaws.com/kr/wp-content/uploads/2025/12/05143812/251205_Meta-2026-%EB%B9%84%EC%A6%88%EB%8B%88%EC%8A%A4-%EC%84%A4%EB%AA%85%ED%9A%8C_01-218x150.jpg)
![[AI시대 B2B 성장 레시피] AI 검색의 시대, B2B SaaS 마케팅 담당자를 위한 GEO 성공 사례 4가지](https://mobiinsidecontent.s3.ap-northeast-2.amazonaws.com/kr/wp-content/uploads/2025/12/03113846/251204_GEO_%EC%84%AC%EB%84%A4%EC%9D%BC-218x150.png)
![[AI 시대, 인간적 탐구] 이해 없는 활용](https://mobiinsidecontent.s3.ap-northeast-2.amazonaws.com/kr/wp-content/uploads/2025/12/02104519/251203_AI-%EA%B5%90%EC%9C%A1_%EC%84%AC%EB%84%A4%EC%9D%BC-218x150.jpg)