더 똑똑함보다, 더 빠르게 쓰이는 AI

구글이 속도와 효율성을 핵심으로 한 새로운 AI 모델 ‘제미나이 3 플래시(Gemini 3 Flash)’를 공개하며 제미나이 3 모델 라인업을 확장했다.

제미나이 3 플래시는 최첨단(frontier) 수준의 추론 성능을 유지하면서도, 짧은 지연 시간과 경제적인 비용 구조를 동시에 구현한 것이 특징이다.

구글은 이번 모델을 통해 “누구나, 모든 제품 전반에서 제미나이 3의 차세대 인텔리전스를 활용할 수 있도록 하겠다”는 전략을 분명히 했다.


 

‘Pro급 성능 + Flash급 속도’의 결합

 

지난달 공개된 제미나이 3 프로(Pro)와 딥 씽크(Deep Think) 모드 이후, 제미나이 3에 대한 시장 반응은 빠르게 확산되고 있다.

현재 구글 API에서는 하루 1조 개 이상의 토큰이 처리되고 있으며, 이용자들은 이를 활용해 코딩 시뮬레이션, 대화형 게임, 멀티모달 콘텐츠 분석 등 다양한 작업을 수행하고 있다.

제미나이 3 플래시는 이러한 기반 위에서 프로급 추론 능력을 유지하면서도,

  • 더 짧은 지연 시간

  • 더 낮은 비용

  • 더 높은 처리 효율

을 동시에 달성한 모델이다. 구글은 이를 “일상적인 작업부터 에이전트 기반 워크플로우까지 아우르는 가장 실용적인 AI”라고 설명한다.


 

제미나이 3 플래시는 비용 및 속도 대비 성능의 ‘파레토 최적(Pareto frontier)’을 한 단계 더 끌어올린 모습, 출처: 구글

 

 

성능은 그대로, 비용과 속도는 개선

 

제미나이 3 플래시는 다수의 고난도 벤치마크에서도 최상위권 성능을 기록했다.

  • GPQA Diamond: 90.4%

  • Humanity’s Last Exam(툴 미사용): 33.7%

  • MMMU Pro: 81.2% (제미나이 3 프로와 대등)

특히 주목할 점은 효율성이다.
라이브 트래픽 기준으로 제미나이 3 플래시는 제미나이 2.5 프로 대비 평균 30% 적은 토큰을 사용하면서도 더 높은 성능을 제공한다.

가격 역시 공격적이다.

  • 입력 토큰 100만 개당 0.5달러

  • 출력 토큰 100만 개당 3달러

이는 대규모 AI를 실제 서비스에 적용하려는 기업 입장에서 부담을 크게 낮춘다.


 

왜 지금 ‘Flash’인가

 

이번 발표에서 가장 인상적인 부분은, 구글이 ‘더 강력한 AI’보다 ‘더 빠르게 쓰이는 AI’를 전면에 내세웠다는 점이다.

제미나이 3 플래시는

  • 반복적인 개발 환경

  • 고빈도(high-frequency) 워크플로우

  • 즉각적인 반응성이 중요한 인터랙티브 서비스

에 최적화돼 있다. 실제로 코딩 에이전트 성능을 측정하는 SWE-bench Verified에서 78%를 기록하며, 기존 제미나이 2.5 시리즈와 제미나이 3 프로를 모두 상회했다.

이는 AI가 ‘실험 단계’를 넘어 실서비스 중심으로 이동하고 있다는 신호로 해석된다.


 

A/B 테스트부터 실시간 UI 생성까지

 

구글은 제미나이 3 플래시의 활용 사례로 다음과 같은 시나리오를 제시했다.

  • 실시간 이미지·영상 분석

  • 즉각적인 UI 오버레이 생성

  • 디자인 → 코드 자동 변환

  • A/B 테스트용 크리에이티브 즉시 생성

  • 게임·인터랙티브 앱 내 AI 어시스턴트

속도와 추론이 동시에 필요한 환경에서 제미나이 3 플래시는 ‘기다릴 필요 없는 AI’에 가깝다.


 

기업 반응도 빠르다

 

이미 세일즈포스, 워크데이, 피그마 등 글로벌 기업들이 제미나이 3 플래시를 도입해 활용 중이다. 이들은 공통적으로 추론 속도, 비용 효율성, 대규모 모델과 대등한 성능을 강점으로 꼽았다.

현재 제미나이 3 플래시는

  • 개발자: 구글 AI 스튜디오, 제미나이 API, CLI

  • 기업: 버텍스 AI, 제미나이 엔터프라이즈

  • 이용자: 제미나이 앱, 구글 검색 내 AI 모드

를 통해 순차적으로 제공되고 있다.


 

 

AI 경쟁의 다음 국면

제미나이 3 플래시는 제미나이 앱의 기본 모델로 적용되며, 전 세계 이용자는 추가 비용 없이 최신 AI 경험을 누릴 수 있게 된다.

이번 발표는 단순한 모델 업데이트를 넘어, AI 경쟁의 기준이 ‘성능’에서 ‘속도와 실사용성’으로 이동하고 있음을 보여준다.

AI를 “얼마나 똑똑하게 만들 것인가”보다 “얼마나 빠르게, 얼마나 자주 쓰이게 할 것인가”가 더 중요한 질문이 된 셈이다.

 

 


*이 기사는 구글이 공개한 공식 자료를 바탕으로, IT·마케팅·서비스 실무 관점에서 재구성했습니다.