구글, 추론 성능 개선한 '제미나이3.1 프로' 출시

구글 제미나이3.1 프로 / 구글
구글 제미나이3.1 프로 / 구글

구글이 '제미나이3 프로'의 추론 성능을 더 끌어올린 개선 모델을 발표했습니다.

구글은 기존 인공지능(AI) 모델보다 추론 성능을 두 배 이상 높인 '제미나이3.1 프로'를 19일(현지시간) 공개했습니다.

이 모델은 새로운 논리 패턴 해결 능력을 평가하는 벤치마크인 ARC-AGI-2에서 77.1%의 점수를 기록했습니다. 이는 전작인 제미나이 3 프로(31.1%) 대비 두 배 이상 향상된 수치로, 추론 성능이 크게 강화됐음을 보여줍니다.

특히 이 수치는 경쟁 모델들과 비교해도 눈에 띕니다. 오픈AI의 GPT-5.2가 기록한 52.9%, 앤트로픽의 클로드 오퍼스 4.6의 68.8%를 모두 웃도는 결과입니다.

AI 모델 벤치마크 비교표 / 구글
AI 모델 벤치마크 비교표 / 구글

코딩 능력을 측정하는 SWE-벤치 베리파이드(SWE-Bench Verified)에서도 제미나이 3.1 프로는 80.6%를 기록해, 최고 수준으로 평가받는 클로드 오퍼스 4.6(80.8%)와 거의 같은 성능을 보였습니다.

학술적 추론 능력을 평가하는 '인류의 마지막 시험(HLE)'에서도 도구를 사용하지 않은 기준으로 44.4%의 점수를 받아 GPT-5.2(34.5%)와 클로드 오퍼스 4.6(40%)를 앞섰습니다.

구글은 제미나이 3.1 프로가 단순한 질의응답을 넘어, 고급 추론이 필요한 복잡한 작업을 수행하도록 설계된 모델이라고 설명했습니다. 복잡한 개념을 시각적으로 정리해 설명하거나, 방대한 데이터를 하나의 관점으로 통합·분석하는 데 강점이 있다는 것입니다. 또 구글은 이 모델이 창의적인 프로젝트를 구체적인 결과물로 구현하는 데에도 활용할 수 있다고 덧붙였습니다.

이번 성능 향상은 지난해 11월 제미나이 3 프로를 공개한 이후 이어진 사용자 피드백과 빠른 기술 발전의 결과라는 게 구글의 설명입니다. 구글은 제미나이 3.1 프로를 프리뷰 형태로 먼저 공개해 성능을 검증하고, 향후 에이전트형 워크플로우 등 보다 확장된 기능을 중심으로 추가 고도화를 이어갈 계획입니다. 정식 버전도 조만간 출시될 예정입니다.


최성훈 기자 csh87@etnews.com