도쿄대 수석보다 높아…챗GPT·제미나이, 日입시 '최상위권' 성적

미국 오픈AI와 구글, 앤트로픽의 최신 인공지능(AI) 모델이 일본 최상위권 대학 입시에서 실제 수험생 최고점을 뛰어넘는 성적을 기록한 것으로 나타났다.

일본 AI스타트업 라이프프롬프트는 27일(현지 시간) 오픈AI의 '챗GPT 5.2 씽킹'과 구글 '제미나이3 프로 프리뷰', 앤트로픽의 '클로드 4.5 오퍼스' 등 3개 AI모델의 2026학년도 도쿄대와 교토대 입시 문제 풀이 결과를 공개했다. 이번 검증에는 입시학원 가와이주쿠 강사진이 채점에 참여했다.

이 실험은 입시 문제 PDF를 페이지별 이미지로 변환한 뒤 각 AI 모델에 입력하고, AI가 작성한 서술형 답안을 실제 수험생과 같은 기준으로 채점하는 방식으로 진행됐다. 라이프프롬프트 측은 웹 검색은 사용하지 않았으며, AI가 이미 학습한 지식과 추론 능력만으로 문제를 풀게 했다고 설명했다.

AI는 예상보다 높은 점수를 받았다. 2026학년도 도쿄대 이과 합격자 최고점은 550점 만점에 453.60점이었다. 이와 비교해 챗GPT는 503.59점, 제미나이는 496.54점을 기록해 실제 수험생 최고점을 40~50점가량 웃돌았다. 클로드 역시 수험생 최고점에는 미치지 못했지만 전 계열에서 합격 최저점을 100점 이상 넘긴 것으로 나타났다.

교토대 의학부 의학과 시험에서도 비슷한 결과가 나왔다. 2026학년도 합격자 최고점은 아직 공개되지 않았으나, 2025학년도 최고점인 1275점 만점에 1105.87점과 비교했는데, 챗GPT는 1176.25점을 기록해 가장 높은 점수를 받았다. 제미나이도 1122.25점으로 전년도 최고점을 넘어섰고, 클로드는 1005.00점으로 합격 최저점인 942.50점을 웃돌았다.

가장 눈에 띈 변화는 수학이었다. 지난해 같은 실험에서 GPT계열 모델은 도쿄대 이과 수학 120점 만점 중 38점에 그쳤으나, 올해 챗GPT와 제미나이는 도쿄대 이과 수학과 문과 수학, 교토대 이과 수학에서 모두 만점을 받았다. 챗GPT는 교토대 문과 수학과 화학에서도 만점을 기록했다. 지난해 약점으로 지적됐던 수학에서 만점을 기록하며 1년 만에 성능이 개선됐단 평가가 나왔다.

다만 AI의 약점도 확인됐다. 영어에선 밑줄 친 문장의 범위를 정확히 읽지 못하거나, 요약 문제에서 부정확한 사례가 있었다. 수학에서는 챗GPT와 제미나이가 강세를 보인 반면, 클로드는 복잡한 경우의 수나 도형 처리에서 점수를 잃었다.

이미지와 도표를 읽는 능력도 여전히 한계로 지적됐다. 화학에서는 구조식을 잘못 인식하거나, 생물에서는 그래프와 가계도 해석 오류가 다른 문항의 오답으로 이어졌다. 지리와 국어에서는 글자 수 제한을 지키지 못하거나, 답안 분량을 실제 시험지의 물리적 제약에 맞추지 못하는 문제가 반복됐다.

라이프프롬프트는 "AI가 도쿄대에 합격할 수 있느냐는 질문은 완전히 과거의 것이 됐다"며 "올해의 질문은 AI가 인간보다 얼마나 더 똑똑한가"라고 평가했다. 이어 "AI기반 모델의 지능은 충분히 입증됐다"며 "이제는 AI를 업무나 교육 현장에 어떻게 연결하고, 사람이 어떤 방식으로 개입해 약점을 보완할지가 중요해진 단계"라고 덧붙였다.

'일본' 기업 주요 기사

기사 더보기

일본 대학입시 챗GPT 제미나이 유니콘팩토리

기자 사진 이재윤 기자

이 기사 어땠나요?

응원해요 0
놀라워요 0
멋져요 0
좋아요 0
관심있어요 0
궁금해요 0

유니콘팩토리

전체 도쿄대 수석보다 높아…챗GPT·제미나이, 日입시 '최상위권' 성적

최근 검색어

추천태그

최신기사

도쿄대 수석보다 높아…챗GPT·제미나이, 日입시 '최상위권' 성적

공유하기

글자크기

'일본' 기업 주요 기사

이 기사 어땠나요?

이 시각 많이 보는 기사