Gemini 3.5 Flash - Tool-LOG

Gemini 3.5 사용법이 궁금하신가요? 2026년 5월 20일 Google I/O 2026에서 발표된 Gemini 3.5 Flash는 구글의 최신 AI 모델입니다. 이전 세대인 3.1 Pro를 성능에서 넘어서면서도, 속도는 4배 빠르고 비용은 절반 이하로 줄었습니다.

이 글에서는 Gemini 3.5가 뭐가 달라졌는지, 어디서 무료로 쓸 수 있는지, Thinking 모드는 어떻게 조절하는지, 그리고 아직 부족한 점은 뭔지까지 정리합니다.

Gemini 3.5, 뭐가 달라졌나?

먼저 핵심부터 짚겠습니다. Gemini 3.5는 Flash 모델 하나만 출시되었습니다. Pro 버전은 없어요. 구글이 Flash 하나로 성능과 효율을 모두 잡겠다는 전략을 택한 셈입니다.

기존 모델과 비교하면 이렇습니다.

	Gemini 3.1 Pro	Gemini 3.5 Flash
속도	기준	약 4배 빠름
비용	기준	절반 이하
컨텍스트 윈도우	–	100만 토큰 입력 / 65k 토큰 출력
멀티모달	텍스트, 이미지	텍스트, 이미지, 영상, 오디오, PDF
Thinking 모드	on/off	4단계 (minimal~high)

100만 토큰 컨텍스트는 책 한 권 이상의 분량을 한 번에 넣을 수 있는 수준입니다. 최대 출력도 65,000 토큰으로 넉넉해서, 긴 보고서나 코드를 생성할 때 중간에 끊기는 일이 줄었습니다.

멀티모달 입력도 확장되었습니다. 텍스트와 이미지는 물론이고 영상, 오디오, PDF까지 직접 입력할 수 있어요. 회의 녹음을 넣어서 요약하거나, PDF 보고서를 통째로 분석하는 작업이 가능합니다.

Gemini 3.5 사용법: 무료로 쓸 수 있는 곳

“무료로 쓸 수 있나요?”가 가장 많이 나오는 질문일 겁니다. 결론부터 말하면, 쓸 수 있는 곳과 없는 곳이 나뉩니다.

채널	Gemini 3.5 Flash 무료 사용	비고
Gemini 앱 (gemini.google.com)	가능	기본 모델로 제공
Google 검색 AI Mode	가능	기본 모델로 제공
Google AI Studio 무료 티어	불가	기존 Flash/Flash-Lite만 무료
Gemini API (유료)	유료	아래 API 가격 참조

일반 사용자라면 Gemini 앱에서 바로 써볼 수 있습니다. 구글 계정으로 로그인하면 Gemini 3.5 Flash가 기본 모델로 설정되어 있어요. 별도 설정 없이 바로 대화를 시작하면 됩니다.

Google 검색의 AI Mode에서도 3.5 Flash가 기본으로 동작합니다. 검색 결과를 AI가 요약해주는 기능인데, 이제 최신 모델이 적용된 겁니다.

다만 개발자용인 Google AI Studio 무료 티어에서는 아직 3.5 Flash를 쓸 수 없습니다. 무료 티어는 기존 Flash와 Flash-Lite만 지원하고 있어요. 3.5 Flash를 API로 쓰려면 유료 플랜이 필요합니다.

Gemini 무료 사용 범위가 더 궁금하다면 Gemini 무료 사용법 정리도 참고해 보세요.

주요 성능과 벤치마크

Gemini 3.5 Flash의 성능은 벤치마크 수치로 확인할 수 있습니다. 2026년 5월 Google I/O 발표 기준 주요 결과입니다.

벤치마크	점수	의미
Terminal-Bench 2.1	76.2%	코딩 에이전트 성능
Finance Agent v2	57.9%	금융 분석 에이전트 (비교 모델 중 최고)
MMMU-Pro	83.6%	멀티모달 학술 추론
CharXiv Reasoning	84.2%	차트·그래프 해석 추론

특히 Finance Agent v2에서 비교 대상 모델 중 최고 점수를 기록한 점이 눈에 띕니다. 에이전트 기반의 복잡한 작업에서 강점을 보인다는 의미입니다.

물론 벤치마크는 실사용 경험과 항상 일치하지는 않습니다. 각 AI 모델의 실제 차이가 궁금하다면 AI 비교: ChatGPT vs Claude vs Gemini 글에서 비교해 보세요.

Thinking 모드란? (4단계 조절법)

Gemini 3.5 Flash에는 Thinking 모드가 있습니다. 모델이 답변하기 전에 내부적으로 추론 과정을 거치는 기능인데, 4단계로 세밀하게 조절할 수 있어요.

단계	설명	적합한 용도
minimal	추론 최소화, 빠른 응답	단순 질의응답, 번역
low	간단한 추론	요약, 분류, 짧은 글 작성
medium (기본값)	균형 잡힌 추론	일반 업무, 분석, 코딩
high	깊은 추론, 느린 응답	수학, 복잡한 논리, 연구

기본값은 medium입니다. 대부분의 작업은 이 설정으로 충분합니다.

팁을 드리자면, 빠른 응답이 필요한 챗봇이나 실시간 서비스에는 minimal이나 low를 쓰고, 코드 디버깅이나 복잡한 분석에는 high를 선택하는 게 효과적입니다. Thinking 레벨을 올리면 응답 시간이 길어지는 대신 정확도가 올라가는 트레이드오프가 있어요.

API에서는 thinkingConfig 파라미터로 설정할 수 있고, Gemini 앱에서는 대화창 설정에서 조절 가능합니다.

API 가격과 개발자용 정보

Gemini 3.5 Flash의 API 가격은 2026년 5월 기준 다음과 같습니다.

항목	가격 (1M 토큰당)
입력	$1.50
출력	$9.00
캐시 입력	$0.15

캐시 입력 가격이 $0.15로 매우 저렴합니다. 반복적으로 같은 맥락(시스템 프롬프트, 참조 문서 등)을 보내는 경우 캐시를 활용하면 비용을 크게 줄일 수 있어요.

개발자라면 주목할 스펙을 정리하면 이렇습니다.

컨텍스트 윈도우: 100만 토큰 입력 / 최대 65k 토큰 출력
멀티모달 입력: 텍스트, 이미지, 영상, 오디오, PDF
Thinking 모드: API에서 minimal/low/medium/high 4단계 지정 가능
Google AI Studio에서 프롬프트 테스트 후 API 키 발급 가능 (무료 티어에서는 3.5 Flash 미지원)

다른 AI 모델의 API 비용과 비교하고 싶다면 AI 코딩 도구 비교에서 주요 모델별 가격을 확인해 보세요.

솔직한 한계: 할루시네이션과 작문 퇴화

Gemini 3.5 Flash가 빠르고 저렴해진 건 맞지만, 솔직히 말해서 한계도 분명합니다.

할루시네이션 비율이 높습니다

Artificial Analysis의 AA-Omniscience 벤치마크 기준, Gemini 3.5 Flash의 할루시네이션 비율은 61%입니다. 모델이 사실이 아닌 내용을 자신 있게 답변하는 비율이 절반을 넘는다는 뜻이에요.

이 수치가 의미하는 건 명확합니다. 팩트 확인 없이 Gemini의 답변을 그대로 신뢰하면 안 됩니다. 특히 구체적인 수치, 날짜, 인물 정보 등은 반드시 교차 검증이 필요합니다.

작문 능력이 퇴화했다는 지적

커뮤니티에서는 Gemini 3.5 Flash의 작문 능력이 이전 3.1 Pro보다 퇴화했다는 지적이 나오고 있습니다. 긴 글을 쓸 때 문맥이 흐려지거나, 오타와 외국어가 섞여 나오는 현상이 재발한다는 보고도 있어요.

속도와 효율에 최적화하면서 창작 품질이 일부 희생된 것으로 보입니다. 보고서 초안이나 이메일 같은 실용적 글쓰기에는 충분하지만, 문학적 표현이나 세밀한 톤 조절이 필요한 작업에서는 한계가 있을 수 있습니다.

정리: Gemini 3.5, 어디에 쓸까?

Gemini 3.5 사용법을 정리하면 이렇습니다.

상황	Gemini 3.5 Flash 적합도	이유
빠른 질의응답, 검색 보조	적합	빠르고 무료. Gemini 앱에서 바로 사용
긴 문서/PDF 분석	적합	100만 토큰 컨텍스트
영상/오디오 요약	적합	멀티모달 입력 지원
코딩 보조, 에이전트	적합	Terminal-Bench, Finance Agent 고득점
정확한 사실 확인이 필요한 작업	주의 필요	할루시네이션 비율 61% (AA-Omniscience)
섬세한 글쓰기, 창작	주의 필요	작문 퇴화 지적 존재

한 줄 요약: Gemini 3.5 Flash는 빠르고 저렴한 만능 도구로 쓰기에 좋지만, 답변의 정확성은 반드시 사람이 검증해야 합니다. 무료로 쓸 수 있는 Gemini 앱에서 먼저 직접 테스트해 보는 걸 추천합니다.

이 글의 성능 수치와 가격은 2026년 5월 Google I/O 발표 기준이며, 향후 변경될 수 있습니다.