Googleは5/19のI/O 2026でGemini 3.5 Flashを発表し、同日グローバル(日本含む)で正式公開した。
Gemini App、AI Studio、APIの3つを実際に触ってみたが、思っていたより書けることが多かった。どこが切り替わっていて、どこがまだ待ちなのか。前世代・自社フラグシップと比べて実際どう違うのか。使える部分だけを直接まとめていく。
3.5 Flashに切り替えられる4つの入口
現時点で3.5 Flashを触れる入口を整理して、それぞれの開き方も書いておく。
1. Gemini App(コンシューマー向け)
gemini.google.comを開いて、左上のモデルドロップダウンから3.5 Flashを選ぶだけ。release notesの5/19の項目にも「select 3.5 Flash from the model drop-down」とはっきり書いてある。まだ更新が来ていなければ数日以内に自動的に切り替わる。
2. Google AI Studio(無料でAPIを試す)
aistudio.google.comにログインして3.5 Flashを選んで新しいチャットを始める。Googleの利用可能地域リストに日本も含まれており、ブロックはない。無料枠で小規模な試験は十分できるが、プロダクション環境で使うならAPIへの移行が必要になる。重要な注意点として、無料プランの会話はGoogleが製品改善に使うが、有料APIは使わない。これはGoogleが価格ページに明記しているポリシーの違いだ。
3. Gemini API(開発者向け)
model codeはgemini-3.5-flash。直接呼び出せばよく、ホワイトリスト申請は不要。Standard(通常)・Flex(非リアルタイムバッチ)・Priority(レイテンシに敏感なオンラインシナリオ)の3モードが選べる。詳細はGoogle Gemini APIドキュメントを参照。
4. Gemini Enterprise Agent Platform(企業向け)
Google Cloudは新しいGemini Enterprise Agent Platformを経由する形で、3.5 FlashモデルページにCloud model IDと対応機能が整理されている。踏みやすい落とし穴として、ML processingはUSとEUのマルチリージョンで実行される点に注意が必要だ。「ある地域で使える」ことと「データがその地域で処理される」ことは別の話で、データローカライゼーション条項が絡む企業調達では事前に確認しておくべき点だ。
今回のアップグレードが実際にもたらすもの
Googleが公開しているbenchmark表はこちら(数値はDeepMind 3.5 family pageと3.5 Flashモデルページより):
| Benchmark | Gemini 3.5 Flash | Gemini 3 Flash | Gemini 3.1 Pro | 何を測るか |
|---|---|---|---|---|
| Terminal-bench 2.1 | 76.2% | 58.0% | 70.3% | コマンドラインagent |
| MCP Atlas | 83.6% | 62.0% | 78.2% | ツール呼び出し |
| OSWorld-Verified | 78.4% | 65.1% | 76.2% | デスクトップ操作agent |
| Finance Agent v2 | 57.9% | 42.6% | 43.0% | 財務分析タスク |
| SWE-Bench Pro Public | 55.1% | 49.6% | 54.2% | 実際のGitHub bug fix |
| MMMU-Pro | 83.6% | 81.2% | 80.5% | マルチモーダル推論 |
| CharXiv Reasoning | 84.2% | 80.3% | 83.3% | グラフ理解 |
| MRCR v2 128k avg | 77.3% | 67.2% | 84.9% | 長いコンテキストの再現 |
| Humanity’s Last Exam | 40.2% | 33.7% | 44.4% | 高難度推論 |
| ARC-AGI-2 | 72.1% | 33.6% | 77.1% | 抽象的推論 |
前世代のGemini 3 Flashと比べると、「AIが自律的にツールを使う」領域では3.5 Flashは世代が変わったほどの差がある。表を見れば一目瞭然だ。Googleが今回の再トレーニングで重点を置いた軸がはっきりわかる。
自社フラグシップのGemini 3.1 Proとの比較では、コーディング・ツール操作・画像動画処理の各項目で3.5 Flashが逆転した。ただし3.1 Proが依然リードする3項目がある:長文コンテキストの記憶、最高難度の総合推論、抽象的論理。表の下3行がProの主戦場だ。
私の見方では、3.5 Flashは「AIが複数ステップを連続して自律的にこなし、繰り返し修正するようなシナリオ」向けで、3.1 Proは「長大なPDFを1本投げ込んで深く分析させる」ようなじっくり考えさせる場面に引き続き向いている。Googleも3.1 Proのページを閉じていないことからも、3.5 FlashにProの役割を完全に置き換えるつもりはないことが読み取れる。
サードパーティテストはどう見るか
Googleが自分で出す数値には当然バイアスがかかる。サードパーティのテストの方が面白い。
Artificial Analysisの5/19レポートでは、Gemini 3.5 Flashの総合能力スコアはGemini 3 Flashと比べて明らかに1ランク上で、同クラスの競合より応答速度が約4倍速く、ハルシネーション率も低下している(ただしこの点は後で改めて触れる)。画像・動画理解のパフォーマンスに至っては彼らの記録での最高値を更新した。
OpenLM Chatbot Arena+の5/18スナップショット(600万票以上の人間ブラインドテストに基づく)では、Gemini 3.5 FlashはGPT-5.5、Claude Opus 4.7 Thinking、Gemini 3.1 Proと肩を並べるトップグループに位置付けられている。
注意点として、Arenaは人間の好みによる評価であり、純粋な能力指標ではない。つまり「ブラインドテストで上位モデルと同程度の票を集めた」ということであって、すべての面で勝っているわけではない。「大多数のユーザーが回答を使いやすいと感じたか」という指標として参照するのが適切だ。
この3つはまだ米国限定
今回のI/Oの本命はagentのツールチェーンだったが、最も注目度の高い機能のいくつかはまだ米国限定だ。期待外れにならないよう先に明記しておく。
Gemini Spark:Googleが推す「24/7 always-on agent」。公式説明によるとAI Ultraサブスクリプション限定かつ米国限定で、trusted testersへの提供から始めて米国ベータに展開する流れだ。Sparkはバックグラウンドで継続的に動作し、CalendarでスケジュールをチェックしたりGmailでタスクを整理したりして、必要なときに能動的に報告してくれる。日本のサブスクリプションページでもSparkはUS only・English onlyと明示されている。
Daily Brief:連携したGmail・Calendarから自動で日報を生成する機能。米国限定。
AI Inbox in Gmail:メールから自動でactionableなタスクを生成する機能。米国限定。
今すぐできる一番実用的なことは、Gemini Appを開いてバージョンがすでに3.5 Flashになっているか確認することだ(まだなら数日以内に自動的に届く)。それから普段旧バージョンに投げていた質問を試してみて、速度と回答の具体性を比べてみてほしい。私が「このPDFの3つのリスクポイントを分析して」と投げたところ、3.5 Flashの回答は旧バージョンより構造があり、速度も明らかに速かった。
3.5 Flash vs 3.1 Pro、どちらを選ぶか
おそらく一番多い質問だと思う。結論から言う。
3.5 Flashを選ぶべきシナリオ:
- AIが複数ステップを連続して自律的にツールを使う必要がある場合(コードの繰り返し修正、自律的な情報収集、タスクチェーン全体の実行など)
- 応答速度が速く、インタラクティブな体験が重要な場面
- 画像・動画・PDFを投げ込んでテキスト要約や分析を出す用途
- 予算が限られており、非リアルタイムの大量タスクを受け入れられる場合
3.1 Proを選ぶべきシナリオ:
- 100ページ以上の長文書を深く分析する場合(長文コンテキスト記憶では3.1 Proがまだリード)
- 最高難度の推論が必要な場合(最難関の総合試験では3.1 Proが依然優位)
- 創造的なタスクやじっくり考える必要があるコンテンツ(Googleも3.1 Proをこの用途に位置付けている)
迷っているなら、AI Studioで2つのチャットを同時に開いて実際の作業を投げ比べてみることをすすめる。30分あればどちらが合うか分かる。
ついでに言うと、Gemini 3.5 Proはまだ公開されていない。Googleのローンチブログには「next month」、DeepMindファミリーページには「3.5 Pro coming soon」と書かれており、2026年6月に対応する。それ以前に3.5 ProがGA済みと書かれている記事は参考程度にとどめてほしい。
今回の懸念点:Sparkのプライバシーモデル
使える機能を整理したところで、注目しておく価値のある懸念についても触れておく。
The Vergeの5/20記事は今回のI/Oで最も読む価値のある英語評論だと私は思う。論点はシンプルだ。Googleが今回発表したagentのロードマップの核心的な前提は「ユーザーがAIをGmail・Calendar・Drive・Photos・検索履歴・YouTube履歴に接続することを許可する」ことにある。Spark・Daily Brief・Personal Intelligenceはすべてこの前提の上に成り立っている。
The Vergeは「Googleがデータを盗む」とは言っていない。それは誤った構図だ。The Vergeが言っているのは:OpenAIやAnthropicもコネクターを作っているが、Googleとの違いは、Googleがもともとあなたのメール・Docs・Photosの上に座っているという点だ。Googleが接続しようとしているのは自分自身のデータだ。opt-inであるのは確かだが、問題はopt-inした後に、このシステムが間違いを起こさないか、prompt injectionを受けないか、間違ったメールを送り出さないかを信頼できるかどうかだ。
Sparkはまだ米国外のマーケットには展開されていない。これは逆に言えば、米国ベータが何につまずくかを観察する時間を与えてくれている。自分の地域での展開を待ってからGmailの接続を判断しても遅くはない。
投げ込んだコンテンツをモデルのトレーニングに使われたくないなら、有料APIが最も確実な方法だ。Googleは公式ドキュメントに明記している:無料プランは「Used to improve our products」がYes、有料ティアはNoだ。
Penchanの見解
正直なところ、今回のI/Oはあまり興奮できなかった。
3.5 Flashが速くてツールを使えることは確かで、benchmarkも優秀だ。しかしGoogleがagentツールチェーンをここまで強く推し進めるには、ユーザーがGmail・Calendar・Drive・Photosを接続することを受け入れるという前提が必要だ。それが米国内で定着するかどうかさえまだ疑問符がつく。ましてや他の地域のユーザーが受け入れるかどうかはなおさらだ。Sparkがまだ米国外に展開されていないことで、全員が少し観察する時間を持てている。
個人ユーザーにとっては、Appで直接3.5 Flashが使えるようになり、速度とツール呼び出し能力が旧バージョンより向上しているので、まず試してみるのがいい。上級ユーザーや開発者にとっては「AIに24時間バックグラウンドで動かせる」可能性が早まったことを意味するが、この「always-on AIが常にそばにいる」モデルはもう少しベータのフィードバックを待つ価値がある。
そしてGoogleが今回のI/Oで取り上げなかった問題がある:ハルシネーションだ。3.5 Flash公開前、私はThreadsにGemini 3.1のハルシネーションが深刻という投稿を書いた(毎回OpusとChatGPTに突っ込まれていた)。3.5が公開されてから自分で試して、コミュニティの反応も見たが、この問題は解決されていない。Artificial Analysisの測定では3.5 Flashのハルシネーション率は3 Flashより31ポイント低下しており、方向性は正しい。しかし本当にハルシネーションを解決したとは言い難い。学術引用・法規条文・技術文書・財務数値といった事実精度が求められる場面では、Geminiの出力を一度信じてそのまま使うのはまだ危険で、外部での追加確認は必須だ。

3.5 Proは来月出る予定だ。それまでに「Gemini 3.5ファミリー全モデル公開済み」と書かれている記事は、発表内容を読み違えたか、AIが書いたかのどちらかだ。
Pillarに戻る
この記事はGemini日本語ガイドの拡張アップデートです。プランの選び方はGemini無料版 vs Google AI Pro、ChatGPTとの比較はGemini vs ChatGPT、agentのツールチェーン選びはAIエージェントツール比較をご覧ください。
主な参考文献
- Google: Gemini 3.5: frontier intelligence with action
- Google DeepMind: Gemini 3.5 family / Gemini 3.5 Flash / Gemini 3.1 Pro
- Google AI for Developers: Gemini 3.5 Flash model page / Pricing / Available regions / Changelog
- Google Cloud: Gemini Enterprise Agent Platform model page
- Google: Google I/O 2026 developer highlights / AI subscription updates / Taiwan subscriptions / Taiwan release notes
- Artificial Analysis: Gemini 3.5 Flash: Everything You Need to Know
- OpenLM: Chatbot Arena+
- The Verge: Google’s AI future demands trust and your personal data
- Simon Willison: Gemini 3.5 Flash
- Hacker News: Discussion thread