📅 2026年5月8日 ⏱️ 12分で読めます

Gemini 3.1 Flash-Liteとは？料金・使い方・Gemini 3.1 Proとの違いを解説

Q: Gemini 3.1 Flash-LiteとGemini 3.1 Flash-Lite Previewは同じですか？

同じ系統のモデルですが、モデルIDは別です。2026年5月8日時点では gemini-3.1-flash-lite がStableとして掲載され、 gemini-3.1-flash-lite-preview も料金ページに掲載されています。本番実装では、どちらを使っているかをコード、設定、社内資料で明示してください。

執筆小林編集ファネルAi編集部監修ファネルAi監修チーム最終更新2026年5月8日

Gemini 3.1 Flash-Liteを、低コスト、高速処理、Google WorkspaceやCRM連携の観点で整理する抽象図

この記事で扱うテーマ

本記事のポイント

Gemini 3.1 Flash-Liteは、Googleが2026年3月3日に発表した高頻度処理向けのGemini 3.1系モデルで、Gemini APIとVertex AIで利用対象になるモデルです。
標準料金は有料枠で入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルが公式料金ページに掲載されており、BatchやFlexではさらに低い単価が示されています。
実務では、Gemini 3.1 Proにすべて任せるのではなく、Flash-Liteで分類・抽出・要約・ルーティングを行い、複雑な判断だけを上位モデルへ渡す設計が向いています。

Gemini 3.1 Flash-Liteとは何か

Gemini 3.1 Flash-Liteは、Googleが「大規模な高頻度ワークロード向け」として発表したGemini 3シリーズの軽量モデルです。Googleの発表では、開発者にはGemini APIとGoogle AI Studio、企業にはVertex AI経由でpreview提供を開始すると説明されました。その後、Google AI for Developersのモデルページでは gemini-3.1-flash-lite がStableとして掲載されています。

Gemini 3.1 Flash-Liteを、低コスト処理、マルチモーダル入力、上位モデルへのルーティングに分けて整理した図 — Gemini 3.1 Flash-Liteは、すべての業務判断を担う万能モデルというより、大量の入力を低コストで処理し、必要に応じてFlashやProへ渡す入口モデルとして設計すると使いやすくなります。

Liteという名前から「精度を大きく落とした廉価版」と受け取ると、実務判断を誤ります。公式モデルページでは、入力はテキスト、画像、動画、音声、PDFに対応し、出力はテキストです。トークン上限も入力1,048,576、出力65,536とされており、軽量モデルでありながら長い文書や複数ファイルを扱う設計に使えます。

ただし、何でもFlash-Liteに寄せればよいわけではありません。複雑な推論、長い計画立案、曖昧な要件整理、責任の重い判断は、Gemini 3.1 Proや他の上位モデルで検証した方がよい場面があります。Flash-Liteは「単純な大量処理」「低遅延が重要な処理」「分類や抽出の入口」に強いモデルとして捉えると、コストと品質のバランスを取りやすくなります。

料金とモデルIDで確認すべきこと

2026年5月8日時点のGoogle AI for Developersの料金ページでは、Gemini 3.1 Flash-Liteの有料枠に、標準の入力100万トークンあたり0.25ドル、音声入力100万トークンあたり0.50ドル、出力100万トークンあたり1.50ドルが掲載されています。BatchとFlexでは入力0.125ドル、出力0.75ドルの料金が示され、Priorityでは標準より高い単価が掲載されています。

料金表を見るときは、単価だけで判断しないことが重要です。Google Search groundingやGoogle Maps groundingは無料枠後の検索クエリ課金が関係し、コンテキストキャッシュも別単価です。さらに、無料枠と有料枠では、データの扱い、利用上限、利用できる機能が変わります。業務利用では、社内の検証環境で無料枠を試し、本番処理は有料枠またはVertex AI側の統制前提で設計する方が安全です。

確認項目	Gemini 3.1 Flash-Liteで見るポイント	実務上の意味
モデルID	`gemini-3.1-flash-lite`、previewは `gemini-3.1-flash-lite-preview`	本番利用ではStable IDとpreview IDを混同しない。
入力	テキスト、画像、動画、音声、PDF	問い合わせ、議事録、資料、レビュー、音声メモの一次処理に使いやすい。
出力	テキスト	画像生成や音声生成ではなく、分類、要約、JSON化、文章生成に使う。
得意領域	翻訳、文字起こし、軽量な抽出、文書要約、モデルルーティング	大量処理の入口や前処理に向く。
注意点	Live APIや画像生成、Computer Useは非対応として掲載	リアルタイム音声対話やブラウザ操作の代替として設計しない。

特に重要なのは、StableとPreviewの扱いです。Previewモデルは正式版と同じ前提で業務手順に固定しない方がよく、出力傾向や制限が変わる可能性を見込む必要があります。記事や社内資料で「Gemini 3.1 Flash-Lite対応」と書く場合も、使っているモデルID、提供面、料金ページの確認日を明記しておくと、後から仕様変更を追いやすくなります。

Gemini 3.1 ProやFlashとの違い

Gemini 3.1 Flash-Liteを理解するには、Gemini 3.1 ProやFlashとの役割分担で見るのが早いです。Proは複雑な推論や高度なエージェント処理、長い要件整理に寄せるモデルです。Flashは速度と品質のバランスを取りたい汎用処理に向きます。Flash-Liteはさらに高頻度・低コスト寄りで、定型的な大量処理やルーティングに向きます。

たとえば営業やマーケティングの現場では、すべての商談メモや問い合わせをProへ渡すとコストが膨らみます。Flash-Liteで「問い合わせ種別」「緊急度」「担当部門」「不足項目」「CRMに入れる構造化データ」を先に抽出し、複雑な提案文や例外判断だけをProへ渡す構成にすると、品質を落とさずに処理コストを抑えやすくなります。

モデルの見方	向いている処理	避けたい使い方
Gemini 3.1 Flash-Lite	分類、抽出、翻訳、短い要約、定型JSON化、モデルルーティング	曖昧で責任の重い判断を単独で完結させる。
Gemini 3.1 Flash	速度と品質を両立した一般的な文章処理、画像理解、アプリ組み込み	大量の単純処理をすべてFlashに流してコストを膨らませる。
Gemini 3.1 Pro	複雑な推論、戦略立案、要件整理、長い文脈の深い判断	タグ付けや単純分類のような軽量処理まで全部任せる。

この役割分担は、AIエージェント設計でも有効です。ユーザーの依頼をまずFlash-Liteで「単純」「中程度」「複雑」に分類し、単純なものはFlash-LiteやFlashで処理し、複雑なものだけProへ渡す。こうしたモデルルーティングは、レスポンス速度とコストを両立する実装パターンになります。

業務利用で向いているケース

Gemini 3.1 Flash-Liteが特に向いているのは、1件あたりの単価よりも、月間処理件数が効いてくる業務です。問い合わせ、レビュー、アンケート、商談メモ、議事録、PDF資料、音声メモなどを大量に扱う場合、最初から上位モデルで深く考えさせるより、Flash-Liteで要約・分類・抽出してから後段へ回す方が設計しやすくなります。

Google Workspace中心の会社なら、Gmail、Google Forms、Google Drive、Google Sheets、Google Meet議事録などに散らばる情報を、CRMや営業管理に流し込む前処理で使う発想が現実的です。たとえば、問い合わせメールを製品カテゴリ別に振り分ける、商談メモから次アクションを抽出する、PDF提案書から顧客名・課題・期限を取り出す、といった処理です。

問い合わせメールを一次分類し、営業、サポート、経理、法務などの担当チームへ振り分ける。
Google Formsの自由記述を要約し、満足度、要望、解約リスク、優先対応候補を構造化する。
Google Drive上のPDFや議事録を短く要約し、CRMに入れるべき項目だけを抽出する。
顧客レビューやSNSコメントを大量に分類し、広告文、FAQ、改善要望の材料に分ける。
AIエージェントの入口で依頼内容を分類し、Flash、Pro、別ツールのどれに渡すかを決める。

一方で、Flash-Liteの出力をそのまま顧客対応や契約判断に使う運用は避けた方がよいです。特に、法務、医療、財務、セキュリティ、個人情報を含む判断では、人間レビュー、ログ、根拠確認、再実行条件を残す必要があります。Flash-Liteは「速く安く前処理するモデル」であって、「確認不要にするモデル」ではありません。

導入前に確認する設定と運用

Gemini 3.1 Flash-Liteを業務で使う前に、まず利用面を分けてください。Google AI Studioで試すのか、Gemini APIでアプリに組み込むのか、Vertex AIで企業統制の中に入れるのかで、認証、ログ、課金、データ取り扱い、権限管理が変わります。Google Workspaceの画面にGeminiが出るかどうかとは別の論点です。

次に、対象データの棚卸しが必要です。顧客名、メールアドレス、商談金額、契約情報、問い合わせ内容、音声データ、添付PDFなどをAIに渡す場合、どこまで送ってよいか、どの項目をマスクするか、出力をどこに保存するかを決めます。DLPや共有ドライブの権限、監査ログの見方も合わせて設計しておくと、後から利用拡大しやすくなります。

対象業務を決める: 翻訳、分類、要約、抽出、ルーティングなど、Flash-Liteに任せる範囲を狭く定義する。
入力データを分ける: 公開情報、社内情報、顧客情報、機密情報を分け、渡してよい項目を決める。
モデルIDを固定する: Stableとpreviewを混同せず、検証環境と本番環境で使うIDを明記する。
評価用データを作る: 実際の問い合わせ、商談メモ、PDF、音声メモから小さな検証セットを作る。
人間レビューを残す: CRM更新、顧客送信、契約判断などの前に確認ポイントを置く。
コストとログを見る: トークン量、Batch利用、Search grounding、再実行回数を月次で確認する。

この順番で始めると、モデル名の新しさに振り回されずに済みます。Gemini 3.1 Flash-Liteは、Google WorkspaceやCRMの運用を置き換えるものではなく、既存の業務フローにある「読む、分ける、要約する、転記する」の負担を下げる部品です。

よくある質問

Gemini 3.1 Flash-Liteは無料で使えますか？

Google AI for Developersの料金ページでは、無料枠と有料枠が分かれて掲載されています。ただし、無料枠は利用できるモデル、上限、データの扱いが本番利用と異なる場合があります。業務利用では、検証は無料枠、本番は有料枠またはVertex AI側の統制で設計するのが安全です。

Gemini 3.1 Flash-LiteとGemini 3.1 Flash-Lite Previewは同じですか？

同じ系統のモデルですが、モデルIDは別です。2026年5月8日時点では gemini-3.1-flash-lite がStableとして掲載され、gemini-3.1-flash-lite-preview も料金ページに掲載されています。本番実装では、どちらを使っているかをコード、設定、社内資料で明示してください。

Gemini 3.1 Flash-Liteで画像生成はできますか？

公式モデルページでは、Gemini 3.1 Flash-Liteの画像生成は非対応として掲載されています。画像生成には、Gemini 3.1 Flash Image PreviewやGemini 3 Pro Image、Imagen系など、画像生成に対応したモデルを別に選ぶ必要があります。

Gemini 3.1 Flash-LiteはGemini 3.1 Proの代わりになりますか？

完全な代替ではありません。Flash-Liteは大量の軽量処理に向き、Proは複雑な推論や曖昧な判断に向きます。実務では、Flash-Liteで分類や抽出を行い、重要度が高いものだけProへ渡す設計が現実的です。

Google WorkspaceのGemini機能として使えますか？

この記事で扱っているGemini 3.1 Flash-Liteは、主にGemini API、Google AI Studio、Vertex AIで確認するモデルです。GmailやDocsの画面に出るGemini機能とは利用面が異なります。Workspaceデータと連携させる場合は、API、権限、DLP、ログ、CRM連携を別途設計してください。

Gemini活用を業務フローに組み込むなら

Gemini 3.1 Flash-Liteのような低コストモデルは、単体で導入するより、問い合わせ分類、CRM更新、営業フォロー、資料要約、社内承認などの業務フローに組み込んだときに効果が出ます。ファネルAiでは、Google Workspace、CRM、営業・マーケティング業務をつなぐAI活用設計を支援しています。

Gemini / Google Workspace活用を相談する

メディア一覧へ戻る