【2025年6月版】Google AI Studio「Stream」機能を解説|音声対話・画面共有でリアルなAI体験をしよう

ツールの紹介と使い方

はじめに|Stream機能は「リアルタイム音声AI体験」の入口

「まるでAIと生身で話しているかのような体験がしたい」
そんな要望を叶えてくれるのが、Google AI StudioのStreamモードです。

この機能は、音声・画面共有・リアルタイム応答を組み合わせた、インタラクティブなAI体験を実現するもので、文字が1文字ずつ出るといったUI的演出ではなく、音声を使った自然な会話や、ストリーミング対話に最適化されています。

▶︎ Google AI Studioを開く

本記事では、このStreamモードで「何ができるのか」「どう使うのか」「どんな場面で役立つのか」を、初心者にもわかりやすく解説していきます。


Streamとは?|音声・画面共有を活かしたAIストリーミング体験

Stream機能の概要(2025年6月22日時点)

Streamは、Googleが提供する双方向ストリーミングAI体験の実験モードで、以下の要素が特徴です:

  • 音声ベースの会話が可能(AIが音声で返答)
  • カメラや画面共有と組み合わせて対話を行うことができる
  • 感情表現や思考過程の可視化など、AIの人間らしさを強調

選択可能なGeminiモデル(2025年6月22日時点)

Streamモードでは以下のようなモデルが選択できます:

  • Gemini 2.5 Flash Preview Native Audio Dialog
  • Gemini 2.5 Flash Exp Native Audio Thinking Dialog
  • Gemini 2.0 Flash 001

これらはすべて音声およびストリーミング対話に特化したバージョンで、最新のGemini 2.5 Flashモデルが無料で使えるのも大きな魅力です。


Streamのインターフェース:3つのコア機能

Streamモードでは、画面上部に次の3つのボタンが表示され、インタラクティブな対話体験をサポートします。

Talk

  • マイクを有効化し、音声でAIに話しかけることができます。
  • 話しかけるとリアルタイムでAIが音声で返答。
  • ユーザーが無言になると、AIが発言のタイミングを判断して会話を継続。

Webcam

  • カメラをオンにすることで、自分の映像をAIに共有できます。
  • AIが表情や動きを読み取る用途は今後の拡張が期待されており、現在は記録や雰囲気把握が中心です。

Share Screen

  • 画面共有機能です。Streamモード最大の特徴のひとつ。
  • 自分のPCやスマホ画面をAIに見せることができ、画面を見ながらのリアルタイムアドバイスやサポートが可能
  • 例:Webページのレビュー、資料のフィードバック、ツールの使い方の指導など。

Streamの設定項目と意味

Streamモードでは、画面右側にさまざまな調整項目が表示されます。それぞれの意味と用途を解説します。

音声・映像関連

  • Voice:音声応答の有効化とスタイルの選択(TTS品質の変更など)
  • Media resolution:共有画像や動画などの解像度設定

対話性の強化

  • Turn coverage(ON/OFF):AIの発話タイミング制御で自然な会話テンポを実現
  • Affective dialog(ON/OFF):AIが感情を込めた発言をするようになるモード
  • Proactive audio(ON/OFF):ユーザーが話す前にAIが先に話す能動対話モード

会話の記憶と知識補強

  • Session Context:現在の対話セッション内の文脈保持(前の話題を覚えておく)
  • Tools > Grounding with Google Search:Google検索結果をAIが参照して回答に根拠を加える機能

活用シーンと効果的な使い方

音声チャットボットのプロトタイピング

  • 実際の会話を想定したやり取りをAIと行うことで、UXの検証がスムーズ
  • 会話テンポや発話間の沈黙なども含めてテストできる

映像+音声を用いたガイド体験

  • 画面共有と音声を組み合わせ、リアルタイムでサポートやナビゲーションを行う
  • 例:操作説明や製品紹介など、対面接客のような体験が可能

思考過程の可視化と検証

  • 「Thinking Dialog」モードを使用すると、AIが考えている様子をステップごとに見せてくれる
  • 例:複雑な判断が必要なFAQボットや教育用途に効果的

まとめ|Streamモードは体験型AIの未来

Google AI StudioのStream機能は、単なるチャットでは実現できない**“リアルタイムで、話す・見る・考える”を一体化したAI体験**を提供します。

今後のアップデートでは、さらに音声認識や自然なインタラクションの精度向上が期待されています。

UXを重視したアプリケーションやプロトタイプを構築したい方は、ぜひStreamモードを試してみてください。

▶︎ Google AI StudioでStreamを体験