# OpenAI Realtime APIモデル一覧｜GPT-Realtime-2・Translate・Whisper・Miniの違いと業務導入の判断軸

> OpenAIのRealtime API系モデルは、音声エージェント、リアルタイム通訳、ライブ文字起こし、低コスト音声応答、旧preview系に分けて見る必要があります。導入前に、会話で行動させたいのか、翻訳したいのか、文字起こししたいのか、またはChat Completions向けAudioモデルで足りるのかを切り分け、接続方式、レイテンシ、料金、安全設計、評価方法を確認します。

## メタ情報

- URL (HTML): https://funnel-ai.jp/media/openai-realtime-voice-models-2026/
- 公開日: 2026-05-08
- カテゴリ: AIエージェント (https://funnel-ai.jp/media/ai-agents/)
- 編集: ファネルAi編集部 (https://funnel-ai.jp/company/funnelai-editorial/)
- 監修: ファネルAi監修チーム (https://funnel-ai.jp/company/funnelai-review/)
- 出典メディア: Funnel Ai Media (https://funnel-ai.jp/media/)

## 本記事のポイント

- Realtime系は、GPT-Realtime-2、Translate、Whisper、1.5、Mini、旧previewを用途別に分けて選びます。
- 複雑な音声エージェントはGPT-Realtime-2、通常の音声応答は1.5、低コスト運用はMiniが候補です。
- 翻訳と文字起こしは専用モデルを使い、Chat Completions向けAudio系とは別枠で判断します。

## 想定質問

- OpenAIのRealtime API系モデルには何がある？
- GPT-Realtime-2、Translate、Whisper、1.5、Miniの違いは？
- GPT-4o Realtime previewやAudio系モデルとは何が違う？
- BtoB業務ではどのRealtimeモデルから導入すべき？

---

本文（HTML）は https://funnel-ai.jp/media/openai-realtime-voice-models-2026/ を参照してください。