*このブログは、8月7日(米国時間)に公開されたブログの抄訳版です。
Zendeskのプラットフォームは、企業がより少ない労力で迅速かつ正確な解決策を提供できるようにします。このプラットフォームの中核にあるのは、信頼が問われる重要な瞬間に顧客ニーズを理解し、的確に処理し、いつ上のレベルに引き継ぐべきか、あるいは介入を控えるべきかを知るAIエージェントのシステムです。
これこそが、基盤となるモデルが不可欠である理由であり、Zendeskのような企業が最新モデルのテストや活用を主導し、最も高度なAI機能を継続的に強化および加速させることが重要である理由です。
OpenAIのGPT-5のリリースにより、Zendeskはそのシステムの主要な要素を向上させる機会を得ました。現在、GPT-5はZendeskのResolution Platformに導入され、サポート担当者の支援や自動化のワークフローにおいて、ユーザー企業における実際の顧客とのやり取りを強化しています。
「反復的な導入は、新しいモデル機能を最高レベルの厳密さで検討し、展開することを確実にします。ZendeskとGPT-5において協力することは、早期のテストとフィードバックが、APIがユーザーにとって最も重要な場所で最も意味のある影響をどのように推進できるかを特定するのに役立つ最新の事例です」
OpenAI ビジネス製品責任者 Olivier Godement(オリヴィエ・ゴドモン)氏
モデルのテスト方法を統一する理由
新しいモデルを評価する際、Zendeskはベンチマークの優位性のみを評価しているわけではありません。それが現場での解決結果を改善するかどうかを重視しています。Zendeskは、GPT-5のような新しいモデルを主要なタスクで評価および調整するために、レイテンシ、コスト、性能のバランスを取りながら評価・調整するための厳格なベンチマークプログラムを実行しています。これにより、24時間以内にモデルの迅速なテストと導入が可能になります。
Zendeskの評価フレームワークは以下の基準です。
- 正確性: ヘルプセンター記事などの信頼できる知識ソースに基づいた正確で完全な回答をモデルが返すことができるか?
- 自動解決能力: 人間の介入なしに自動解決される問題の割合を増加させるか?
- 実行の忠実性: 構造化されたワークフローを高い忠実度で実行できるか?
- 応答速度: ライブサポート環境で応答が十分に速いか?
- 安全対策: ハルシネーションを回避し、確実な場合にのみアクションを実行するか?
Zendeskは、オフラインおよびリアルタイムの各指標でパフォーマンスを継続的に監視し、AIの改善が透明かつ信頼できるものであることを確実にしています。GPT-5は、これらの基準のほぼすべてにおいて改善をもたらしました。結果は以下のとおりです。
GPT-5がZendeskのAIエージェント、Copilot、およびApp Builderで改善したこと
- サポート担当者への転送の減少 – 20%以上の削減
GPT-5は、より詳細で漏れのない応答を提供できるため、サポート担当者への転送が減り、顧客はより自己解決率を高め、早く回答を得られるようになりました。
- 曖昧さへのより鋭い処理 – 意図明確化の改善
GPT-5は、顧客による曖昧な入力内容をより効果的に明示し、適切な振り分けを可能にすることで、やり取りの65%以上で自動化可能な対応範囲を広げました。
- 高い実行信頼性 – 標準手順で95%以上、大規模フローでの失敗が30%減少
GPT-5は、長いワークフロー全体で構造を維持し、コンテキストを失うことなく実際のサービスにおける複雑さにも対応しました。
- アシスト機能の質の向上 – 4つの言語で担当者への提案精度が5ポイント向上
GPT-5からの提案が、より簡潔で文脈に沿っており、適切な言葉遣いに合致するようになったことで、サポート担当者の業務効率が上がりました。
- より高速なアプリ生成 – 1分あたりのプロンプト反復回数が3〜4倍、アプリビルダーのコード生成でより良いアライメント
GPT-5は全体的に25~30%高速になり、1分あたりの指示入力回数が増えたことで、App Builderを使った開発作業がスピードアップしました。
技術的な統合: ZendeskのGPT-5の活用方法
GPT-5は、以前のモデルの単なる代替として単純に置き換えられたわけではありません。これは、確実な問題解決を提供するために構築された、より大規模でモジュール化されたAIアーキテクチャの一部を構成するものです。
モデルの選択と使用
当社は、測定可能な価値が実証されているユースケース全体でGPT-5を選択的に使用しています。これには以下が含まれます。
- 意図の明確化と曖昧さの解消
- 長いコンテキストを含む回答の生成
- 手順の作成と実行 (PCA / PEA)
- 自動アシストシナリオでのエージェント返信の生成
GPT-5は、当社の意図分類および推論パイプラインと連動して機能します。曖昧な入力を明確なアクションにマッピングした後、モデルを用いて応答を作成したり、適切な場面で複数のステップからなるワークフローを実行したりします。
推論モードとフロー処理
GPT-5は、非常に長いコンテキストウィンドウを持つ中程度の推論を可能にします。これは特に以下のことに役立ちます。
- 複数回のやり取りを伴う会話
- 社内手順の段階的な実行
- あいまいな表現の入力から構造化された出力を動的に生成
これらのシナリオでは、会話構造、正確性、およびコンテキストウィンドウの効率を維持することを優先します。GPT-5は、より高いトークン負荷でも確実に機能し、複数回のやり取りまたは入力をまたぐサポートサービス対応のよりスムーズな自動化を可能にします。
安全性確保と制御
GPT-5を本番環境で安全に展開するために、Zendeskは強力な運用上の安全対策で囲んでいます。
- リスクを軽減し、明確性を向上させるための意図に基づく事前ルーティング
- モデルの動作の構造化されたロギングによるリアルタイムの監視体制
- ポリシー違反の応答を防ぐためのトリガーごとのガバナンス
- 安全なエスカレーションまたはエージェントの関与をデフォルトとするフォールバックプロトコル
Zendeskは、モデルを制御されたシステム内の非決定論的なツールとして扱っており、単独の意思決定者ではありません。これにより、企業グレードの環境に展開することができます。
これが顧客にとって何を意味するか
GPT-5を統合したのは、より迅速に、より高い信頼性でより多くの問題を解決できるようになったためです。
これにより、サポート担当者への転送が減少しました。多言語サポート全体でパフォーマンスが向上しました。ワークフローを正確に実行し、曖昧さをより正しく処理しました。そして、AIを活用したエージェントの構築・テスト・展開サイクルにおいて、当社の内部チームがより迅速に動けるようになりました。
AIのあらゆる進歩は、スレッドの脱落の減少、解決時間の短縮、そして会話の両側にいる人々にとってより良い体験をもたらすでしょう。GPT-5は、当社がそれを実現するのに役立ちます。
Zendeskは、新しいモデルが進化するにつれて、テスト、調整、統合を継続します。しかし、当社の焦点は変わりません。それは、顧客が信頼できる解決策を提供するためにAIを使用することです。
