※本ページにはプロモーション(広告)が含まれています
電話やアプリ、Web上で会話する「音声AIエージェント」を作れる開発者向けプラットフォーム「Vapi(バピ・vapi.ai)」を使っていて、「エージェントが応答しない」「電話がつながらない・着信しない」「音声が途切れる・かぶる」といったトラブルで止まってしまった、という方は多いはずです。結論から言うと、原因の多くは裏で使うモデル(LLM)・音声合成(TTS)・音声認識(STT)の設定とAPIキー・残高(クレジット)やプランの状態・電話番号の割り当てとプロバイダ連携・Webhook(サーバーURL)の設定のいずれかに集約されるとされています。
この記事では、やや開発者寄りの方に向けて、Vapiが思うように動かないときに「どこを・どの順番で」確認すればよいかを、つまずきやすいポイントごとに整理して解説します。Vapiは仕様やUI、対応サービス、料金が頻繁に更新されている発展途上のプラットフォームです。ダッシュボードのメニュー名や設定項目の細部は、お使いの時期・プラン・地域によって変わる可能性があります。最終的な正解は必ず公式ドキュメント(docs.vapi.ai)で確認していただく前提で、本記事は「あたりの付け方」を提供するものとお考えください。
トラブルシューティングで大切なのは、いきなり一つの原因を決め打ちしないことです。Vapiのように「LLM」「TTS」「STT」「電話番号」「外部プロバイダ」「Webhook」と複数の要素が連なる仕組みでは、表面的な症状だけでは原因の層が見えにくいことがよくあります。たとえば「エージェントが急に黙る」という同じ症状でも、実体はAPIキーの失効だったり、モデル側の一時的な障害だったり、残高不足だったりします。そこで本記事では、影響範囲の大きい確認項目から順に並べ、上から潰していけば自然と原因にたどり着けるよう構成しています。落ち着いて一つずつ切り分けていきましょう。

まず3行で:Vapiが動かないときの最初の一手
細かい原因を追う前に、まずこの3つを上から順に確認すると、多くのケースで原因の切り分けが進むとされています。
- 各種APIキー(LLM・TTS・STT)と、アカウントの残高(クレジット)・プランの状態を確認する(エージェントが黙る・通話が即終了する系の大半はこことされます)。
- 電話番号が割り当てられているか・プロバイダ連携(TwilioなどのSIPや番号)が正しいかを確認する(つながらない・着信しない系)。
- 通話ログ(Call Logs)の「終了理由(Ended Reason)」と、Webhook(サーバーURL)の応答を確認する(途中で切れる・連携が動かない系)。
この3点を押さえるだけで、「どの層で詰まっているのか」がかなり見えてきます。Vapiにはダッシュボード上で挙動を観察する仕組みが用意されているとされており、まずはそこを見るのが近道です。以降の章で、それぞれを掘り下げていきます。
この記事でわかること
- そもそもVapiとはどんなプラットフォームで、何にお金がかかるのか
- エージェントが応答しない・途中で黙るときに確認するポイント
- 電話がつながらない・着信しないときに見る設定(番号・連携・地域)
- 応答が遅い(レイテンシが大きい)ときに見直す組み合わせ
- 音声が途切れる・かぶる(割り込み)ときのしきい値調整の考え方
- Webhookや関数呼び出し(連携)が動かないときの確認手順
- 文字起こし(STT)の精度が低いときに合わせるべき設定
- それでも直らないときの問い合わせ先と、集めておくべき情報
症状別 早見表
まずは今の症状がどの分類に近いかを、下の表でざっくり当ててください。詳しい手順は各章で説明します。表内の表現は一般的な傾向であり、実際の原因はお使いの構成によって異なる場合があります。
| 症状 | よくあるとされる原因 | 最初に見る章 |
|---|---|---|
| 挨拶のあと黙る/エージェントが応答しない | LLM・TTSのキー失効、モデル権限・残高不足、モデル側障害 | 応答しない編 |
| 電話がつながらない/着信しない | 番号未割り当て、プロバイダ連携の不備、地域・国際発着信の制限 | つながらない編 |
| 応答までが遅い(間が長い) | 重いモデルや音声の組み合わせ、地域、ネットワーク | レイテンシ編 |
| 音声が途切れる/会話がかぶる | 割り込み(interruption)・無音検出のしきい値設定 | 割り込み編 |
| 連携(関数呼び出し)が動かない | WebhookのURL・認証・タイムアウト・応答形式 | Webhook編 |
| 聞き取りがおかしい/文字起こしがズレる | 言語設定の不一致、ノイズ、マイク権限 | STT編 |
| 通話が始まった瞬間に終わる | 支払い・残高・不正検知ブロック、設定の欠落 | 即終了編 |

Vapiとは:音声AIエージェントを作って運用する開発者向け基盤
Vapi(バピ)は、電話やアプリ、Web上で「しゃべって会話するボット(音声AIエージェント)」を作って運用できる開発者向けのプラットフォームとされています。予約受付の電話対応や、サポート窓口の一次受け、アウトバウンドの架電など、これまで人が話していた音声のやりとりを自動化する用途で使われるとされています。
3つの部品を組み合わせる仕組み
Vapiの中心にある考え方は、音声AIエージェントを3つの部品の組み合わせとして捉えることだとされています。すなわち、相手の声を文字に変える音声認識(STT)、文字をもとに何を返すか考える大規模言語モデル(LLM)、そして返答を音声に変える音声合成(TTS)です。Vapiはこれらを橋渡しし、低遅延でテンポよく会話が成立するよう調整する「土台(インフラ)」の役割を担うとされています。
この構造を理解しておくと、トラブルの切り分けが一気に楽になります。「黙る」「聞き取れない」「読み上げない」といった症状は、それぞれSTT・LLM・TTSのどの部品で詰まっているかに対応づけて考えられるからです。本記事の各章も、おおむねこの部品の切り分けに沿って並べています。
もう少し具体的に言うと、会話は「相手が話す→STTが文字に変える→LLMが返答を考える→TTSが音声にする→相手に届く」という一本の流れで進みます。どこか一か所が止まれば、その先はすべて止まって見えます。たとえば「こちらが何を言っても反応しない」ならSTTかその手前の入力、「考えてはいそうだが声が出ない」ならTTS、「聞き取りも読み上げもできるのに返答がおかしい」ならLLMやプロンプト、というように、症状の出方から詰まっている場所を推理できます。エラーメッセージが曖昧なときほど、この「流れのどこで止まったか」という視点が効きます。
電話番号やAPIとつなげられる
Vapiでは、エージェントに電話番号を割り当てて電話で動かすことや、Webやアプリに組み込んで動かすこと、さらに各種APIやWebhookを通じて外部システムと連携(関数呼び出し)させることができるとされています。たとえば「在庫を調べる」「予約を登録する」といった処理を、会話の途中で自社のサーバーに問い合わせる、という使い方です。
電話で使う場合は、TwilioのようなSIP/電話番号のプロバイダと連携する形が一般的とされていますが、Vapi側で番号を扱える経路も含め、提供形態は更新されることがあります。具体的な連携方法は、お使いの構成と最新の公式情報をご確認ください。
無料の範囲と有料(従量・クレジット)がある
Vapiには無料で試せる範囲と、利用量に応じた有料(従量・クレジット)の仕組みがあるとされています。注意したいのは、Vapi本体のオーケストレーション費用に加えて、裏で使うLLM・TTS・STTといった外部サービスの利用料が別途かかるのが基本という点です。つまり「Vapiの料金」だけでなく「組み合わせた各社の料金」も積み上がる構造、と理解しておくのが安全です。
無料枠の有無や具体的な金額・クレジットの単価は変動しますので、正確な額は必ずVapiおよび各モデル提供元の公式の料金ページでご確認ください。本記事では具体的な金額は扱いません。なお、UIや公式資料は英語中心とされており、設定項目名も英語で表示されることが多い点も覚えておくと、画面を探しやすくなります。「割り込み」は interruption、「終了理由」は ended reason、「文字起こし」は transcriber、というように、本記事で日本語にしている用語の英語表記を頭に入れておくと、英語のドキュメントや画面でも目的の項目にたどり着きやすくなります。
料金面でもう一点だけ補足すると、「うまく動かない」原因が料金・残高まわりであることは想像以上に多い、という点です。クレジットが尽きていた、クレジットカードの有効期限が切れていた、自動チャージ(オートリロード)を切っていた、といった単純な理由で通話が止まることは珍しくありません。技術的な設定をいじり始める前に、まず残高と支払い方法が生きているかを確認するだけで、解決してしまうケースもあります。
応答しない編:エージェントが黙る・途中で止まるとき
「通話はつながっているのに、挨拶のあとエージェントが黙ってしまう」「一度だけ答えてその後反応しない」といった症状は、Vapiのトラブルの中でも代表的なものとされています。この場合、まず疑うべきは裏側の部品(LLM・TTS・STT)のどこかが応答していないことです。
ここで一つ覚えておきたいのが、「最初の挨拶までは話せるか」という観察ポイントです。最初の決まり文句(冒頭のあいさつ)は、相手の発話やLLMの応答を待たずに再生できる構成になっていることがあり、ここが鳴るかどうかで切り分けが進みます。挨拶すら鳴らないならTTSや音声まわり、挨拶は鳴るのにその後が続かないならLLMやSTTの側、というように、症状が出るタイミングそのものが手がかりになります。やみくもに全部を疑う前に、「どこまでは動いていたか」を一度整理してみてください。
1. APIキーと残高・プランを確認する
最初に確認すべきは、各部品のAPIキーとアカウントの残高です。次の順で見ていくと切り分けやすくなります。
- LLMのAPIキーが有効かを確認する。挨拶までは話せるのにそのあと黙るパターンは、LLMに到達できていない(キー失効・権限不足・モデル側障害)ケースが多いとされています。
- TTS(音声合成)のキーと音声ID・残高を確認する。考えてはいるのに「声が出ない」場合、音声合成側の認証や残高、指定した音声IDの不一致が疑われます。
- Vapiアカウントの残高(クレジット)とプランを確認する。残高不足や支払い方法の問題、同時通話数の上限に達していると、通話が成立しないことがあるとされています。
キーを再設定したら、ダッシュボードの「Talk to Assistant(エージェントと話す)」のようなテスト機能で、ネットワーク要因を除いた状態で試すと、原因がキー側かどうかを切り分けやすくなります。
2. モデル・音声・文字起こしの設定を見直す
キーが有効でも、指定そのものが間違っていれば動きません。具体的には次を確認します。
- モデルの選択が適切か(存在しないモデル名や、アカウントで使えないモデルを指定していないか)。
- 音声IDが、その音声プロバイダのアカウントに実在するか。
- 文字起こし(STT)の言語設定が、実際の会話言語と合っているか。
これらは「設定の打ち間違い」で起きることも多く、コピー&ペーストのつもりが古い値のまま、というケースもよくあります。一つずつ最新の値に直していきましょう。特に、提供元側でモデルや音声の名称・識別子が変わった場合、こちらの設定が古いままだと「以前は動いていたのに急に止まった」という形で表面化します。長く運用しているエージェントほど、設定が当時のまま取り残されていないかを定期的に見直す価値があります。
3. フォールバック(予備の提供元)を用意しておく
Vapiでは、ある提供元で軽微なエラーが起きたときに、自動で別の提供元へ切り替えるフォールバックを設定できるとされています。モデルやTTS、STTに予備を用意しておくと、片方が一時的に不調でも通話が途切れにくくなる、という考え方です。本番運用では検討する価値があります。具体的な設定方法は公式ドキュメントをご確認ください。
4. 通話ログの「終了理由」を見る
Vapiでは、通話ごとに終了理由(Ended Reason)が記録されるとされています。ダッシュボードの通話ログ(Call Logs)で、その通話がなぜ終わったのかを示すコードを確認できます。「黙る」症状でも、ログ上は「無音タイムアウト」や「LLMに到達できなかった」など、より具体的な手がかりが残っていることが多いので、推測の前にまずログを見るのが確実です。
つながらない編:電話がつながらない・着信しないとき
「電話をかけても鳴らない」「外から番号に発信しても着信しない」「通話が始まった瞬間に終わってしまう」といった症状は、電話番号とプロバイダ連携のどこかに原因があることが多いとされています。
1. 電話番号の割り当てと有効化を確認する
まず、エージェントに電話番号が正しく割り当てられ、有効になっているかを確認します。番号を取り込んだ(インポートした)つもりでも、有効化やエージェントとの紐付けが完了していないと、鳴らないことがあります。次の点を順に見てください。
- 番号がアカウントに取り込まれ、ステータスが有効になっているか。
- その番号が、動かしたいエージェント(またはサーバーURL)に紐付いているか。
- 必要な設定項目が欠けていないか(設定の欠落があると、通話が即終了することがあるとされています)。
2. プロバイダ連携(SIP・番号)を確認する
電話の経路には、TwilioなどのSIP/番号プロバイダが関わることが多いとされています。Vapi側だけでなく、プロバイダ側のダッシュボードもあわせて確認しましょう。
- SIPの認証情報(クレデンシャル)が正しいか。
- 発信先・着信先として許可された宛先になっているか。
- プロバイダ側の残高や支払いに問題がないか。
「Vapi側は正常に見えるのに鳴らない」ときは、プロバイダ側でブロックや制限がかかっていることが少なくありません。両方のログを突き合わせるのが近道です。
3. 地域・国際発着信の制限を確認する
国や地域によっては、国際発着信の対応状況や規制が異なります。その番号が国際通話に対応しているか、対象の国・地域が許可されているか、日次の発信上限に達していないか、といった点も確認しましょう。地域に関する仕様は変わりやすいため、対応可否は最新の公式情報とプロバイダの規定をご確認ください。
4. 不正検知ブロックの可能性も考える
通話が「作成された直後にほぼ0秒で終了する」ような場合、支払いの失敗や残高不足に加えて、不正検知(fraud detection)によるブロックが働いている可能性もあるとされています。短時間に大量の発信を行った、見慣れない宛先へ発信した、といった挙動が安全装置に引っかかることがあります。心当たりがなくても、ログの終了理由を確認し、必要に応じてサポートに問い合わせるとよいでしょう。
5. 同時通話数の上限を確認する
プランによっては、同時に処理できる通話の数(同時実行数)に上限があるとされています。テストでは問題なくても、実運用で着信が重なった途端につながらなくなる、という場合は、この上限に達している可能性があります。アクセスが集中する時間帯に症状が出るなら、まずここを疑い、必要に応じてプランの見直しを検討しましょう。上限の具体値や引き上げ方法は、最新の公式情報とプランの内容をご確認ください。
レイテンシ編:応答までが遅い・間が長いとき
会話として致命的ではないものの、ユーザー体験を大きく損ねるのが「応答までの間(レイテンシ)が長い」問題です。人どうしの会話は応答が速いほど自然に感じられるため、ここは丁寧に詰めたいポイントです。
1. モデルと音声の「組み合わせ」を見直す
レイテンシは、使っているLLM・TTS・STTの組み合わせに大きく左右されるとされています。高性能で重いモデルほど、考える時間がかかり、応答が遅くなりがちです。会話の用途によっては、必ずしも最上位のモデルが最適とは限りません。
- 受け答えの内容がそこまで複雑でないなら、より軽量・低遅延のモデルに変えて体感速度を比べてみる。
- TTSも、声質と速度はトレードオフになりやすいので、用途に合う音声を選び直す。
「重いモデルにすれば賢くなるが遅くなる」「軽いモデルにすれば速いが受け答えが浅くなる」というバランスを、実際の通話を聞きながら調整していくのが現実的です。
2. 地域・ネットワークを確認する
処理が行われる地域(リージョン)や、利用者のネットワーク環境もレイテンシに影響します。安定した回線で試す、ファイアウォールでWebSocket接続がブロックされていないかを確認する、といった基本も忘れずに。社内ネットワークなどでは、通信が途中で遮られていることもあります。
3. システムプロンプトを整理する
毎ターンLLMに渡す指示文(システムプロンプト)が極端に長いと、処理に時間がかかることがあります。指示は具体的にしつつも、冗長な部分を削って必要十分な長さに保つと、速度と精度の両面で効くことがあります。同じ内容を別の言い回しで何度も書いている、使っていない例文が大量に残っている、といった部分は思い切って整理しましょう。
4. 「考えている間」を埋める工夫を検討する
レイテンシをゼロにするのは難しいため、待ち時間を不自然に感じさせない工夫も有効です。Vapiには、処理に時間がかかるときに「はい」「少々お待ちください」といった短い相づち(バックチャネル)を挟む仕組みがあるとされています。完全に無音の数秒は長く感じられますが、ひとことあるだけで体感は大きく変わります。こうした機能の有無や設定方法は更新されることがあるため、最新の公式情報をご確認ください。
5. 最大トークン数や出力の長さも見る
LLMに長い返答を生成させる設定になっていると、その分だけ話し始めるまで時間がかかることがあります。一度の発話が長くなりすぎないよう、返答の長さやトークン数の設定を見直すのも一案です。会話としては、長々と話すより、短く区切って相手の反応を待つほうが自然に感じられることが多いものです。

割り込み編:音声が途切れる・会話がかぶるとき
「エージェントが話している最中にこちらが話すと、うまく止まってくれない」「逆にすぐ黙ってしまう」「無音が続くと勝手に切れる」といった症状は、割り込み(interruption)や無音検出のしきい値の設定に関係していることが多いとされています。
1. 割り込み(interruption)の設定を調整する
Vapiには、利用者がエージェントの発話中に話し始めたとき、会話の流れを壊さずに割り込みを受け付ける仕組みがあるとされています。この感度が強すぎると、ちょっとした相づちや雑音でもエージェントが止まってしまい、逆に弱すぎると、こちらが話してもなかなか止まらず会話がかぶります。実際の通話を聞きながら、しきい値を少しずつ調整するのが基本です。
2. 無音(沈黙)タイムアウトを確認する
Vapiでは、一定時間こちらの発話が検出されないと通話が自動で終了する無音タイムアウトがあるとされています。標準では一定の秒数(目安として数十秒程度とされることがあります)で、これが短すぎると、考えている間に切れてしまうことがあります。会話の性質に合わせて、この時間を見直しましょう。なお具体的な秒数は変更される可能性があるため、最新値は公式ドキュメントをご確認ください。
3. マイク・音声入力の品質を確認する
「割り込みがうまくいかない」原因が、実は音声入力の品質にあることもあります。Web/アプリ経由ならマイクの権限が許可されているか、ノイズが多い環境で使っていないか、を確認しましょう。入力がうまく拾えていないと、割り込み判定も無音判定も狂いやすくなります。エアコンの音やキーボードの打鍵音、テレビの音声などが、本人の発話と誤認されて割り込みが暴発する、というのもよくある話です。
4. 用途に合わせて感度の方向性を決める
割り込みの最適なしきい値は、用途によって変わります。たとえば、急いでいる利用者が多いサポート窓口なら、少し強引にでも割り込みを受け付けたほうが快適に感じられるかもしれません。一方、固定の案内をしっかり最後まで聞いてほしい場面では、簡単には止まらないほうが都合がよいこともあります。「止まりやすさ」をどちらに振るかを先に決めてから、しきい値を調整すると、迷いが減ります。実際の利用者を想定したテスト通話を何度か行い、違和感のない着地点を探していきましょう。
Webhook編:連携(関数呼び出し)が動かないとき
会話の途中で自社サーバーに問い合わせる「連携(関数呼び出し/ツール)」が動かないときは、Webhook(サーバーURL)の設定を中心に確認します。サーバーURLを使って動的にエージェント設定を返す構成の場合、ここがつまずくと通話そのものが始まらないこともあるとされています。連携は、Vapiと自社サーバーという「二者間の約束事」で成り立っているため、どちらか片方の認識がずれているだけで成立しなくなります。だからこそ、片側だけを見て原因を決めつけないことが大切です。
1. URLと到達性を確認する
- 設定したWebhook(サーバー)のURLが正しいか、タイプミスがないか。
- そのサーバーが起動していて、外部から到達できる状態か(ローカル環境ならトンネリング等が必要なことがあります)。
- サーバーが、Vapiの期待する正しい形式で応答を返しているか。形式が崩れていると、設定が読み取れず通話が開始できないことがあります。
2. 認証とタイムアウトを確認する
Webhookに認証をかけている場合、その認証情報が正しく渡っているかを確認します。また、サーバーの応答が遅いとタイムアウトで失敗することがあるため、処理を軽くするか、許容時間を見直すことを検討します。会話の途中で重いデータベース処理や外部問い合わせを同期的に行っていると、その待ち時間がそのまま会話の沈黙になり、利用者を不安にさせます。時間のかかる処理は、可能なら軽く返しておいて裏で続ける、といった設計上の工夫も検討の余地があります。
3. ログでリクエストと応答を突き合わせる
Vapiには、APIリクエスト/レスポンスやWebhookの送達(レスポンスコードや所要時間を含む)を確認できる仕組みがあるとされています。これと自社サーバー側のログを突き合わせれば、「Vapiは送ったが、サーバーがエラーを返した」のか「そもそも届いていない」のかを切り分けられます。連携の不具合は、両方のログを見ない限り推測の域を出ません。
4. サンプルのペイロードでテストする
連携(ツール)のセクションから、サンプルのデータ(ペイロード)を送ってテストできるとされています。実際の通話を回す前に、これでパラメータの抽出や応答が想定どおりかを確認しておくと、原因の切り分けが早くなります。引数(変数)の抽出がうまくいかないときは、各項目の説明を具体的にし、選択肢(列挙値)を明確に区別できるようにすると改善することがあります。
STT編:文字起こし(聞き取り)の精度が低いとき
「こちらの言葉を正しく聞き取ってくれない」「言っていないことに反応する」といった症状は、音声認識(STT)まわりの問題であることが多いとされています。STTが入力をうまく拾えないと、その先のLLMもTTSも空回りします。
1. 言語設定を実際の会話に合わせる
最も多いのが言語設定の不一致です。日本語で会話するのに英語などの設定になっていると、当然ながら聞き取りはズレます。STTの言語設定を、実際に話す言語に正しく合わせることを最初に確認しましょう。
2. ノイズとマイクを確認する
周囲のノイズが多い、マイクが遠い・品質が低いといった環境要因も、聞き取り精度を大きく下げます。可能なら静かな環境で、適切なマイクを使って試し、Web/アプリ経由ならマイク権限が許可されているかも確認します。
3. 文字起こしモデルと権限を確認する
使っている文字起こしモデル(transcriber)の選択と、そのAPIキー・権限が正しいかも確認します。モデルにアクセスできていない、あるいは設定が古いままだと、精度以前にそもそも文字起こしが機能しないことがあります。
4. システムプロンプトで意図のヒントを与える
聞き取った文字をどう解釈するかは、LLMへの指示にも左右されます。よく出てくる固有名詞や想定される言い回しをシステムプロンプトであらかじめ伝えておくと、多少の聞き取りのブレを補って、意図を正しく汲み取りやすくなることがあります。たとえば自社のサービス名や商品名、専門用語などは、文字起こしが多少崩れても文脈で補正できるよう、あらかじめ候補として書いておくと安定しやすくなります。
5. 数字・記号・固有名詞の扱いに注意する
電話番号や予約番号、メールアドレスのような数字や記号が連続する情報は、音声では特に聞き取りが難しい部分です。一気に言われると取りこぼしやすいため、会話の設計として「一区切りずつ復唱して確認する」「桁数が合っているかを確かめる」といった流れを入れておくと、聞き取り精度そのものに頼りきらずに済みます。これはVapiの設定というより会話設計の工夫ですが、実運用ではトラブルを大きく減らせる勘所です。
即終了編:通話が始まった瞬間に終わるとき
「発信した直後に通話が終わる」「ログ上は作成されてすぐ終了している」という症状は、これまで触れてきた原因が複合していることが多いとされています。落ち着いて次を確認しましょう。
- 残高・支払い・プラン:残高不足、支払い方法の問題、同時通話数の上限。
- 設定の欠落:必須項目が空のまま、エージェントIDかサーバーURLのどちらかが指定されていない。
- 不正検知ブロック:安全装置が働いている可能性。
- サーバーURLの応答:動的設定を返すサーバーが、正しい形式・時間内に応答できていない。
これらは、いずれも通話ログの終了理由(Ended Reason)にヒントが出ていることが多い領域です。まずはログのコードを確認し、そこから該当する章へ戻って深掘りするのが効率的です。
うまくいかないときの進め方
ここまで試しても解決しないときは、闇雲に設定を変えるのではなく、切り分けの順番を意識すると無駄が減ります。おすすめの進め方を整理します。
0. 症状を言葉にして書き出す
遠回りに見えますが、最初に症状を具体的な言葉にして書き出すと、原因への近道になります。「動かない」ではなく、「電話はつながるが、挨拶のあと無音になり、約30秒で切れる」というレベルまで具体化すると、それだけでどの章を見ればよいかが絞れます。いつから・どの操作のあと・どの程度の頻度で起きるか、直前に何か設定を変えたか、もあわせて書いておくと、原因の見当がつきやすくなります。
1. まずダッシュボードのテスト機能で再現する
電話やアプリを介すと、原因がVapi側なのか通信側なのか分かりにくくなります。Vapiのダッシュボードには「Talk to Assistant」や「Call」のようにブラウザ上で直接試せる機能があるとされており、これを使うとネットワーク要因を除いた状態で挙動を確認できます。ここで再現するなら設定側、ここでは正常なら経路側、という切り分けができます。電話だと再現するのにダッシュボードでは正常、という場合は、エージェントそのものより、電話番号やプロバイダ連携を重点的に見ていくとよいでしょう。
2. 通話ログと終了理由を最優先で見る
本記事で繰り返してきたとおり、通話ログ(Call Logs)と終了理由(Ended Reason)は最も確実な手がかりです。転記や記憶に頼らず、実際のコードと、その通話のID・時刻を控えておきましょう。問い合わせの際にもこの情報が役立ちます。
3. 各提供元のステータスページを確認する
自分の設定が正しくても、裏で使うLLM・TTS・STTの提供元側で障害(outage)が起きていることがあります。各社のステータスページを確認し、広範な障害が出ていないかをチェックしましょう。提供元側の問題なら、待つか、フォールバックに切り替えるのが現実的です。特定の時間帯だけ調子が悪い、ある日を境に急に不安定になった、という場合は、自分の設定変更よりも提供元側のイベントを疑うほうが当たることがあります。
4. 一度に一か所だけ変える
切り分けで最もやってはいけないのが、複数の設定を同時に変えることです。モデルも音声も割り込みのしきい値も一気に変えてしまうと、仮に直っても「何が効いたのか」が分からず、再発したときに振り出しに戻ってしまいます。面倒でも一度に一か所だけ変え、そのつどテスト通話で結果を確認する、という地道なやり方が、結局は最短になります。変更前の設定はメモやスクリーンショットで控えておくと、戻すときに安心です。
5. 公式ドキュメント・サポートを使う
最終的には、最新の正確な情報は公式ドキュメント(docs.vapi.ai)にあります。仕様やUI、対応状況は更新が速いため、本記事と画面が食い違う場合は公式を優先してください。コミュニティ(Discordなど)やサポートに相談するときは、通話ID・時刻・期待した挙動と実際の挙動をセットで伝えると、解決が早まるとされています。
🛒 関連商品をAmazonでチェック
よくある質問(FAQ)
Q1. Vapiは無料で使えますか?
無料で試せる範囲があるとされていますが、注意したいのは、Vapi本体の費用に加えて、裏で使うLLM・TTS・STTといった外部サービスの利用料が別途かかる点です。無料枠の有無や金額は変動しますので、正確な内容は必ずVapiおよび各提供元の公式の料金ページでご確認ください。
Q2. 挨拶のあとエージェントが急に黙ります。何を見ればよいですか?
この症状は、LLMに到達できていない(キー失効・権限不足・残高不足・モデル側障害)ケースが多いとされています。まずLLM・TTSのAPIキーとアカウント残高を確認し、ダッシュボードのテスト機能で再現するか試したうえで、通話ログの終了理由を確認してください。
Q3. 電話が鳴りません。どこから確認すればよいですか?
電話番号がエージェントに正しく割り当てられ有効になっているか、TwilioなどのSIP/番号プロバイダ連携の認証情報と許可された宛先が正しいか、地域・国際発着信の制限に当たっていないかを順に確認します。Vapi側とプロバイダ側の両方のログを突き合わせるのが近道です。
Q4. 応答までの間が長くて不自然です。改善できますか?
レイテンシは、使っているモデルや音声の組み合わせ、地域、ネットワークに左右されるとされています。用途に対して過剰に重いモデルを使っている場合は、より軽量・低遅延のモデルに変えて体感速度を比べてみてください。回線やファイアウォール(WebSocketの遮断)の確認も有効です。
Q5. 会話がかぶる・すぐ黙るのですが、設定で直りますか?
割り込み(interruption)の感度や無音検出のしきい値が関係していることが多いとされています。感度が強すぎると相づちでも止まり、弱すぎると止まりません。実際の通話を聞きながら少しずつ調整し、あわせてマイク権限や入力品質も確認してください。
Q6. Webhook(連携)が動きません。何を疑えばよいですか?
サーバーURLが正しいか、サーバーが起動して外部から到達できるか、Vapiが期待する形式で時間内に応答できているか、認証情報が正しく渡っているかを確認します。Vapi側のWebhook送達ログと自社サーバー側のログを突き合わせ、「届いていない」のか「エラーを返している」のかを切り分けてください。
Q7. 日本語の聞き取り精度が低いです。どうすればよいですか?
まず文字起こし(STT)の言語設定が日本語になっているかを確認します。次にノイズの少ない環境・適切なマイク・マイク権限を整え、文字起こしモデルの選択とキー・権限を確認します。よく使う固有名詞をシステムプロンプトで伝えておくと、解釈のブレを補える場合があります。
Q8. 設定は合っているはずなのに動きません。最終的にどうすれば?
各提供元(LLM・TTS・STTなど)のステータスページで障害が出ていないかを確認し、問題なければ公式ドキュメント(docs.vapi.ai)で最新仕様を確認してください。それでも解決しない場合は、通話ID・時刻・期待した挙動と実際の挙動を添えて、コミュニティやサポートに相談すると解決が早まるとされています。
📚 あわせて読みたい
まとめ:層を分けて、ログから攻める
Vapi(バピ)のトラブルは、一見すると「動かない」の一言でも、実体はLLM・TTS・STT・電話番号・プロバイダ・Webhookという複数の層のどこかで詰まっていることがほとんどです。だからこそ、本記事では影響範囲の大きい順に「APIキーと残高」「番号と連携」「ログと終了理由」を入口に置きました。
最後に、押さえておきたい勘所を振り返ります。
- 挨拶のあと黙る系は、まずLLM・TTSのキーと残高を疑う。
- つながらない系は、番号の割り当てとプロバイダ連携をVapiとプロバイダの両側で確認する。
- 遅い・かぶる系は、モデルや音声の組み合わせ・割り込みのしきい値を実際の通話で調整する。
- 連携が動かない系は、Webhookのログ突き合わせで「届いていない」か「エラー応答」かを分ける。
- 困ったら、推測の前に通話ログの終了理由(Ended Reason)を見る。
Vapiは仕様やUI、料金、対応状況の更新が速いプラットフォームです。本記事の手順は「あたりの付け方」としてお使いいただき、メニュー名や数値・金額・対応可否といった細部は、必ず最新の公式ドキュメント(docs.vapi.ai)と各提供元の情報でご確認ください。層を分けて、ログから攻める。この姿勢で臨めば、複雑に見えるトラブルも一つずつ着実に切り分けられるはずです。
minto.tech スマホ(Android/iPhone)・PC(Mac/Windows)の便利情報をお届け! 月間アクセス160万PV!スマートフォン、タブレット、パソコン、地デジに関する素朴な疑問や、困ったこと、ノウハウ、コツなどが満載のお助け記事サイトはこちら!