wavekat
語音 文件 部落格
← 返回部落格

讓你的 AI 助理撥打真實電話

· Eason Guo
#語音AI #自動化 #AI智慧代理

WaveKat Voice 現在附帶了一個命令列工具,讓你信任的程式——包括像 Claude 這樣的 AI 助理——可以替你撥打和管理真實電話。讓你的助理「打給牙醫,等到有人接聽為止」,它就會透過你已經打開的應用程式撥號、跟進通話,並告訴你結果如何。今天它已內建於 Mac 和 Linux 上的應用程式中,並且在你手動開啟之前一直處於關閉狀態。

這是邁向我們始終念念不忘的目標的下一步:讓每一家小企業都擁有大企業的聲音。大公司有總機和驅動總機的軟體。現在,你的電腦——以及執行在它上面的助理——就可以成為那個總機。

它究竟能做什麼

WaveKat Voice 一直在背景靜靜執行著一部電話:它向你的 SIP 供應商註冊並處理通話。新增的是驅動它的第二種方式——一個名為 wavekat-voice 的命令,它與正在執行的應用程式通訊。

為了把邊界講清楚,因為這很重要:

所以助理是撥號盤上的手,而不是線路上的聲音。這是一條經過深思熟慮的、誠實的界線——而對於日常那些「幫我接通一個真人」的瑣事來說,它已經滿足了你真正想要的大部分需求。

Ubuntu 上的 WaveKat Voice——助理發起的通話正在進行,旁邊顯示即時逐字稿。

沒有任何東西需要安裝

wavekat-voice 命令就是執行該應用程式的同一個程式——在你安裝 WaveKat Voice 的那一刻,它就已經在你的磁碟上了。沒有第二次下載,沒有單獨的安裝套件,也沒有可能與應用程式脫節的版本。

預設關閉。當自動化處於開啟狀態時,你在電腦上執行的任何程式都可以透過你的帳戶撥打電話——而通話可能會產生費用——所以我們把這個決定交給你。在 設定 → 自動化(Settings → Automation)中開啟它,那裡還有一個一鍵按鈕,可以把 wavekat-voice 加入到你的 PATH 中,讓任何終端機都能找到它。

Ubuntu 上的 WaveKat Voice——已開啟命令列存取的自動化設定,以及安裝命令列工具的按鈕。

一鍵連接 AI 助理

最快的途徑就是 設定 → 自動化 頁面本身。它會尋找你已經安裝的 AI 助理,並為每一個提供一個 連接(Connect)按鈕。目前涵蓋:

助理如何連接
Claude Desktop、Cursor、Windsurf透過應用程式中綁定的 MCP 伺服器
Claude Code、Codex、Gemini透過在其指令檔案中的一條受管理的備註

一鍵即可接通——無需複製或貼上。之後,你只需讓助理撥打電話即可。有兩點值得了解:有些助理需要完全重新啟動(結束並重新打開)才能辨識新工具;而且連接會保持自身最新——當 WaveKat Voice 在背景更新時,你已連接的任何助理都會被悄悄地保持同步,所以你永遠不必重新連接。

Ubuntu 上的 WaveKat Voice——透過一鍵「連接」按鈕接入 Claude、Cursor 等 AI 助理。

在終端機中是什麼樣子

每個命令都接受 --json 以輸出機器可讀的內容,這正是讓助理能夠輕鬆驅動它的原因。舉幾個例子:

# Is the app running, and which accounts are connected?
wavekat-voice status

# Place a call and wait — the exit code says how it went.
wavekat-voice call +14155550123 --wait
echo "result: $?"

# Find a call that's happening right now, then hang it up.
wavekat-voice call list --json | jq -r '.[0].id' | xargs wavekat-voice call hangup

--wait 的離開碼是指令稿(或助理)據以分支的契約:0 表示已接聽並正常結束,2 表示忙線或被拒接,3 表示失敗或掉線,4 表示無人接聽。無需解析輸出即可知道發生了什麼。

命令依它們作用的對象分組——call 用於撥打和處理通話,recording 用於已儲存的音訊,log 用於活動記錄——而 statusaccounts 以及一個即時的 events 串流位於頂層。執行 wavekat-voice call --help 即可查看完整命令集。

我們為什麼這樣打造它

有幾個我們頗為滿意的選擇:

常見問題

AI 助理能用 WaveKat Voice 撥打電話嗎?

可以。在 WaveKat Voice 中啟用自動化後(設定 → 自動化),像 Claude 這樣的 AI 助理可以透過應用程式的命令列工具或其 MCP 伺服器來撥打、跟進和結束真實電話。助理驅動通話;說話的是你。

是 AI 在通話中說話而不是我嗎?

不是。WaveKat Voice 透過你電腦的麥克風和喇叭路由通話音訊——說話的是你。助理負責撥號、等待接聽、發送選單按鍵音以及掛斷。

使用命令列需要額外安裝任何東西嗎?

不需要。wavekat-voice 命令隨 WaveKat Voice 應用程式一起提供,所以它已經在你的電腦上了。你只需在 設定 → 自動化 中開啟自動化,並可選擇性地點擊「安裝命令列工具(Install command-line tool)」將它加入到你的 PATH 中。

讓自動化一直開著安全嗎?

除非你正在使用,否則請保持關閉。當自動化開啟時,你在電腦上執行的任何程式都可以透過你的帳戶撥打電話,這可能會產生費用。正因如此它預設關閉,而且你隨時可以再次將它關掉。

哪些助理可以一鍵連接?

目前是 Claude Desktop、Claude Code、Cursor、Codex、Gemini 和 Windsurf——桌面助理透過綁定的 MCP 伺服器連接,命令列助理透過一條受管理的指令備註連接。

哪些平台支援這一功能?

WaveKat Voice 目前執行在 Mac 和 Linux 上,Windows 將在有需求時推出。命令列工具和助理整合在這兩個受支援的平台上均可用。

試試看

下載 WaveKat Voice,打開 設定 → 自動化,然後連接你的助理。完整的命令參考——每一個命令、它的 JSON 輸出以及離開碼——都在自動化文件中。

我們才剛剛起步。驅動通話是基礎;一個還能親自維持對話的助理,是這件事接下來要去的方向。

← 返回部落格