我們創立 WaveKat 源於一個簡單的信念:
每一家小企業都值得擁有大公司般的聲音。
小企業會錯過來電。它們負擔不起櫃台,也請不起 24/7 的接聽服務。與此同時,大型企業卻部署著每天處理上千通通話的精密語音 AI。這道鴻溝本不該存在。
我們正在打造什麼
WaveKat 正在打造即時語音 AI 的工具。我們從一組開源函式庫開始:
- wavekat-core —— 共享的音訊元件,例如
AudioFrame和取樣格式轉換 - wavekat-vad —— 支援多種後端的語音活動偵測(WebRTC、Silero 等)
- wavekat-turn —— 知道說話者何時講完的輪次偵測
- wavekat-lab —— 用於測試和比較音訊後端的互動式儀表板
在這些函式庫之上,我們正在打造 wavekat-voice —— 一套接入標準 SIP/RTP 基礎設施的 AI 電話接聽系統。它會接起電話、進行真實的對話並處理通話 —— 這樣企業主就無需親自應對。
為什麼從開源開始?
我們相信,基礎性的技術 —— VAD、輪次偵測、音訊處理 —— 應當是開放的、可稽核的,並且可以自由地在其上打造。這些元件不該被鎖在企業合約的背後。
接下來呢
我們正埋頭開發。歡迎在 GitHub 上關注我們,或者常回這裡看看 —— 我們會撰寫關於即時語音背後的工程實踐、我們正在做的權衡,以及我們一路上學到的經驗。