我们创立 WaveKat 源于一个简单的信念:
每一家小企业都值得拥有大公司般的声音。
小企业会错过来电。它们负担不起前台,也请不起 24/7 的接听服务。与此同时,大型企业却部署着每天处理上千通通话的精密语音 AI。这道鸿沟本不该存在。
我们正在构建什么
WaveKat 正在打造实时语音 AI 的工具。我们从一组开源库开始:
- wavekat-core —— 共享的音频构件,例如
AudioFrame和采样格式转换 - wavekat-vad —— 支持多种后端的语音活动检测(WebRTC、Silero 等)
- wavekat-turn —— 知道说话者何时讲完的轮次检测
- wavekat-lab —— 用于测试和比较音频后端的交互式仪表盘
在这些库之上,我们正在构建 wavekat-voice —— 一套接入标准 SIP/RTP 基础设施的 AI 电话接听系统。它会接起电话、进行真实的对话并处理通话 —— 这样企业主就无需亲自应对。
为什么从开源开始?
我们相信,基础性的技术 —— VAD、轮次检测、音频处理 —— 应当是开放的、可审计的,并且可以自由地在其上构建。这些构件不该被锁在企业合同的背后。
接下来呢
我们正埋头开发。欢迎在 GitHub 上关注我们,或者常回这里看看 —— 我们会撰写关于实时语音背后的工程实践、我们正在做的权衡,以及我们一路上学到的经验。