这是一个能在你自己电脑上(Mac 和 Win 都支持)完全本地运行的免费语音克隆和生成工具,底层套的是阿里的 Qwen3-TTS 模型。
平时嫌 ElevenLabs 等同类产品订阅太贵的朋友可以直接拿它当平替。因为是纯本地跑,不用联网也不用上传数据,拿来做多角色播客、视频配音,隐私拉满,而且完全免费。目前在 GitHub 上已经攒了 4000 多星了。
我自己用下来觉得声音很自然,但有时候情绪起伏稍微有点平,没有 ElevenLabs 那么充沛。但毕竟是免费白嫖的本地工具,还要啥自行车呢?
🔗 有配音需求的可以去试水:http://voicebox.sh