关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
Notion AI 也作为独立应用发布测试了,看了下也可以切换不同的自定义 agent,给这些大厂和创业公司一年时间,小龙虾只是历史长河中的一个小小插曲。
http://testflight.apple.com/join/m2kxP5cw
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
世间太纷扰,还是看看 Google Cloud 官方的技术小姐姐,讲解《AI Agent 设计模式》吧。相信各位兄弟们都会喜欢,主要是喜欢学习技术。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
自己在家拉屎和随地拉屎的区别

转发 @瓦恁: ai自动发动态是一回事,ai自动评论真人就更不礼貌了
Hume AI 这次开源的 TADA,换了一个更务实的方向:先把不出错、够快、够轻这三件事做到极致。
传统 LLM 做 TTS,一个很大的麻烦就是:文字信息很少,但音频帧特别多,最后就容易上下文爆炸、推理变慢,甚至模型越说越跑偏。
TADA 的解法很直接,就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成,它不是先想好一大段声音再慢慢往外吐,而是每读一个 token,就同步生成对应那一小段语音。
这样做的好处非常现实:速度更快、内存更省,而且从结构上就更不容易胡说八道。我觉得这类设计比单纯堆参数、堆数据更有意思,因为它是在真正解决架构层面的老问。
两个特点:
第一是它够轻,甚至能往手机、边缘设备上放,这意味着以后很多语音能力不一定非要走云端 API,端侧跑起来后,延迟、隐私、成本都会好很多。
第二是它开源得比较彻底,MIT 协议,商用限制也少,这种东西一出来,开发者社区肯定会很快接上,后面不管是 AI 助手、播客生成、有声书、视频配音,还是需要同步字幕的场景,都会有人开始拿它做产品实验。
但是TADA 的强项明显不在“最有情绪、最像真人”,而是在“稳”和“省”。
所以如果追求的是特别强的表演感、拟人感,那可能还是得看更高端的商业模型。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
Back to Top