试了一下秘塔新发布的深度研究,这是首个在国内免费提供的深度研究产品
他们在除了免费、准确性高以外,在体验上也做了非常多的优化#ai创造营#
AI 搜索或者 AI 深度研究最重要的就是减少模型幻觉,提高搜索结果和推理结果的准确性。
一般大家都会从两个部分进行优化:
首先就是通过算法和模型真的提高搜索结果和信息获取的准确性,然后加上模型验证等方式降低模型幻觉。
由于我们无法彻底根除模型幻觉,第二个方式就是通过各种交互和展示帮助用户低成本快速的完成信息的验证,给用户信心。
首先秘塔为了降低成本同时保障准确性做了很多工作。
他们将深度研究拆分为多个子任务进行分段强化学习,从而大幅降低了降低资源消耗,又能维持非常高的准确性。在BrowseComp等评测集上也体现了这一点。
然后在通过交互和展示帮助用户快速完成信息验证增强信心的方面。
秘塔这次用一种非常新颖的交互打开了深度研究算法的黑箱,让用户直观的看到了模型在执行任务过程中的动态“问题链”本身。
这个可以说是在搜索结果后面增加标注后的另一个非常重要的 AI 产品交互创新了。
产品交互分为三部分:顶部预览实时展示模型搜索进度和原因,左下 Console 滚动显示搜索摘要,右下总览视图方便定位流程位置。
每步推理用颜色卡片区分:绿色为结论明确,紫色需继续推理,橙色信息待补充。卡片连线标注分支原因,便于理解推理流程。
除了帮你理解过程外,秘塔深度研究还有一个优势是在研究结果的表现上。
不仅有文字,还支持多模态展示,并可点击按钮生成播客式语音讲解,方便随时核实内容。
数字标注悬停时会高亮引用卡片,还能生成语音讲解。PDF 用红色、视频用粉色标记,PDF 可侧边栏直接展开对照。
最后你还可以基于搜索结果生成可互动的研究报告网页,里面除了文字和可视化排版外,他还会搜索对应主题的图片和视频填充进去丰富内容。
说完了这么多交互和产品设计上的创新和优化,我们来看看最核心的搜索结果怎么样。
首先是最近闹得很热的关于娃哈哈宗庆后遗产分配的案子。搜索结果简明梳理了娃哈哈宗庆后遗产案的争议点,按时间线清晰展示事件经过,并分析了后续影响,内容全面且结构清晰。
最近稳定币很火,但是为啥 Web 3 很多国家都在打击,这个东西也是基于 web3 但又好像变合法了,都是不太清楚的。
他们在除了免费、准确性高以外,在体验上也做了非常多的优化#ai创造营#
AI 搜索或者 AI 深度研究最重要的就是减少模型幻觉,提高搜索结果和推理结果的准确性。
一般大家都会从两个部分进行优化:
首先就是通过算法和模型真的提高搜索结果和信息获取的准确性,然后加上模型验证等方式降低模型幻觉。
由于我们无法彻底根除模型幻觉,第二个方式就是通过各种交互和展示帮助用户低成本快速的完成信息的验证,给用户信心。
首先秘塔为了降低成本同时保障准确性做了很多工作。
他们将深度研究拆分为多个子任务进行分段强化学习,从而大幅降低了降低资源消耗,又能维持非常高的准确性。在BrowseComp等评测集上也体现了这一点。
然后在通过交互和展示帮助用户快速完成信息验证增强信心的方面。
秘塔这次用一种非常新颖的交互打开了深度研究算法的黑箱,让用户直观的看到了模型在执行任务过程中的动态“问题链”本身。
这个可以说是在搜索结果后面增加标注后的另一个非常重要的 AI 产品交互创新了。
产品交互分为三部分:顶部预览实时展示模型搜索进度和原因,左下 Console 滚动显示搜索摘要,右下总览视图方便定位流程位置。
每步推理用颜色卡片区分:绿色为结论明确,紫色需继续推理,橙色信息待补充。卡片连线标注分支原因,便于理解推理流程。
除了帮你理解过程外,秘塔深度研究还有一个优势是在研究结果的表现上。
不仅有文字,还支持多模态展示,并可点击按钮生成播客式语音讲解,方便随时核实内容。
数字标注悬停时会高亮引用卡片,还能生成语音讲解。PDF 用红色、视频用粉色标记,PDF 可侧边栏直接展开对照。
最后你还可以基于搜索结果生成可互动的研究报告网页,里面除了文字和可视化排版外,他还会搜索对应主题的图片和视频填充进去丰富内容。
说完了这么多交互和产品设计上的创新和优化,我们来看看最核心的搜索结果怎么样。
首先是最近闹得很热的关于娃哈哈宗庆后遗产分配的案子。搜索结果简明梳理了娃哈哈宗庆后遗产案的争议点,按时间线清晰展示事件经过,并分析了后续影响,内容全面且结构清晰。
最近稳定币很火,但是为啥 Web 3 很多国家都在打击,这个东西也是基于 web3 但又好像变合法了,都是不太清楚的。