关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
但代价也是真实的。这块芯片出厂那一刻,它的命运就已经注定。Llama 3.1 8B,就是这个芯片这辈子唯一能做的事。如果明年 Meta 发布了 Llama 4,这块芯片就变成了电子垃圾。如果你发现这个模型有偏见,或者在你的应用场景里效果不好,你不能微调它,不能换别的模型,只能再买一块新芯片。
Taalas 的解决方案是:把定制芯片的周期从一年压缩到两个月。他们和台积电合作,只改变两层金属掩膜,就能为不同的模型生产新芯片。他们声称训练一个模型要花十亿美元,而定制一块这样的芯片只要花一千万。
说到这个团队的背景,确实豪华得有点过分。CEO Ljubisa Bajic 是 Tenstorrent 的创始人,之前在 AMD 和 NVIDIA 都做过架构师。COO Lejla Bajic 是他的妻子,同样是 AMD 和 Tenstorrent 的资深工程师。CTO Drago Ignjatovic 是前 AMD 的 ASIC 设计总监。这三个人加起来,可能设计了过去十年里你用过的一些最重要的芯片。
2022 年,当 Jim Keller 加入 Tenstorrent 并接管公司后,Ljubisa 选择了离开。六个月后,他创立了 Taalas。显然,他和 Keller 对 AI 芯片的未来有不同的看法。Keller 想做一个通用的、可编程的、软件友好的平台,而 Ljubisa 走向了另一个极端:彻底的专用化。
他们刚刚完成了 1.69 亿美元的融资,总融资额 2.19 亿。投资人里有个名字值得注意:Pierre Lamond。这位老爷子是 Fairchild Semiconductor 的元老,红杉资本的前合伙人,被公认为半导体行业的奠基人之一。这样的大佬背书,说明这件事至少在技术逻辑上是成立的。
现在的问题是:市场会买单吗?
Taalas 需要找到那些愿意为了效率和成本,牺牲灵活性的场景。比如语音助手,需要毫秒级响应,而且模型不需要经常换。比如数据标注,需要处理海量文本,用的是固定模型。比如一些垂直领域的专用模型,训练好了就不动了。
但也有人不看好。芯片制造是有污染的,如果每两年就要换一批芯片,这比 GPU 的更新换代更频繁,环保问题怎么算?还有人质疑,AI 模型进化这么快,两个月流片时间还是太长,等你做出来,模型可能已经过时了。
更根本的问题是:当 OpenAI、Google、Anthropic 都在拼命证明他们的新模型比旧模型好得多的时候,谁会愿意把自己锁死在一个固定的模型上?
Taalas 的反驳是:模型迭代的周期正在变长,人们开始依恋特定的版本。OpenAI 把用户从 GPT-4.5 迁移到 GPT-5 的时候,很多人抱怨新版本太谄媚了。也许未来我们会像对待手机型号一样对待 AI 模型:iPhone 15 出来后,还是有人用 iPhone 14,因为它们各有各的好。
我不知道 Taalas 会不会成功。这可能是一家改变行业的公司,也可能是一个技术史上有趣的注脚。
感兴趣的朋友可以去他们的demo站点体验一下什么是光速级别的inference:
chatjimmy.ai
Taalas 的解决方案是:把定制芯片的周期从一年压缩到两个月。他们和台积电合作,只改变两层金属掩膜,就能为不同的模型生产新芯片。他们声称训练一个模型要花十亿美元,而定制一块这样的芯片只要花一千万。
说到这个团队的背景,确实豪华得有点过分。CEO Ljubisa Bajic 是 Tenstorrent 的创始人,之前在 AMD 和 NVIDIA 都做过架构师。COO Lejla Bajic 是他的妻子,同样是 AMD 和 Tenstorrent 的资深工程师。CTO Drago Ignjatovic 是前 AMD 的 ASIC 设计总监。这三个人加起来,可能设计了过去十年里你用过的一些最重要的芯片。
2022 年,当 Jim Keller 加入 Tenstorrent 并接管公司后,Ljubisa 选择了离开。六个月后,他创立了 Taalas。显然,他和 Keller 对 AI 芯片的未来有不同的看法。Keller 想做一个通用的、可编程的、软件友好的平台,而 Ljubisa 走向了另一个极端:彻底的专用化。
他们刚刚完成了 1.69 亿美元的融资,总融资额 2.19 亿。投资人里有个名字值得注意:Pierre Lamond。这位老爷子是 Fairchild Semiconductor 的元老,红杉资本的前合伙人,被公认为半导体行业的奠基人之一。这样的大佬背书,说明这件事至少在技术逻辑上是成立的。
现在的问题是:市场会买单吗?
Taalas 需要找到那些愿意为了效率和成本,牺牲灵活性的场景。比如语音助手,需要毫秒级响应,而且模型不需要经常换。比如数据标注,需要处理海量文本,用的是固定模型。比如一些垂直领域的专用模型,训练好了就不动了。
但也有人不看好。芯片制造是有污染的,如果每两年就要换一批芯片,这比 GPU 的更新换代更频繁,环保问题怎么算?还有人质疑,AI 模型进化这么快,两个月流片时间还是太长,等你做出来,模型可能已经过时了。
更根本的问题是:当 OpenAI、Google、Anthropic 都在拼命证明他们的新模型比旧模型好得多的时候,谁会愿意把自己锁死在一个固定的模型上?
Taalas 的反驳是:模型迭代的周期正在变长,人们开始依恋特定的版本。OpenAI 把用户从 GPT-4.5 迁移到 GPT-5 的时候,很多人抱怨新版本太谄媚了。也许未来我们会像对待手机型号一样对待 AI 模型:iPhone 15 出来后,还是有人用 iPhone 14,因为它们各有各的好。
我不知道 Taalas 会不会成功。这可能是一家改变行业的公司,也可能是一个技术史上有趣的注脚。
感兴趣的朋友可以去他们的demo站点体验一下什么是光速级别的inference:
chatjimmy.ai
昨天,一家成立不到三年的多伦多芯片公司扔下了一颗核弹。他们不是做大模型的,不是做应用的,而是做了一件听起来很复古的事:把AI模型直接刻在芯片里。
这家公司叫 Taalas。他们做的芯片 HC1,运行 Llama 3.1 8B的速度是 17000 tokens/秒。作为对比,目前业界最快的 GPU 也就 2000 左右。十倍差距。
但这还不是最疯狂的。最疯狂的是,这块芯片只能跑这一个模型。不能换,不能改,不能升级。你买回家,它就永远只会做这一件事:以光速运行 Llama 3.1 8B。
Taalas 的赌注很简单:在这个所有人都追求灵活性的时代,他们选择了绝对的不灵活,换取绝对的效率。
要说清楚这件事为什么重要,得先理解过去几十年芯片发展的主线。从 CPU 到 GPU,再到各种 AI 加速器,所有人都在做同一件事:造一个通用的计算平台,然后用软件在上面跑各种模型。
这条路走到今天,遇到了一个硬边界。模型越来越大,内存带宽成了瓶颈。你把几百亿参数从显存搬到计算单元,这个过程消耗的能量和时间,已经比计算本身还要多了。
Taalas 的思路是:既然你每次都算同样的东西,为什么还要搬来搬去?直接把权重存在晶体管里不行吗?
他们真的这么做了。HC1 芯片里没有显存,没有 HBM,没有复杂的缓存层级。模型的每一个权重都对应着芯片上的特定晶体管,矩阵乘法通过电路的物理连接直接完成。你输入一个 token,电流流过这些预先设计好的路径,输出就是下一个 token 的预测。
这就像录音带和现场演奏的区别。传统芯片是每次都要重新演奏,Taalas 是把演奏录在磁带里,播放就行了。
这种设计带来了几个惊人的结果。
第一是速度。17000 tokens/秒意味着什么?你几乎感受不到延迟。不是"很快",是"瞬间"。有测试者说,按回车的瞬间,答案就已经完整出现在屏幕上,甚至看起来像是预先准备好的。
第二是功耗。传统 GPU 运行 AI 推理需要液冷,一个机柜动辄几十千瓦。Taalas 的芯片只要空气冷却,十张卡加起来才 2.5 千瓦。他们号称能效是 GPU 的十倍。
第三是成本。制造这样的芯片,他们说是传统方案的十分之一到二十分之一。
支持5倍验资 【验资:@N9KF】
担保域名:N9.TOP 点击查看
💝 新会员好礼
注册就送28.8U
首存100U赠送28U
二存/三存最高赠送
💝 老会员好礼
电子狂欢每日存款赠送10%
充值笔笔送3%无上限
夜间充值最高可优惠
累计存款|打码|VIP升级送彩金
🔥欢迎各位老板加入N9国际娱乐城!
🔥关注N9官方频道参与更多优惠活动
有一家大厂的 AI 产品
砸了几亿标注数据
砸了几亿挖猎码皇
砸了几十亿训模型
砸了 N 多亿囤积卡
砸了几十亿去投放
砸了 N 多亿发红包
用户量、活跃度在除夕夜都达到了历史高峰
可惜的是,
第二天用户就流失了一半
第三天用户又流失了一半
请问,这是哪家产品?
A、马老师的
B、小马哥的
C、反正都姓马
只看短期收益,一波人升职加薪,拿高绩效。
后续换一波负责人,接手烂摊子。
哪管他洪水滔天…
砸了几亿标注数据
砸了几亿挖猎码皇
砸了几十亿训模型
砸了 N 多亿囤积卡
砸了几十亿去投放
砸了 N 多亿发红包
用户量、活跃度在除夕夜都达到了历史高峰
可惜的是,
第二天用户就流失了一半
第三天用户又流失了一半
请问,这是哪家产品?
A、马老师的
B、小马哥的
C、反正都姓马
只看短期收益,一波人升职加薪,拿高绩效。
后续换一波负责人,接手烂摊子。
哪管他洪水滔天…
完了,claude又要干掉一个行业了
这次是网络安全😅
Anthropic官推一小时前发推,发布了Claude Code Security
网络安全股panw、crwd等应声下跌
看来,网络安全板块,也马上要面对saas刚面临过的大的问:
AI 模型公司,是否会与传统网络安全巨头正面竞争?
网络安全公司会不会被ai淘汰?
首先看短期现实。Claude Code Security 这种能力,最直接冲击的是应用安全(AppSec)领域,尤其是代码扫描、漏洞检测、SAST/DAST 这类工具型公司。因为大模型可以理解代码逻辑路径,而不只是做规则匹配。这在能力层面确实形成了重叠,属于直接竞争。
但对像 Palo Alto Networks、CrowdStrike、Zscaler 这样的综合安全平台,目前还谈不上正面冲击。它们的核心在终端传感器、网络流量控制、云访问通道和实时威胁响应,这些都属于底层数据入口与执行层,而不是单纯的“认知分析”。
问的关键在于:模型公司是否会沿着能力边界继续扩张。
像 OpenAI 和 Anthropic 这类公司,本质上在做三件事:理解复杂系统、识别异常模式、生成修复策略。这三件事恰恰也是安全平台的核心能力。从认知结构看,重叠度很高。因此,长期边界一定会相遇。
且大模型公司拥有海量用户。
但“用户数量优势 = 安全数据优势”这个逻辑,只成立一半。
海量开发者交互数据、API 使用数据和 prompt 模式数据,这对代码安全、应用层安全有帮助。但真正高价值的安全数据是企业内部日志、终端行为、网络流量、内网拓扑。这些数据掌握在安全厂商手里,而且企业不会轻易让模型公司拿到。
也就是说,模型公司拥有“认知能力优势”,安全公司拥有“场景数据入口优势”。
但如果未来出现所谓的 AI OS——企业级 Agent 操作系统——情况会更复杂。假设企业内部所有系统、日志、权限管理都通过统一 Agent 调度,那么安全将不再是外挂的防护层,而是嵌入式认知系统。谁控制这个 AI OS,谁就拥有异常检测、权限控制和自动响应的决策中枢。
从理论上看,AI OS 完全可能成为安全平台。
但现实约束非常重。要成为真正的安全平台,必须深入终端内核、网络流量、身份系统,满足合规认证,模型公司短期很难替代。
更现实的路径可能是分层融合:AI 成为安全的“大脑”,而安全公司仍然掌握“神经系统和肌肉”。模型负责判断与策略生成,安全平
这次是网络安全😅
Anthropic官推一小时前发推,发布了Claude Code Security
网络安全股panw、crwd等应声下跌
看来,网络安全板块,也马上要面对saas刚面临过的大的问:
AI 模型公司,是否会与传统网络安全巨头正面竞争?
网络安全公司会不会被ai淘汰?
首先看短期现实。Claude Code Security 这种能力,最直接冲击的是应用安全(AppSec)领域,尤其是代码扫描、漏洞检测、SAST/DAST 这类工具型公司。因为大模型可以理解代码逻辑路径,而不只是做规则匹配。这在能力层面确实形成了重叠,属于直接竞争。
但对像 Palo Alto Networks、CrowdStrike、Zscaler 这样的综合安全平台,目前还谈不上正面冲击。它们的核心在终端传感器、网络流量控制、云访问通道和实时威胁响应,这些都属于底层数据入口与执行层,而不是单纯的“认知分析”。
问的关键在于:模型公司是否会沿着能力边界继续扩张。
像 OpenAI 和 Anthropic 这类公司,本质上在做三件事:理解复杂系统、识别异常模式、生成修复策略。这三件事恰恰也是安全平台的核心能力。从认知结构看,重叠度很高。因此,长期边界一定会相遇。
且大模型公司拥有海量用户。
但“用户数量优势 = 安全数据优势”这个逻辑,只成立一半。
海量开发者交互数据、API 使用数据和 prompt 模式数据,这对代码安全、应用层安全有帮助。但真正高价值的安全数据是企业内部日志、终端行为、网络流量、内网拓扑。这些数据掌握在安全厂商手里,而且企业不会轻易让模型公司拿到。
也就是说,模型公司拥有“认知能力优势”,安全公司拥有“场景数据入口优势”。
但如果未来出现所谓的 AI OS——企业级 Agent 操作系统——情况会更复杂。假设企业内部所有系统、日志、权限管理都通过统一 Agent 调度,那么安全将不再是外挂的防护层,而是嵌入式认知系统。谁控制这个 AI OS,谁就拥有异常检测、权限控制和自动响应的决策中枢。
从理论上看,AI OS 完全可能成为安全平台。
但现实约束非常重。要成为真正的安全平台,必须深入终端内核、网络流量、身份系统,满足合规认证,模型公司短期很难替代。
更现实的路径可能是分层融合:AI 成为安全的“大脑”,而安全公司仍然掌握“神经系统和肌肉”。模型负责判断与策略生成,安全平
台负责数据采集与执行响应。
未来几年的格局,大概率不是替代,而是融合。模型公司成为认知层基础设施,安全公司继续控制数据入口与执行层。
因此,网络安全领域,短期是局部竞争,中期是能力融合,长期才可能出现平台级重构。而决定胜负的不是谁用户多,而是谁控制企业核心数据流与执行权。
@aigc1024
未来几年的格局,大概率不是替代,而是融合。模型公司成为认知层基础设施,安全公司继续控制数据入口与执行层。
因此,网络安全领域,短期是局部竞争,中期是能力融合,长期才可能出现平台级重构。而决定胜负的不是谁用户多,而是谁控制企业核心数据流与执行权。
@aigc1024
谷歌发布了一款新的 AI 产品:Photoshoot
用Photosoot,用户可以从一张产品图片开始,轻松创建高质量、定制化的 marketing 照片,提升营销效果。
扭头瞅了一眼,Adobe $ADBE 股价看起来是没什么希望了。
与此同时的,商业摄影师和模特们的工作危矣。小白们用 iPhone 随便拍两张,扔到 AI
@aigc1024
用Photosoot,用户可以从一张产品图片开始,轻松创建高质量、定制化的 marketing 照片,提升营销效果。
扭头瞅了一眼,Adobe $ADBE 股价看起来是没什么希望了。
与此同时的,商业摄影师和模特们的工作危矣。小白们用 iPhone 随便拍两张,扔到 AI
@aigc1024
然后我又使用了一下攻略模式让点点帮我生成了一个一天的行程安排;接到需求后的点点,首先给了一个问卷,让我提供更多的倾向性:(图3)
选择完之后,点点大概用了5分钟左右生成了一个带行程、预算、价格、tips的完整攻略:(图4、图5、图6)
我基本上可以直接拿着这个攻略开始安排一天的雪场行程。
5、回到今天问题的起初,点点选的突破口为什么是“攻略”?
以我个人需求为案例,这个一天的北海道二世谷滑雪攻略的整个生成过程背后靠的是
LLM模型基础能力+小红书社区独有的数据+产品端的交互。
数据的部分,小红书社区本身的语料库就包含非常真实、广泛、细分、长尾的用户经验,
而且这些数据其实并不单纯只是覆盖旅游场景,生活服务的方方面面其实点点可以拓展的领域所在。
这个问题再延伸其实是:
当大模型的基础能力已经完全可以“兜底”的前提下,各家厂商到底依靠什么自己独有的东西,才能在应用层面做出什么有意义的突破?
选择完之后,点点大概用了5分钟左右生成了一个带行程、预算、价格、tips的完整攻略:(图4、图5、图6)
我基本上可以直接拿着这个攻略开始安排一天的雪场行程。
5、回到今天问题的起初,点点选的突破口为什么是“攻略”?
以我个人需求为案例,这个一天的北海道二世谷滑雪攻略的整个生成过程背后靠的是
LLM模型基础能力+小红书社区独有的数据+产品端的交互。
数据的部分,小红书社区本身的语料库就包含非常真实、广泛、细分、长尾的用户经验,
而且这些数据其实并不单纯只是覆盖旅游场景,生活服务的方方面面其实点点可以拓展的领域所在。
这个问题再延伸其实是:
当大模型的基础能力已经完全可以“兜底”的前提下,各家厂商到底依靠什么自己独有的东西,才能在应用层面做出什么有意义的突破?
提供一张图片或描述时:
1. 分析主体的核心特征、穿着风格及潜在性格。
2. 提取可拆解的一级元素(外套、鞋子)
3. 脑补并设计二级深度元素
4. 生成一张包含所有这些元素的组合图,确保透视准确,光影统一,注释清晰
5. 使用中英文双语标记,高清4K HD 输出,比例3:4
@aigc1024
1. 分析主体的核心特征、穿着风格及潜在性格。
2. 提取可拆解的一级元素(外套、鞋子)
3. 脑补并设计二级深度元素
4. 生成一张包含所有这些元素的组合图,确保透视准确,光影统一,注释清晰
5. 使用中英文双语标记,高清4K HD 输出,比例3:4
@aigc1024
1. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。
2. 📢 沙雕日常图鉴
分享沙雕、尬图等,
3. 📢 AI探索指南
关于DeepSeek、ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。
4. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。
5. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;
6. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。
7. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录
8. 📢 金融·投资·Web3加密货币·美股
Web3加密市场、美股、金融投资,理财,金融知识;
9. 📢 你不知道的冷知识
有趣的、无趣的、有用的、没用的知识
10. 📢 优质信息收藏夹
优质软件/插件/网站等分享。好玩的、好用的数字产品分享。
社会观察、奇闻视频、突发事件和生活短片。
2. 📢 沙雕日常图鉴
分享沙雕、尬图等,
3. 📢 AI探索指南
关于DeepSeek、ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。
4. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。
5. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;
6. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。
7. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录
8. 📢 金融·投资·Web3加密货币·美股
Web3加密市场、美股、金融投资,理财,金融知识;
9. 📢 你不知道的冷知识
有趣的、无趣的、有用的、没用的知识
10. 📢 优质信息收藏夹
优质软件/插件/网站等分享。好玩的、好用的数字产品分享。
10秒极速变装(甜酷风)
这个换装视频我看了三遍。
最重要的人物的灵动、转场衔接的自然,Seedance2.0都做到了!
对于提示词的理解和画面融合非常强!
提示词👇
0-1秒:学院制服,背手踮跳,领带甩动,歪头笑眼弯如月牙。
1-2秒:转身甩发挡脸变洛丽塔,
2-3秒:交叉挡脸变运动装,
3-4秒:甩袖扫镜头变古风襦裙,
4-5秒:捂脸分开变甜酷吊带裙,
5-6秒:小跳落地变睡衣,揉眼打哈欠,
6-7秒:转身背对变水手服,举心左右摆
7-8秒:低头整领抬头变打歌服,抬手做麦,
8-9秒:抱胸松开变牛仔装,拽拉链抬下巴,
9-10秒:转身甩臂变回制服
@aigc1024
这个换装视频我看了三遍。
最重要的人物的灵动、转场衔接的自然,Seedance2.0都做到了!
对于提示词的理解和画面融合非常强!
提示词👇
0-1秒:学院制服,背手踮跳,领带甩动,歪头笑眼弯如月牙。
1-2秒:转身甩发挡脸变洛丽塔,
2-3秒:交叉挡脸变运动装,
3-4秒:甩袖扫镜头变古风襦裙,
4-5秒:捂脸分开变甜酷吊带裙,
5-6秒:小跳落地变睡衣,揉眼打哈欠,
6-7秒:转身背对变水手服,举心左右摆
7-8秒:低头整领抬头变打歌服,抬手做麦,
8-9秒:抱胸松开变牛仔装,拽拉链抬下巴,
9-10秒:转身甩臂变回制服
@aigc1024