
近期“让人头皮发麻的”AI能力进步:Grok 3.5能“无中生有”,NotebookLM支持中文口播了!
xAI宣布下周向SuperGrok订阅用户开放Grok 3.5早期测试版。
这款模型的最大突破,在于其具有第一性原理的推理能力。
不同于传统AI依赖互联网数据拼接答案,Grok 3.5能像科学家般从物理定律、化学反应等基础真理出发,推导出前所未有的解决方案。
例如,面对“设计火星基地供氧系统”的提问,它会先拆解氧气生成的核心条件——水冰电解效率、能源供给稳定性、材料耐腐蚀性,再逐层构建可行性方案,甚至提出利用火星大气二氧化碳制氧的新路径。
这种能力让其在复杂技术问题领域超越Gemini 2.5 Pro与GPT-o3,成为科研与工程领域的“外挂工具”。
支撑这一能力的,是xAI投入的20万块GPU集群与Colossus数据中心的强大算力。马斯克团队并未止步于参数堆砌,而是准备通过模拟人类科学家的底层思维逻辑,赋予AI“跳出盒子思考”的自由度。
每个系统中存在一个最基本的命题,而这一基本命题就是知识体系的“元起点”。
马斯克说:“普通人习惯用类比思考,而卓越者专注第一性原理。”
在创办SpaceX时,他拒绝接受“火箭成本必然高昂”的行业共识,转而追问:“构成火箭的基本材料是什么?”铝、碳纤维的成本仅占传统报价的2%,这一发现直接催生了可回收火箭的革命性设计。
好比现在的AI发展如火如荼,每天一个“突发”,天天“震惊”,看到有人根据提示词生成了一个酷炫屌炸天的网页,不少人都在求提示词。
然而,这种”追逐提示词”的思维模式,本质上是一种表层学习。
如果我们转而采用第一性原理的思维方式,问题的焦点将发生根本性转变:
构成这些视觉作品的基本元素究竟是什么?页面的构成原理是什么?设计理念的本质是什么?不同风格之间的设计元素与思维逻辑有何异同?
只有深入到这些问题的核心,不断追问本质,以第一性原理来拆解表象,才能超越简单模仿。
Grok 3.5的这种“无中生有”效果到底好不好,下周见分晓,我预测回答内容应该不会太好,但这种“追本溯源”的思维范式应该会成为下一代AI智能系统的新起点。
NotebookLM支持中文口播
—
2025年4月29日,NotebookLM 宣布其 Audio Overviews 功能现支持 50 种语言,包括 中文。用户可以生成基于上传中文文档的播客式音频总结,提供沉浸式学习体验。
NotebookLM 目前支持 130 种语言 的输入来源和聊天功能,包括 中文(简体和繁体)。
可以上传中文文档、网页链接或文本,并以中文与 AI 进行交互。
输出语言限制:AI 生成的自动摘要、学习指南、简报文档、FAQ 和时间线目前仅支持 英语 输出。
使用方法,可以通过 Google 账户设置或 NotebookLM 的设置菜单(右上角“设置 > 输出语言”)将聊天响应、学习指南等输出设置为中文(简体)。
用户可以上传中文 PDF、Google Docs、网页链接或文本,NotebookLM 会生成中文总结或回答基于中文来源的问题。支持高达 50 万字 的单个来源,适合处理长篇中文文档。
效果如何?效果好得我头皮发麻,无法言表,不管是语气、对话、衔接 都已经做到了真假难辨的地步:
出处:微信公众号 @字节笔记本