Monday, December 8, 2025

听风的玲: 清史为什么修了二十多年还出不来?因为它是个“烫手山芋”

(微信,2025-11-23)

 今天我们来厘清一个近期备受关注的现象:为什么清史的修纂与评价争议如此之大?

 这件事的起因,是一个公开的秘密:

 国家清史纂修工程自2002年启动,历时二十余年,成稿三千多万字,参考史料近十亿字,却至今未能正式出版。 

 很多人将原因归结为学术能力的退步或是史料的浩繁,但事实上,这种理解是浮于表面的。

 不是说史料不够多,也不是说学者不够勤奋,而是说怎么写这个问题,在逻辑底层打了一个死结。

 借着这个由头,今天我们要讨论的,正是清史背后那套互相打架的顶层逻辑——

       如果你要问这有什么意义,那么不管是清朝还是明朝,对于如今的生活看似都没有直接影响。

       但是,通过对清史困局的剖析,我们却可以理解现代国家构建中,法统继承与民族情感之间的剧烈张力。

       这是不是就有现实意义了?

        在中国历史上,清朝是一个极为特殊的样本。它不仅是最后一个帝制王朝,更是奠定现代中国版图基础的关键时期。

         目前关于清史的争议,本质上是三种史观的三国杀:革命史观(阶级史观)、团结史观以及西方学界主导的新清史(NQH)。

        本文,我们就来回顾这场史学界的博弈,看看一个修史工程是如何陷入不可能三角的。

        首先要来解释这个问题:为什么一定要修清史,而且还得修得漂亮

         ——这里的漂亮,是指要符合当下的政治正确和国家利益。

        首先从现实收益上来考虑这件事。

        这也就是所谓的团结史观的核心诉求。

        在这个问题上,决策者看到的地图,和皇汉主义者看到的截然不同。

        如果我们翻开明朝的地图(不含羁縻地区),你会发现它其实是不完整的:

        没有疆疆,没有藏藏,甚至东北和蒙古的大片区域也不在直接管辖之内。

        而如果我们翻开清朝的地图,尤其是《尼布楚条约》签订后的疆域,那才是一个拥有1300多万平方公里的庞大帝国。

        也就是说,现代中国对藏藏、疆疆、东北乃至湾湾的法理主权,很大程度上是继承自清朝的。

        如果不承认清朝的正统性,或者将清朝定义为单纯的殖民政权,那么这些边疆领土的法理继承性就会出现漏洞。

         所以,为了维护国家版图的完整性,为了大一统的叙事,清史必须被定义为中华历史的正统朝代,而非异族入侵。

        这是一种基于现实地缘政治的刚需。

        而如果以上只是基于领土法理的逻辑推演,那么清史修纂还面临着基于情感的第二层考虑:

        民族记忆的创伤。

         当时发生的,是扬州十日嘉定三屠。这些历史细节,在传统的汉本位史观或者早期的革命史观中,是无法被抹去的血痕。

         在辛亥革命时期,为了推翻满清,口号是驱除鞑虏,恢复中华。在那个语境下,清朝就是侵略者,是必须要打倒的非我族类

         但到了现代,为了强调56个民族是一家,我们采用了团结史观。这就带来了一个巨大的逻辑BUG

         如果在这套史观里,岳飞和文天祥不能再被称为单纯的民族英雄,而要被定义为抗金/抗蒙名将,以免伤害民族感情;

         那么清初那些抵抗剃发易服、抵抗屠城的汉人——如史可法、阎应元,他们算什么?

         更尴尬的是,如果承认清军入关是民族融合的阵痛,那么那些投降清朝、屠杀同胞的汉人将领——

         如尚可喜、洪承畴,甚至引清兵入关的吴三桂,是不是就有机会翻案了?

         事实上,确实曾有专家在研讨会上试图将尚可喜定义为顺应潮流明哲自保中华民族英雄

         这种认知上的撕裂,让普通人感到愤怒和困惑:

         如果屠杀同胞、强奸妇女的刽子手都能因为顺应大一统而成英雄,那么是非善恶的标准在哪里?

         这就是清史争议中的不可能三角:实事求是、团结史观、人的良知。三者最多选其二。

         而除了这两条内部矛盾,修史者还有第三个方面的因素需要考虑:

         话语权的争夺与新清史(NQH)的冲击。

         我们在之前的讨论中已经隐含了一个前提,那就是我们试图在内部逻辑中自圆其说。但问题是,国外的学者也没闲着。

         以美国汉学界为首的新清史学派,挖掘了大量的满文档案。

         他们提出了一个极具破坏力的观点:清朝成功的关键,不在于汉化,而在于其保持了内亚性

         他们认为,清朝皇帝不仅是汉人的皇帝,更是蒙古的大汗、西藏的文殊菩萨。

         这种观点推演下去,就是将清朝中国剥离,认为清朝是一个多元帝国,而中国(汉地十八省)只是其中的一部分。

         这对于当下的中国而言,是绝对的禁忌。因为它在消解中华民族多元一体的理论根基。

         讽刺的是,这种强调多元的视角,恰恰是团结史观的某种镜像——

         当你过分强调清朝对各民族的统治特色时,你也为外人提供了拆解中国的刀子。

         看过这三个方面的死结以后,你是不是也觉得清史是一项无比烫手的山芋?

         有人提议:既然这么难修,不如让对面修,或者干脆不修。

         然而,如果不修,话语权就会旁落。

         现在的情况是,如果不回应新清史的挑战,国际学术界的声音就会一边倒;如果回应,无论怎么写,都会得罪国内的一大批人。

         使用阶级史观?那就得承认清朝是封建地主与满洲贵族联合对人民的压迫,这不利于团结。

         使用汉本位史观?那就得把清朝写成殖民史,这不利于领土法理。

        使用团结史观?那就得面对认贼作父的道德指责,甚至逻辑上会推导出日本如果赢了也是正统的荒谬结论。

        正如一位网友所言:

         清史之所以难修,是因为我们至今没有完成对这段历史的真正脱敏。它离我们太近了,近到连辛亥革命的合法性都还挂在它的尸体上。

         上帝没有制造一种绝对完善的史观放在那里让人类发现,而只有一些充满了补丁的解释包供后人根据需要选取。

         最后再说回这个尚未面世的《清史》。

         据说最终成稿有三千多万字。如此浩大的工程,最终卡在了过审二字上。这背后,其实是决策层对于意识形态安全的极度审慎。

         与其拿出一个漏洞百出、被人骂成筛子的定本,不如让它继续处于在修的状态。

         因为一旦盖棺定论,就意味着官方必须为其中的逻辑漏洞背书。

         很多时候,那些看起来高大上的文化工程,最后都会以这么一种沉默的方式,悄悄束之高阁。

         古今皆然。

       番外我们的说书时间

         在正文中,我们提到了很多人对清朝人物的评价充满了矛盾。其实,这种精神分裂在历史细节中比比皆是。

       比如那位在教科书里被誉为收复湾湾的民族英雄施琅。

        在《清史稿》的语境下,他是大清的忠臣,不仅平定了海寇,还与红毛(荷兰人)合作。

         是的,你没看错,为了剿灭郑氏政权,大清曾与荷兰殖民者组成联合舰队。

        在康熙二年的记载中,大清优赉荷兰使者,请他们助师讨伐台湾。

         如果你站在明郑的角度,或者是站在当时沿海被迁界禁海令搞得家破人亡的百姓角度,施琅和清廷的行为,无异于引狼入室的汉奸

         但如果你站在大一统的角度,施琅又是维护国家统一的功臣。

         更有意思的是,这种评价体系的游移,甚至波及到了对侵略的定义。

         如果清朝是正统,那么鸦片战争是侵略;

         那如果是站在明朝遗民的角度看呢?清兵入关是不是侵略?如果清兵入关不算侵略,那为什么日本当年的大东亚共荣理论——

         宣称自己是更优秀的中华文明继承者——会被我们坚决唾弃?

         这就是那个让人细思极恐的逻辑陷阱:

         如果我们为了维护清朝的合法性,过度美化其入关的手段,我们实际上是在解构我们抵抗外侮的道德基础。

         日本人当年也说过:崖山之后无中华,我们是来帮你们恢复王道的。

         这套嗑,是不是听着有点耳熟?

         所以,清史争议之所以大,根本原因不在于历史本身,而在于我们还没有想好,该用什么样的灵魂,去面对那段长着辫子的过去。

感恩的晚祷: 反对川普的保守派们

(微信,2025-12-02)

       魔鬼总成双成对地向世间散播谬误,而且是对立的两极。他总诱使我们耗费大量时间思索哪个更糟。其中缘由,你们想必明白?他借你对某一谬误的格外憎恶,将你缓缓引入相反谬误的罗网。但切莫上当,我们必须紧盯目标,从两道谬误的夹缝间笔直穿行,不必与任一种谬误纠缠。——C. S. Lewis

       由川普引起的争论热度持续不退。支持川普一方常有一种倾向,把批评川普的声音都归结为两派之争(自由派/保守派)或两党之争(民主党/共和党),一如当年极左翼习惯于将所有批评归结为两个阶级、两大阵营的斗争,似乎把批评者标签化、党派化就轻而易举地化解了批评。

         然而,这种辩护有意无意地遗漏了一个事实:从2015年川普以他独有的姿态宣布参选开始,他最早招致的激烈批评,恰恰出自一批支持共和党、捍卫保守派原则的作家之手。其中著名的例子就是,20161月保守派旗舰刊物 《国家评论》编辑过一期特刊,标题就叫Against Trump(反对川普),当时22位保守派作家和活动家参与其事,撰文说明川普并不代表保守主义。虽然随着川普的胜利,有部分人士改弦易辙,接纳或者说归顺了川普,但一直坚持己见、不肯同流合污的保守派也不在少数。

         我最近有意阅读的,就是同属这后一类型的几位作者,包括乔纳·戈德堡(Jonah Goldberg)、查理·塞克斯(Charles J. Sykes)和马克斯·布特(Max Boot)。三人虽然没有参与那期特刊,但都曾是重要保守派刊物的编辑、作者,或知名保守派智库的成员,长期站在共和党立场发声,属于响当当的保守派是毋庸置疑的。同时,从川普参选开始,他们就公开持批判态度,并且没有因为他获胜而改变立场,宁愿因此从主流被排挤到边缘,甚至遭致敌意,这足以激起我的一分好奇和敬意——当然,川普支持者的应对方法是把这类人一概视为精神病,即所谓川普精神错乱综合症(Trump Derangement Syndrome)

         这轮阅读带给我不少收获,最直接的收获是了解到,原来传统保守派阵营里还有这样一个坚决拒绝川普的知识群体。他们人数不多,在今天川普掀起的保守浪潮前只能算极小的支流,但他们却努力保持自己的独立,发声维护自己信奉的保守主义原则,而非与时俱进。这或许不能带来改变,但就公共生活而言却自有它的意义,至少让我们意识到对川普的批评并不专属某个党、某个派,有些批评——也是极其严厉的批评——具有超越派别的性质。

         更长远的收获,则是看到共和党在罗斯福新政后几十年的起伏挣扎,看到党内一直持续的、建制派与民粹派之间的两条路线的斗争,而川普的当选所特别昭示的,与其说是民主党共和党的两党之争,毋宁说是党内两条路线的斗争有了一个前所未有的新局面:民粹派大获全胜,全面接管了共和党。

         本文意在说明,围绕川普的争论无法简单化约为两党/两派之争,一种极端倾向也无法以自己反对另一种极端倾向而得到证明。这里要谈的三部作品,就出自前述三位保守派作者之手,然后也还阅读、参考了其他一些著作,比如Matthew ContinettiThe Right: The Hundred-Year War for American Conservatism,还有E.J. DionneWhy the Right Went Wrong: Conservatism from Goldwater to the Tea Party and Beyond,就不特别标注了。    

                         (一)

        乔纳·戈德堡《西方的自杀:人性本能如何反噬西方文明?》(八旗文化,2022

         右翼以西方的自杀为题的书这不是第一部。早在半世纪前,当时著名的大右派詹姆斯·伯纳姆就写过一本同名著作,痛批自由派在两大阵营的对峙中偏袒左翼,指控自由主义是使西方走向自杀的意识形态。同样的主题一再出现,颇能反映右翼保守派对西方文明所怀的深重的忧患意识。只不过,这次让人忧虑的破坏者不再只是左翼/自由派,也包括保守派自己。

        戈德堡这本书较为偏重思想和历史,它的主旨是肯定西方现有政治经济制度的成就,进而强调它并非必然发生,而是一种偶然,一个奇迹。人类历史上有些地方虽也曾出现过自由与繁荣的迹象,但都昙花一现,唯有到了西方近代,在启蒙思想的冲击下,出现了一套新的观念(作者称之为洛克革命),由此才使新的政治经济体制——自由主义和资本主义——成为可能。这里可以看出作者的保守主义所要保守的内容,那就是十八十九世纪发展起来的政治经济制度(作者并未像一些保守派那样多谈宗教因素)。

       作者之所以反复强调它是难得的奇迹,是因为看到今天西方人对此太疏忽大意了,对这套体制既不感恩也不愿维护——而自由派尤其被他诟病,因为他们常常怀上一种奇怪的罪疚感(这也是伯纳姆那部同名著作重点批判的一个话题),这会动摇西方文明的根基。不过,与他早期的著作《自由派的法西斯主义》不同,在那本书里,他把现代的一切罪恶都推给了自由派——甚至像希特勒、墨索里尼都被他列入自由派,只不过是自由主义的右翼,虽然这种论调并不陌生,但出自一位还算严肃的作家之口当时还是让我颇感吃惊——而在这本书里,他显见变得悲观了,强调危险在于人性本身:人类天性中就有一种他称之为浪漫主义的倾向,希望挣脱这套自由秩序而回到之前的部落状态,这是根本的威胁。现实让他看到,保守派同样禁不住这种诱惑,而川普正是一个彻头彻尾的浪漫主义人物

         在讲述了这套秩序近来受到的种种冲击之后,全书后半部分的重头戏是对川普及其保守派支持者的批判。首先是川普其人,作者对川普的个性和手段看得非常清楚,但他还是尽力对之做客观的描述、分析,避免做纯道德角度的攻击。比如他指出川普其实没有明确的意识形态,这一点是和欧洲右翼的显著不同:

         过去三十年来,他只有在少数几个问题上前后一致:贸易保护主义、从我们跑去入侵的中东国家那里拿石油、以及一些撤除管制的空洞陈腔滥调。如果谈到枪支、移民、堕胎、征税、医疗保险,他就变得几乎什么立场都支持过。传统的美国保守派支持限制政府规模、谨守宪法、保障个人自由、尊重传统价值观;但这些坚持川普一个都没有,而且证据似乎显示,他连对这些概念的理解都很肤浅。

         既然不是靠意识形态,那川普又是如何赢得保守派的民心?那是因为川普打破了实境秀跟真实政治之间的第四面墙,以人际冲突和戏剧效果来博取关注。他的人生和总统之路,都不是以政策、意识形态、甚至真正的政治为基础,而是仰赖收视率。

         对川普而言,商场、电视收视率、政治上的胜利反而最重要。所以他批评对手的策略,才会说其中一个人是恋童癖,另一个人的爸爸是刺杀肯尼迪的共犯。他甚至把赢不了的抱怨当成带来胜利的工具,说什么反正我就一直抱怨,然后我就赢了

         同样地,虽然川普常常表现出对美国政治历史的惊人无知,但这偏偏成了他走民粹路线的优势所在(这一段相当形象):

         事实证明,对政治的一无所知反而让川普获得巨大的优势。既有的政治精英阶级都有一大堆不能说的语言和禁忌,而且那些极度傲慢的中间派被绑死的程度,更是比左派跟右派还严重。所以川普只要用他的有话直说,就可以把这些人全都辗过去。当然,我们这些重视用词遣字的人会觉得川普是个无知的乡巴佬;但在数百万选民眼中,这样的人是个血性汉子,而且他是乡巴佬反而好,因为他就不会是那些把美国推进现在死胡同的建制派。他就是这样打败克鲁兹参议员的,克鲁兹太建制了,即使完全了解要怎么煽动民粹,最后讲出来的时候调性还是不对。

        最后,他为川普描绘了一幅画像:

         川普只要脱掉西装,摘掉那条太长的领带,其实就是一个标准的前现代男人,整天只想着怎么在自己的小圈圈里称王。他没有任何前后一致的意识形态,通常也拒绝维持良好的品性,所以从很多角度来看,他都是资本主义的完美范例:一味追求欲望,无视任何的外在道德束缚,只被最基本的人类本性所管束。川普在乎性、在乎权力、喜欢支配他人、希望自己的地位获得肯定……他是尼采定义的那种骑士,他的道德他自己说了算。

        然而,真正的问题还不是川普如何,而是共和党的群众竟然接受了这样一个人。如作者所说,川普那种想到什么说什么,甚至可说是动物性的政治风格,加上他对民主规范毫无歉意的无知,以及对精英的极度仇视,在很多选民那里不但不觉得是川普的问题,甚至还把它当成川普的优点。作者坦率地指出,这并非保守派应有的样子:

        现代美国的保守主义,是有限政府、自然权利、传统价值观、爱国、感恩这些原则交迭出来的产物。但这些原则背后都有两个共同基础:观念的重要,以及品格的重要……可是唐纳·川普却完全站在观念跟品格的反面。他自己都说过,观念对他而言只是工具,只要能达成目的,长成怎样都无所谓;甚至还说他唯一信奉的准则,就是人应该随机应变,不该死守任何东西。至于他的品格嘛……这么说吧,无论从过去五十年来保守派相信的哪一项标准来评断:老实做生意、在性方面保持正直、谦虚、虔诚、讲话得体,川普的得分都离及格很遥远。所以我应该可以说,他不算是个好人。而且如果你在十年前跟任何一个保守派或自由派聊天的时候不提川普的名字,而是描述他的抽象特质,两边的人都肯定会说这是个烂人。他粗鲁无礼,他公然承认自己贪得无厌、只会抱怨、欺骗他人。只有在礼貌对他有利的时候,他才会彬彬有礼;只有在他能用法律来砍人的时候,他才会尊重法律。至于其他人?全都是让他拿来利用的工具。

        那么保守派为什么会蜂拥去接受川普?简单地说,因为他们一直输,一直被背叛,所以对打赢对手有特别的执念。在川普之前,右翼民众长期陷入一种挫折感中,他们自己选出的建制派常常不顾选举时的承诺,当选后向民主党投降,追随民主党的施政路线(典型的例子如小布什的仁慈保守主义,赋予政府积极作用),这反过来又刺激他们愈加强烈地渴望战斗和胜利,将之视为唯一有价值的原则,茶党失败了就再寄希望于更激烈的川普:

         我曾跟许多支持川普的保守派有过无数辩论。让我震惊的是,许多本该有所原则的保守主义者,都将战斗胜利当成了自己的目的。当川普用尽粗鄙的言语捍卫客观来看毫无道德,或是政治上站不住脚的立场,这些啦啦队的反应却是至少他战斗了!他成了我们人民的化身,而胜利已经跟真正赢得什么毫无关联了。当他无法宣告胜利时,因为别人辜负了他,或是恶意阻挠他;当他宣告胜利时,具体内容则无关紧要;他做出难以理解之举时,那他一定是在下很大一盘棋。简单来说,很多人根本就是在搞川普的个人崇拜。(译文根据英文原文有改动)

         正是在这种心理作用下,人们才会把川普本人作为保守派的标杆,而完全不顾他与保守主义的实际距离有多大。基层民众的背叛正是让作者这样的保守派感到最伤心失望的地方,过去把美国的希望寄托在某个派别身上的乐观信心不见了,他对美国未来发出了悲观的警告:

         我很伤心,而且无法像以前那样,坚信这个国家几乎不可能沦为威权。当然它不可能在川普时代崩毁,但川普让我知道,保守主义远比我想象得脆弱,保守主义者比我想象得更容易变成暴徒。

        在他看来,川普和川普主义对于保守派的存亡威胁,正是西方文明所面对的危机的一个缩影。

         稍作一下总结。且不论作者对于川普的具体观点,书里有两点给我印象深刻,第一是他不崇拜力量(用今天的流行语说就是不慕强),不以获胜为最高目标,坚持自己的思想立场,这一点是太难得了,——这次让我意识到在美国也是同样难得。此前有些观察家就提到过,极右翼在批判左翼极权的同时,内心却常怀着对后者的强大权力和无情手段的艳羡(参阅我知道我有一种面对不愉快事实的力量”——读希钦斯《奥威尔为什么重要》),而在这位保守派作家身上没有这样的痕迹。

        第二是他在道德立场上的一致性。他绝不认同一种现象在民主党身上是坏事,但在共和党身上就变成好事,全书结语里的这段话就是明证:

         制定美国宪法的人最害怕的事情,就是无论领导者发表什么主张、做出什么行动,民众都无条件地支持。……二〇一一年,只有百分之三十的福音派基督徒认为在私生活中做出悖德行为的民选官员,可以在公职生涯中保持高风亮节,确实履行义务。到了二〇一六年,这个比例却增至百分之七十二,增加一倍以上。福音派原本是最不能忍受官员失德的一群人,川普出现之后却变成了对其最宽容的团体,他们现在对于悖德行为的容忍程度,甚至远超过了美国人的平均值。照这样下去,等到民主党再次掌权,共和党人还能用什么标准去监督他们?保守派之前谴责奥巴马滥用行政命令,但等到川普下台之后,如果还有人做一样的事情,他们还能说话吗?以后如果有哪个性生活不检点的人想当总统,共和党人要拿什么理由阻止?而在川普崛起之后,保守派又有什么理由能谴责裙带资本主义

        正是由于这两点,虽然作者有些论述让我感觉有失偏颇(比如他只说川普现象是对左派身分政治的反弹,却不提共和党内一直存在的民粹潜流,前一个因素固然存在,但后一因素却绝非不重要),我也愿意把这看成是在个人思想的正常误差范围内,甚至愿意更严肃对待他的观点。他思想的真诚是无可怀疑的。

                (二) 

        Charles J Sykes: How the Right Lost Its Mind (St. Martin’s Press, 2017)

         在戈德堡的著作之后又读到查尔斯·塞克斯的这部作品《右派如何失去了理性?》,让对美国政治缺乏深层了解的我颇有耳目一新的感觉。塞克斯曾是美国知名政治评论员、作家与电台主持人,长期为共和党与保守理念发声,但自2016年特朗普崛起后,他成为美国反特朗普保守派的代表人物之一。两本书对特朗普及保守派的看法大体相似——这本书里也几次提到了戈德堡,把他视为保守派里的少数例外,是坚持原则的典范——但塞克斯触及了一个戈德堡刻意回避、立场模糊的问题:保守派内部一直存在的精英与民粹的冲突。

        这个冲突的故事背景可以简要地概述如下:新政之后的共和党多少陷入了困局,它的意识形态话语和治理现实之间开始出现裂痕。它的选民表现出一种双重特质,既认可政府项目本身,又对政府深怀戒心,甚至无法想象自己珍视的福利竟是国家运营的成果,这就是所谓意识形态上的保守派和操作上的自由派的结合(举一个作者提到的例子,美国从未存在过支持大幅削减预算的强大选民基础,调查显示仅有极少数选民支持削减开支)。

        所以,共和党的建制派既离不开意识形态正确的极端民粹派,又深知无法兑现承诺去满足民粹派的要求,回到新政以前的施政道路。曾有几位有远见的政治家(如艾森豪威尔、尼克松)看到其中矛盾,都尝试过转型,但都未获成功。于是裂痕始终存在,这种情况下,基层民众自然容易接受那种煽动的说辞,说他们被自己政客出卖,政客走了一条投降路线,这在面临困难和危机的时候尤其容易发生。

        困扰保守派的还有另一个问题,正如被誉为现代保守主义之父的威廉·F·巴克利所说的,就是它的荒诞偏执(crackpotism),常常是各种阴谋论和种族主义的温床。巴克利曾对此有过描述:

        某些强加于正统美国保守主义的诉求荒谬至极——至少在我看来如此。(”我们应该实行高关税,因为农民享有高额补贴,不过话说回来,他们本就不该获得这些补贴。“) 有些则病态偏执(”阿拉斯加正在被建设成为亲麦卡锡派的大型集中营。“) 还有些充满神秘主义色彩(”国家不可能做出任何善举。“)……

        巴克利坚信保守派如要发展,必须清理门户,为此他曾先后与传播各种阴谋论的极右翼组织约翰·伯奇协会(John Birch Society)、反犹主义的布坎南派切割。然而,今天已经没有巴克利这样的人物,正如作者所说:事实上,茶党运动似乎为巴克利当年竭力驱逐出保守主义阵营的疯子们敞开了大门。与1960年代不同,如今为疯子主义辩护、谴责批评者的渠道多得惊人。脱口秀电台也屡屡屈服于诱惑,为那些正在自我毁灭的候选人辩护。(提一句,戈德堡是支持茶党运动的。)

        川普正是在这种背景下应运而生,他尤其得益于近年新出现的新媒体平台的效力,将共和党传统精英与民众的沟壑放大,并使自己成为后者的代言人。这一点,正如迪昂(E.J. Dionne)所提醒的:一个打破所有传统政治规则的局外人竟能如此迅速崛起,如此颠覆其政党格局,并一度主导党内话语权,这恰恰映射出保守主义内部的危机。……特朗普运动的崛起应当唤醒共和党人和保守派人士,使他们清醒认识到自身面临的挑战、支持者中普遍存在的失望情绪,以及失望与背叛循环所带来的代价。

        较之戈德堡,作者似乎更深地意识到了眼下保守派的这种困境,这也使他愿意提出一些更尖锐的问题,会去考虑自己在这一进程中是否也有责任:左翼对保守派言论的诸多批判——那些我们数十年来的驳斥——是否暗藏几分真相?我们——包括我本人——是否助长了这场席卷右翼阵营的偏执与仇外之火?他没有放弃保守派立场,面对川普及其支持者的强势,他明确自己要做一个反潮流的保守派:

        尽管如今喧嚣四起,要求保守派向新政权靠拢,但实际需要的恰恰相反。保守主义需要的不是顺从,而是敢于抗争的异议者——换言之,需要那种反潮流的保守派,他们认识到保守主义已沦为荒野中的孤魂;但荒野恰恰也是任何运动反思基本原则、重拾遗忘价值、叩问"我们究竟是谁"的理想之境。

        对这一提问,反潮流保守派的回答是:我们是信奉自由、自由市场、有限政府、个人责任、宪政主义、发展机遇、捍卫美国理念与制度(无论在国内还是国外)、谦逊、审慎、抱负与包容等原则的保守主义者。我们是传承伯克、托克维尔、巴克利与里根伟大传统的保守派。但这意味着我们已不再是如今的保守主义运动或共和党的一部分。

                                    (三)

        Max Boot: The Corrosion of Conservatism: Why I Left the Right (Liveright Publishing Corporation, 2018)

        在阅读这部作品之前,我完全不知道作者马克斯·布特是何许人,读完查阅资料才发现,他不仅曾是重要的保守派作家,还是著名的军事历史专家,作品《隐形军队:游击战的历史》、《战争改变历史》都已译成中文,所以不奇怪他也是共和党智库的重要声音,曾经担任多位共和党政治人物的顾问。

        这本书带有个人政治回忆录的性质,而非严谨的分析论证作品,所以很多地方作者都不加掩饰地表达自己的情感和反应——当然都是针对川普和他的支持者。事实上,在三人中,布特反川的情绪最为强烈,也走得最远,在大选中支持了民主党的希拉里,而且在川普获胜的第二天,就结束了自己的共和党身份,重新登记为独立人士。

        布特对川普的批评,既有政策层面,也有道德层面。就政策层面、尤其是他专长的外交与军事领域来说,他与川普可谓南辕北辙。他完全不赞同川普的孤立主义和保护主义,视之为对共和党及保守主义运动自二战以来倡导的自由贸易与国际主义的背叛。他更不能容忍川普对美国传统民主盟友的敌意,一方面对盟国领导人尽显粗鲁、轻蔑的态度,另一方面对过去一直视作威胁的强人统治的国家却赞誉有加,作者曾公开撰文指称川普为美国安全的头号威胁,书里也再次声言美国的国际地位正受到损害,而且这种损害是深刻而持久的。

        同时,川普毫无节制的言行更令作者感到道德的冒犯,在他看来,那些言行既有违总统的准则,更违背文明社会底线——而上一位作者塞克斯提到,极右翼曾为自己粗鄙嚣张、荒诞不经的言行找到一个辩护理由,那就是能够刺激自由派,凡是敌人憎恶的必是有价值的。然而我们看到,这几位保守派都同样不能接受这种做派。

        与塞克斯一样,布特也是抱一种历史的视角,从共和党的内部演变去看待川普的崛起,过去数十年共和党的历史,正是温和派遭驱逐、保守派接管,而后又被更极端右翼势力取代的循环,而川普不过是这种深层病灶的外在表征而已。作者以自己的亲身经历说明,过去共和党是以思想政党的形象来吸引人,而今天威廉·巴克利、欧文·克里斯托尔这样的思想者不见了,脱口秀主持人与电视名人取代了他们的位置,共和党与思想领域的联系日益疏离,而它的民粹姿态已然真实显现。

        布特既批评基督教右翼放弃道德原则去拥戴川普(对比克林顿弹劾案时,他们的领袖一再强调个人道德伦理是政治领袖的基本要求,为此强烈要求克林顿辞去总统职务),也痛斥他的旧友同僚牺牲保守主义信条去迎合权力,认为他们甚至比川普更为可恶,因为川普本就无知无识,他根本不懂总统——甚至普通正直的人——该如何行事。但他的许多支持者心知肚明,却因他掌控权力杠杆而甘愿自甘堕落以讨好他。尤为难得的是,作者并未止于对别人的批评,他也检讨了自己的失误(比如支持过小布什的伊拉克战争),从川普的当选里看到自己过去偏好的政策也起到不好的作用:

        我早知钢铁厂的凋敝与煤矿的废弃不会因特朗普当选而复苏——后续事态已印证此点——却未能真正体察内陆地区的绝望深渊,亦未意识到自身奉行的自由市场理念与全球化信仰如何加剧了这片经济废墟。我们这些资本主义的支持者(即便主张辅以福利国家保障),总惯于认定它终将为最广泛人群创造最大繁荣。当像我这样,身处繁荣沿海飞地、受惠于急速变革的经济、被同样奋力向上的进取者环绕时,持守此种意识形态何其轻易。长远而言这或许不假,然而当下,创造性破坏的代价对于缺乏信息革命所催生的转型技能之人,实可谓难以承受之重。

        此外,作者在种族、性别等议题上,也都有所反思。那他为什么不加入民主党呢?他说了,如果是克林顿夫妇那个温和立场的民主党,他是会欣然加入的;但他不能接受桑德斯和进步派的民主党,在他看来,他们与川普在诸多议题上观点一致——别的不说,至少在他的专长领域,他们同样倾向于保护主义和孤立主义,或至少持不干涉主义立场。

       写到这里,书已介绍完毕,文章似可结束。但我又担心全文给人这样一个印象,那些至今仍在支持川普的人都在道德上有缺陷,品德好的人都已离开他的阵营。

        我自己也常常受到很大的诱惑去做这样的判断,每每这种时候,我就用相反方面的例子,用我喜欢的意大利作家西洛内在自传《紧急出口》里的话提醒自己:

        我不同意我的一些朋友的天真想法,即俄国坦克镇压匈牙利起义是区分好人和坏人的最高考验。我们不能把自己的情感移植到别人的头脑中。同一事件对每个人的价值并不相同。我曾多少次希望它能如此——1936 年的大清洗审判之后,在里宾特洛甫-莫洛托夫条约之后,等等——但我的希望总是落空。人们的意识并不像交通信号那样同步。

 

(全文完。翻译借助了chatgptdeepseek等翻译网站。)

Wednesday, December 3, 2025

衛方·賀:与高全喜教授商榷特朗普新政

来源:微信,2025年11月

        在高全喜教授的一篇题名奇怪的文章特朗普?抑或:特朗普里,他提出了这样的观点:现在一百多天的新政过去了,虽然目前也还难以盖棺定论,但特朗普这一时期推行的内外政策所取得的对于美利坚共和国的重大成就,则是任何人都无法予以掩盖和否认的。他认为这一切都在兑现着他竞选总统时的承诺,所谓让美国再次伟大(MAGA)。他列举的重大成就我勉强分为六项,用他的原文表达:

       1)以两院通过美丽大法案为代表的美国内政,尤其是减少管制、减税和产业再造,让美国的产业链重新焕发生机;

       2)还有移民政策的非凡成绩,以及对于身份政治的破除,恢复传统价值观;

       3)还有以单边对等关税为主导的贸易政策;

       4)还有打破大学的意识形态堡垒;

       5)重建美国宪法的自由价值,捍卫美国的国家利益,限制政府乃至司法的滥权;以及

       6)让社区社会和商业贸易、高新科技充满活力。

         首先,特朗普政府究竟是否减少对经济的管制?不,他的一系列新政与其说是减少管制,不如说是强化干预与放松管制的矛盾体。例如,以美国再工业化为核心,通过关税(如钢铁业50%税率)和行政命令直接干预企业运营,包括强制日本制铁保留伊利诺伊州工厂至2027年,并获取对美钢企的黄金股监督权,这不是非常激烈的管制么?还有,容许特定企业得到出口许可,又强迫企业必须将利润的一定比例交给联邦政府,这不是严重干预么?此外,他的第三点所说单边对等关税,这类贸易壁垒的设置绝不仅仅是对外的;美国自己的进口商和消费者也要付出相应的代价。这很难说是减少管制吧?不过,有些事情他并不管制,例如他和第一夫人发行自家的钱币,名为模因币的,如此不受任何监管,作为一个总统,肆无忌惮地利用金融手段牟取私利,也是史无前例的创举了。

         至于说自建产业链以将美国的产业再造,更是大成问题。按照经典的自由资本主义的逻辑,资本的逐利趋向是天经地义的。同样一种产品,由于工人薪酬等差异,在美国生产获利甚微,但是在越南或中国却大赚其钱,为了复兴美国产业,强迫企业回归,这难道不是监管?不,不仅是监管,简直倒退到另一种计划经济了。

         其次,移民政策方面,非法移民的驱逐在拜登时期就已经付出很大努力,特朗普的所作所为也说不上是什么非凡成绩,况且还伴随着执法过程中大量的非法合法一起打的鲁莽灭裂举措。讽刺的是,特朗普爷爷当年来美国时就是非法移民,他的第一任和现任夫人都是来自东欧的移民,他对所谓非法移民的那种敌视态度不免让人联想到希特勒,后者因为自己有几分犹太人血统,因此对犹太人恨不得全杀掉而后快。高全喜教授所谓对身份政治的破除和恢复传统价值观,他语焉未详,猜想大约指的是民主党热衷的某些强化多元化和种族平等的举措吧。若如是,则美洲印第安人更可以倡言他们的北美传统价值,以原住民身份而排斥欧洲白种人,ASPA(盎格鲁撒克逊白种清教徒)云乎哉!谁是这片土地的主人还难说呢!

         说到大学,高全喜先生作为大学教授,居然赞赏特朗普打破大学意识形态堡垒,这真是让我瞠目结舌。他指责的美国大学都是所谓常春藤大学,的确,这些大学多偏向自由派,也就是偏向民主党的政策导向。其实,这在美国大学格局中也不奇怪,最好的私立大学往往偏左,这本身就是美国大学的一种生态平衡,顶尖大学偏左,但数量更多的二三流一般大学偏右,这种格局已经属于常态。最需要警惕的是,政府与私立大学之间的关系,按照保守党的基本理念,大学拥有基本的自治权利,不受政府干预,大学自家偏右或偏左,这是其自治事务,政府不可干预。即便哈佛真有当年麦卡锡主义扬言的查尔斯河畔的克里姆林宫倾向,那也是大学自己的选择。如今,特朗普政府居然运用各种手段,对于大学自治事务横加干预,甚至强令大学改变招生政策和课程设置之类本属于自治的事项,中国所谓保守派人士居然赞赏政府的强权行为,他们还号称自己是维护保守派观念,岂非咄咄怪事!

         至于高全喜教授所谓特朗普重建美国宪法的自由价值,捍卫美国的国家利益,限制政府乃至司法的滥权,我无话可说,什么重建自由价值,捍卫美国利益,何谓自由价值,何谓美国利益,如果他就任总统以来所作所为居然是重建自由价值,捍卫美国利益,我真的不知道什么是自由价值和美国利益,更不必说可笑的限制政府乃至司法滥权,政府滥权比比皆是,可否请高教授举出司法滥权的例证一二?

Wednesday, November 19, 2025

李飞飞:从文字到世界(from words to worlds)

微信2025-11-11)

                从文字到世界:空间智能是AI的下一个前沿

        1950年,当计算机还只是自动化算术和简单逻辑时,艾伦·图灵提出了一个至今仍回荡的问题:机器能思考吗?

         他能看到别人尚未看到的未来,需要非凡的想象力——那就是:智能或许有一天可以被构建,而非诞生

         这一洞见催生了一场持续至今的科学征程——人工智能(AI)。在我投身AI研究的25年中,图灵的愿景依然不断启发着我。但我们距离那一愿景有多近?答案并不简单。

         今天,以大语言模型(LLM)为代表的前沿AI技术,已经开始改变人类获取与处理抽象知识的方式。 然而,它们仍然是黑暗中的文字匠:能言善辩,却无经验;知识丰富,却缺乏根基。

         空间智能(spatial intelligence)将改变我们创造和交互现实与虚拟世界的方式——彻底革新叙事、创造力、机器人学、科学发现,以及更多领域。这,正是AI的下一个前沿。

         自我进入这一领域以来,对视觉与空间智能的探索就一直是我的北极星。这也是我为何花费多年时间构建了 ImageNet——首个大规模视觉学习与评测数据集。

         它与神经网络算法、现代算力(如GPU)一道,成为孕育现代AI的三大关键要素。也是为何我的斯坦福实验室在过去十年中,将计算机视觉与机器人学习相结合。

         同样,这也是我与联合创始人Justin JohnsonChristoph LassnerBen Mildenhall一年前共同创建 World Labs的原因:为了第一次真正实现这一可能性。

         在这篇文章中,我将解释什么是空间智能、为什么它重要、以及我们如何构建能够解锁它的世界模型(world models”——这种技术将深刻重塑创造力、具身智能与人类进步。

                      空间智能:人类认知的脚手架

        AI从未像今天这样令人振奋。以生成式AI为代表的模型,如LLM,已从研究室走向日常生活,成为数十亿人创作、生产与交流的工具。

         它们展示了曾被认为不可能的能力:生成连贯的文本、成山的代码、逼真的图像,甚至短视频。 AI是否会改变世界?——从任何合理的定义来看,它已经做到了。

         然而,仍有大量潜能未被触及。自动化机器人的愿景依然诱人却遥远;在疾病治疗、新材料发现、粒子物理等领域的研究加速梦仍未实现;

         真正能够理解并赋能人类创作者的AI,无论是学习复杂分子化学概念的学生、构想空间的建筑师、构建世界的电影人,还是任何希望沉浸于虚拟体验中的人都仍未到来。

         要理解为何这些能力依旧难以实现,我们需要回溯:空间智能是如何演化的?它又如何塑造了我们理解世界的方式?

         视觉长期以来是人类智能的基石,但它的力量源自更为根本的东西。早在动物能筑巢、抚育后代、用语言交流或建立文明之前,那看似简单的感知行为:感受到一缕光、触到一种质感就已经悄然点燃了通向智能的进化旅程。

         这种从外部世界汲取信息的能力,在感知与生存之间搭建起一座桥梁,而这一桥梁在漫长的进化中变得愈发复杂。

         神经元层层叠加,形成能解释世界、协调生物与环境互动的神经系统。因此,许多科学家认为,感知行动循环成为了智能进化的核心机制,也是自然孕育出我们这个物种的根基——一个能感知、学习、思考与行动的终极存在。

         空间智能在我们与物理世界的互动中扮演着基础性的角色。每天,我们都在依赖它完成最平常的动作。

         停车时想象车尾与路缘的距离;接住被抛来的钥匙;在人群中穿行而不碰撞;半睡半醒间准确地将咖啡倒进杯中。

         在极端情况下,消防员穿行于坍塌建筑与浓烟之中,瞬间判断稳定性与生死抉择,通过肢体语言和本能默契沟通——这些都无可言传。而婴儿则在学会语言前的漫长时光里,通过玩耍与环境互动来认识世界。

         这一切都在直觉中、自然而然地发生——一种机器至今未能获得的流畅能力。

         空间智能同样是我们想象力与创造力的基石。讲故事的人在脑中构建出丰富的世界,并用各种视觉媒介将之传达给他人。

         从原始洞穴壁画,到现代电影,再到沉浸式电子游戏。无论是孩子在沙滩上筑城堡,还是在电脑上玩《我的世界》,这种以空间为根基的想象构成了人与虚拟世界交互体验的基础。而在工业应用中,对物体、场景与动态交互环境的模拟则支撑着从工业设计、数字孪生到机器人训练等无数关键场景。

         历史上那些塑造文明的关键时刻中,空间智能往往扮演着核心角色。

         在古希腊,埃拉托色尼(Eratosthenes)通过对阴影的几何化思考完成了惊人的壮举——他在亚历山大测得太阳影子形成的7度角,并与赛恩(Syene正午无影的现象进行对比,从而计算出了地球的周长。

         哈格里夫斯(Hargreaves)发明的珍妮纺纱机同样源于空间洞察:他意识到只需将多个纺锤并列安装在一个机架上,一个工人就能同时纺出多股线,生产效率因此提高了八倍。

         沃森(Watson)与克里克(Crick)揭示DNA结构的突破,也依赖于他们亲手搭建的三维分子模型——他们用金属板与铁丝不断调整、拼接,直到碱基对的空间排布完美契合。

         在这些案例中,空间智能都推动了文明的进步——当科学家与发明家需要操纵物体、想象结构、在物理空间中推理时,这些能力是纯文字永远无法承载的。

         空间智能(Spatial Intelligence)是支撑人类认知的脚手架。

         无论是被动观察,还是主动创造,它都在默默发挥作用。

         它驱动我们的推理与规划,即便是在最抽象的主题上。它同样塑造了我们与世界互动的方式——无论是语言交流,还是身体行动,无论是与他人,还是与环境本身。

         虽然我们大多数人并不会每天像埃拉托色尼那样发现新的真理,但我们几乎时时刻刻都以同样的方式在思考通过感官去理解这个复杂世界,并依托对物理与空间规律的直觉认知,使其变得可理解。

         遗憾的是,当今的AI还无法以这样的方式思考。

         过去几年确实取得了巨大进步。多模态大语言模型(MLLMs),在文本之外又引入了大量多媒体数据进行训练,初步具备了空间感知能力:

         它们可以分析图像、回答与之相关的问题,甚至生成超写实的图像与短视频。与此同时,借助传感器与触觉技术的突破,最先进的机器人已经能在严格受限的环境中开始操控物体与工具。

         然而,坦率地说,AI的空间能力依然远未接近人类水平。其局限也显而易见:最先进的MLLM在估计距离、方向、大小等任务上,表现往往不比随机猜测好多少;它们无法心智旋转物体——即从新角度再现同一对象的形状;不会在迷宫中导航、识别捷径,或预测基本的物理规律;生成的视频虽然新奇炫目,却常在几秒钟后失去连贯性。

         如今的顶级AI擅长阅读、写作、检索与模式识别,但当涉及对物理世界的表征或交互时,却存在根本性局限。

         我们人类理解世界的方式是整体性的:不仅仅看到眼前的东西,还理解它们在空间上的关系、在语义上的意义、以及在现实中的重要性。

         而这种通过想象、推理、创造与交互来理解世界的能力,正是空间智能的力量。

         缺乏它,AI就与它所试图理解的物理现实脱节。它将无法真正安全地驾驶汽车、无法在家庭与医院中引导机器人、无法创造全新的沉浸式学习与娱乐体验、也无法加速材料科学与医学的发现。

         哲学家维特根斯坦曾写道:语言的边界就是我世界的边界。我不是哲学家,但我知道,AI而言,世界不止于语言。空间智能代表着超越语言的前沿

         它连接想象、感知与行动,为机器真正提升人类生活打开了新的可能:从医疗到创造力,从科学发现到日常辅助。

                    AI的下一个十年:构建真正具备空间智能的机器

        那么,我们该如何打造拥有空间智能的AI

         如何让模型具备:像埃拉托色尼那样的空间推理能力,像工业设计师那样的工程精度,像讲故事的人那样的创造性想象力,以及像应急救援人员那样与环境流畅互动的能力?

         要实现这样的AI,我们需要比LLM更具雄心的体系:世界模型(World Models)。

         这是一种全新的生成式模型,其在理解、推理、生成与交互方面的能力,将超越当今LLM所能触及的极限。它能够在语义、物理、几何与动态层面上,理解并生成复杂的虚拟或真实世界。

         这一领域尚处于萌芽阶段,现有方法从抽象推理模型到视频生成系统不等。

         World Labs成立于2024年初,正是基于这样一种信念:基础性方法仍在形成之中,而这将成为未来十年人工智能的决定性挑战。

         在这个新兴领域中,最重要的是确立指导发展方向的核心原则。对于空间智能而言,我将世界模型定义为具备以下三项核心能力的系统:

         1、生成性(Generative):世界模型能够生成具有感知、几何与物理一致性的世界

         要实现空间理解与推理,世界模型必须能够生成自身的模拟世界。

         它应能在语义或感知指令的引导下,生成无限多样、变化丰富的虚拟世界,同时保持几何、物理与动态上的一致性,无论这些世界是现实的还是虚拟的。

         研究界目前正在探索,这些世界应当以隐式(implicit)还是显式(explicit)的几何结构形式表示。

         除了强大的潜在表征(latent representations)之外,我认为通用世界模型的输出还应当允许生成显式、可观测的世界状态,以便适应不同的应用场景。尤其重要的是,模型对当下世界的理解必须与其过去的状态保持连贯一致——理解当前,就是理解它是如何演化而来的。

        2、多模态(Multimodal):世界模型在设计上就是多模态的

         正如人类与动物一样,世界模型应能处理多种形式的输入。在生成式AI领域中,这些输入被称为提示词(prompts

         面对不完整的信息——无论是图像、视频、深度图、文本指令、手势还是动作,世界模型都应能预测或生成尽可能完整的世界状态。

         这要求模型既要以真实视觉的精度处理图像输入,又能以同样的灵活性理解语义性指令。

         如此一来,无论是智能体还是人类,都能通过多样的输入形式与模型就世界进行交流, 并以多样的方式接收输出。

         3、交互性(Interactive):世界模型能根据输入动作输出下一个状态

         最后,当动作(actions)和/或目标(goals)作为输入提示的一部分时,世界模型的输出必须包含世界的下一个状态。

         这一状态可以是隐式的,也可以是显式的。当输入仅包含一个动作(有无目标皆可)时,世界模型应能生成与世界先前状态、预期目标状态(如有)、以及其语义意义、物理规律、动态行为相一致的输出。

         随着空间智能世界模型在推理与生成能力上不断增强,我们可以想象,未来模型不仅能预测世界的下一个状态,还将能够基于该状态预测下一步行动。

         这一挑战的规模,超越了AI以往所面临的一切。

         语言是人类认知中纯粹生成的现象,而世界遵循的规则则复杂得多。

         在地球上,例如:重力决定运动,原子结构决定光的颜色与亮度,无数物理定律约束着一切交互。

         即使是最奇幻、最具创造性的世界,也由遵守物理与动态规律的空间对象与智能体构成。

         要在模型中一致地协调这些——语义、几何、动力学与物理层面——需要全新的方法论。因为世界的维度远比语言这种一维的序列信号复杂得多。

         要实现像人类一样具备普适空间智能的世界模型,必须跨越若干巨大的技术壁垒。

         World Labs,我们的研究团队正致力于这一目标的基础性突破。

         以下是我们当前研究的几个方向示例:

         一种新的通用训练任务函数:在世界模型研究中,一个长期目标是定义一种像LLM下一个token预测一样简洁优雅的通用任务函数。然而,世界模型输入与输出空间的复杂性使这一函数的设计更加困难。尽管仍有大量探索空间,但这一目标函数及其对应表征必须符合几何与物理规律,忠实体现世界模型在想象与现实之间的落地表征本质。

         大规模训练数据:训练世界模型所需的数据远比文本复杂。好消息是我们已经拥有了庞大的数据资源。互联网上规模宏大的图像与视频集合为训练提供了丰富的素材。挑战在于:如何让算法从二维图像或视频帧(RGB)中提取更深层次的空间信息。过去十年的研究揭示了语言模型中数据量与模型规模的scaling law;对于世界模型,关键在于构建能够在相似规模上有效利用视觉数据的架构。此外,高质量的合成数据以及额外模态(如深度、触觉)的作用不可低估,它们在训练过程的关键阶段起到补充作用。未来的发展取决于更先进的传感系统、更稳健的信号提取算法、以及更强大的神经仿真方法。

         新的模型架构与表征学习:世界模型研究将不可避免地推动模型架构与学习算法的革新,特别是超越当下的多模态LLM与视频扩散模型(video diffusion)。这些模型通常将数据编码为一维或二维序列,使得简单的空间任务,例如在短视频中数清不同的椅子,或记住一小时前房间的样子变得异常困难。新的架构思路或许能改进这一点,例如具备3D4D感知能力的token化、上下文与记忆机制。例如,在World Labs,我们最近开发了一种基于帧的实时生成模型——RTFMReal-Time Generative Frame-based Model)。它以空间为基础的帧(spatially-grounded frames)作为空间记忆形式,实现了高效实时生成的同时,保持了生成世界的持续性与一致性。

         显然,在完全释放空间智能的潜力之前,我们仍面临艰巨的挑战。但这项研究不仅仅是理论工作,它正成为新一代创造性与生产力工具的核心引擎。

         World Labs的进展令人鼓舞。我们最近向部分用户展示了Marble的早期版本——全球首个可通过多模态输入生成并保持一致性3D环境的世界模型,让用户与创作者能够探索、交互并在其中继续构建他们的创意世界。我们正全力以赴,努力尽快将其向公众开放。

         Marble只是我们的第一步。随着研究的加速,科研人员、工程师、用户与商业领袖们都开始意识到这一方向的巨大潜能。下一代世界模型将使机器在空间智能上达到全新的层次,这将开启AI迄今仍普遍缺乏的核心能力,并真正让人工智能进入理解与创造世界的时代。

                     用世界模型为人类构建更美好的世界

        人工智能的发展动机至关重要。作为推动现代AI时代到来的科学家之一,我的动机始终十分明确:AI应当增强人类的能力,而非取而代之。

         多年来,我一直致力于让AI的开发、部署与治理与人类需求保持一致。

         当下关于技术乌托邦世界末日的极端叙事比比皆是,但我依然持一种更务实的立场:AI是由人开发、被人使用、并由人治理的。

         它必须始终尊重人的自主性与尊严。它的魔力在于拓展我们的能力,让我们变得更具创造力、更紧密相连、更高效并更有成就感。

         空间智能正体现了这一愿景——一种能赋能人类创造者、照护者、科学家与梦想家的AI,使他们实现曾经不可能的目标。这一信念,正是我将空间智能视为AI下一个伟大前沿领域的根本原因。

         空间智能的应用横跨不同的时间尺度。创作工具正在当下出现——World LabsMarble 已经让创作者与讲故事的人能够亲手掌握这种能力。

         机器人领域则代表着中期的雄心目标,我们正致力于完善感知与行动之间的闭环。而最具变革意义的科学应用可能需要更长时间,但它们将深刻地促进人类的福祉。

         在所有时间线中,有几个领域的潜力尤其突出,足以重塑人类的能力。要实现这些潜力,需要集体努力远超任何一个团队或公司的能力范围。

         它需要整个AI生态系统的参与:研究者、创新者、创业者、企业家,乃至政策制定者,共同朝着一个愿景努力。而这个愿景,值得我们追求。以下是未来的图景:

                 创造力:为叙事与沉浸体验注入超能力

        “创意,是智慧的乐趣。这是我最喜欢的爱因斯坦名言之一。

         在人类发明文字之前,我们就会讲故事——把故事画在洞穴壁上,代代相传,并以共享的叙事建立文化。故事是人类理解世界、跨越时空连接彼此、探索人之为人的方式,也是我们在生活与爱中寻找意义的途径。

         今天,空间智能有潜力彻底变革我们创作与体验叙事的方式,从娱乐到教育,从设计到建造,赋予它们更深远的影响力。

         World LabsMarble平台 将前所未有的空间表达能力与编辑控制权交到电影人、游戏设计师、建筑师及各类讲述者手中,让他们无需传统3D设计软件的繁复流程,就能快速创造、迭代、探索完整的三维世界。创造的行为依然是人类的核心活动——AI只是放大并加速创意实现的过程。这包括:

         多维叙事体验:电影人和游戏设计师可以利用 Marble 构建整个世界,不受预算或地理限制,探索传统制作流程中无法实现的场景与视角。随着媒介与娱乐的界限模糊化,我们正接近一种全新的互动体验形态——融合艺术、模拟与游戏的个性化世界,让任何人(而不仅仅是大型工作室)都能创造并进入自己的故事。

         以设计讲述空间故事:几乎所有被制造的物品或建造的空间,都必须在物理实现之前经过虚拟3D设计——这一过程往往耗费大量时间与成本。借助空间智能模型,建筑师可以在数分钟内可视化并漫游尚不存在的建筑;工业或时装设计师可以即时将想象转化为形态,探索物体与人体及空间的交互。

         全新的沉浸与互动体验:人类体验的最深层方式之一,就是创造意义的体验本身。在整个人类历史上,我们只共享一个三维世界:物理世界。直到近几十年,通过游戏与早期虚拟现实(VR),我们才得以初步窥见自造世界的可能。如今,空间智能结合VRXR(扩展现实)头显与沉浸式显示设备,将这种体验提升到前所未有的高度。未来,人们走进多维世界将如同打开一本书般自然。空间智能让造世界的权力从专业团队扩展到每一位拥有愿景的创作者、教育者与普通人。

                    机器人:具身智能的实践

        从昆虫到人类,动物都依赖空间智能来理解、导航并与世界交互。机器人也不会例外。

         自该领域诞生以来,具备空间感知的机器就是人类的梦想,包括我在斯坦福研究实验室与学生、合作者共同进行的研究。正因如此,我对用 World Labs 构建的模型实现这一愿景感到异常兴奋。

         通过世界模型扩展机器人学习:机器人的学习进步取决于可扩展的训练数据方案。要让机器人具备理解、推理、规划与交互的能力,它们需要覆盖极为庞大的状态空间。许多研究者认为,互联网数据、合成仿真数据与人类演示的真实采集三者结合,是实现可泛化机器人的关键。然而,与语言模型不同,如今机器人的训练数据极为稀缺。世界模型将在此发挥决定性作用。 随着其感知精度与计算效率的提高,世界模型生成的输出将迅速缩小模拟与现实之间的差距,从而让机器人能在数不清的状态、互动与环境中学习。

         人机协作伙伴:无论是实验室中协助科学家的研究助理机器人,还是陪伴独居老人的家用助理,机器人都可以扩展劳动力并提升社会生产力。但要做到这一点,机器人必须具备空间智能——能感知、推理、规划、行动,并且最重要的是:保持对人类目标与行为的同理一致。例如,实验室机器人可以替代科学家完成仪器操作,让人专注于需要推理的部分;家庭助理机器人则可以帮助老人做饭,而不剥夺他们的乐趣与自主性。真正具备空间智能的世界模型能够预测下一个状态,甚至推断与之匹配的下一步行动,是实现这一愿景的关键。

         扩展的具身形态:人形机器人只是我们为自身世界打造的一个形式。真正的创新红利将来自更加多样的设计:输送药物的纳米机器人、穿行狭窄空间的软体机器人、以及为深海或外太空而造的机器。无论形态如何,未来的空间智能模型都必须将环境与机器人自身的感知、运动一体化建模。但开发这些机器人面临的关键挑战在于:缺乏多样化形态的训练数据。世界模型将在这一过程中发挥关键作用——为仿真数据、训练环境与评测任务提供支持。

                 更长远的地平线:科学、医疗与教育

        除了创造性与机器人应用外,空间智能的深远影响还将延伸至更多能够增强人类能力、拯救生命、加速发现的领域。以下我将重点介绍三个具有深刻变革潜力的方向。当然,空间智能的应用远不止于此,它的影响范围几乎遍及所有行业。

         在科学研究中,具备空间智能的系统可以模拟实验、并行验证假设,并探索人类无法亲临的环境——从深海到遥远的行星。这项技术有望彻底变革气候科学、材料研究等领域的计算建模方式。通过将多维度模拟与真实世界数据采集相结合,这些工具能显著降低计算壁垒,拓展每一个实验室可观察与理解的边界。

         在医疗领域,空间智能将重塑从实验室到病床的全过程。在斯坦福,我与学生及合作者多年来一直与医院、养老机构以及居家患者合作。这些经验让我深信空间智能在医疗领域的变革潜力。AI可以通过多维建模加速药物研发,通过辅助放射科医生识别影像中的模式来提升诊断质量;它还可支持环境感知式监护系统,在不取代人类关怀的前提下,为患者与护理人员提供持续支持。更不用说机器人在不同场景中帮助医护人员和患者的巨大潜力。

         在教育领域,空间智能能够实现沉浸式学习,让抽象或复杂的概念变得可感知,并创造出符合人类大脑与身体学习方式的迭代体验。在AI时代,更快速、更高效的学习与技能重塑对于儿童与成人都至关重要。学生可以以多维方式探索细胞机器或亲历历史事件;教师可借助互动环境进行个性化教学;而外科医生、工程师等专业人士则能在高度逼真的仿真环境中安全地练习复杂技能。

         跨越这些领域,可能性是无限的,但目标始终如一:让AI成为增强人类专长、加速人类发现、放大人类关怀的力量——而不是取代那份属于人的判断力、创造力与共情力。

                    结语

        过去十年间,人工智能已成为全球现象,在科技、经济乃至地缘政治层面都带来了转折。

         然而,作为一名研究者、教育者和创业者,最令我振奋的仍是图灵七十五年前那道问题背后的精神。我依然与他共享那份好奇与惊叹——正是这份好奇,让我每天都为探索空间智能的挑战而充满动力。

         人类历史上第一次,我们正站在这样一个时刻:有望构建出与物理世界高度契合的机器,让它们成为我们应对重大挑战的真正伙伴。

         无论是加速疾病研究、革新故事叙述方式,还是在病痛、受伤或衰老的脆弱时刻给予支持,我们都正处于一场技术变革的门槛上,它将提升我们最珍视的生命价值。

         这是一个关于更深刻、更丰富、更有力量的生活的愿景。

         距自然在原始动物中首次显现空间智能的曙光已近五亿年,而我们有幸成为这一代技术创造者——可能即将赋予机器同样能力的人类,也有幸能将此能力用于全人类的福祉。

         若没有空间智能,我们关于真正智能机器的梦想将永远不完整。

         这场探索,是我的北极星。邀请你一同追寻它。

 

原文链接:https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence