前Stripe高管拉基·格鲁姆新创公司Physical Intelligence,打造硅谷最热机器人智能大脑

2026-04-19 06:20来源:本站

  前Stripe高管拉基·格鲁姆新创公司Physical Intelligence,打造硅谷最热机器人智能大脑

  【编者按】在硅谷,一家名为Physical Intelligence的初创公司正悄然掀起一场机器人革命。这里没有炫目的logo,没有豪华的前台,只有一群执着的研究员和机械臂在反复练习叠裤子、剥西葫芦。他们相信,真正的通用机器人智能不在于硬件有多精密,而在于“大脑”有多强大——就像ChatGPT之于文字,他们正在为物理世界创造一个通用智能基座。当业界追逐商业化落地时,他们选择埋头积累数据;当竞争对手宣称已创收数千万美元时,他们仍坚持“不设商业化时间表”。这究竟是硅谷式的理想主义,还是颠覆性技术诞生前的必要蛰伏?让我们走进这个混凝土空间,看机械臂如何笨拙而坚定地学习人类世界的常识。

  从街道上看,我在旧金山找到Physical Intelligence总部的唯一线索,是门上那个颜色略不同于门板的π符号。走进去,扑面而来的是忙碌的景象。没有接待台,没有荧光灯下闪耀的logo。

  内部空间像一个巨大的混凝土盒子,随意摆放的浅色长木桌稍微缓和了这里的冷峻感。有些桌子显然是用来吃午餐的,散落着女童子军饼干盒、 Vegemite酱罐子(这里肯定有澳大利亚人),以及塞了过多调味料的小铁丝篮。其他桌子则完全是另一番景象。更多的桌子上堆满了显示器、备用机器人零件、缠绕的黑线,以及完全组装好、正处于不同“修炼阶段”的机械臂——它们正试图掌握那些平凡琐碎的任务。

  在我参观期间,一只机械臂正在折叠一条黑裤子,或者说,试图折叠。进展不太顺利。另一只正以一股“不成功便成仁”的劲头,试图把一件衬衫里外翻转,看样子它最终能成功,但肯定不是今天。第三只——这只似乎找到了它的使命——正在快速削西葫芦皮,之后它应该把削下的皮放进另一个容器。至少,削皮工作进行得不错。

  “把它想象成ChatGPT,但是给机器人用的,”谢尔盖·莱文指着房间里正在上演的电机芭蕾对我说。莱文是加州大学伯克利分校的副教授,也是Physical Intelligence的联合创始人之一,他态度友善,戴着眼镜,一副花了大量时间向不太能立刻理解复杂概念的人做解释的模样。

  他解释说,我看到的是一个持续循环的测试阶段:数据从这里和其他地方(仓库、家庭,团队能设点的任何地方)的机器人工作站收集,这些数据用于训练通用机器人基础模型。当研究人员训练出一个新模型,它会回到这样的工作站进行评估。那个叠裤子的机械臂是某人的实验,翻衬衫的也是。削西葫芦皮的机械臂可能在测试模型能否将技能推广到不同蔬菜上,学习削皮的基本动作,以便能处理它从未见过的苹果或土豆。

  公司在这栋建筑和其他地方还设有一个测试厨房,使用现成的硬件让机器人接触不同的环境和挑战。附近有一台复杂的意式咖啡机,我原以为是给员工用的,直到莱文澄清说,不,那是给机器人学习的。任何打出的奶泡拿铁都是数据,而不是给现场几十位工程师的福利——他们大多正盯着电脑或俯身于他们的机械实验。

  硬件本身 deliberately 毫不起眼。这些机械臂售价约3500美元,莱文说这还是供应商“巨额加价”后的价格。如果他们自己制造,材料成本将降至1000美元以下。他说,几年前,机器人专家会震惊于这些东西居然能做事。但重点就在于此——优秀的智能可以弥补硬件的不足。

  莱文告辞后,拉奇·格鲁姆朝我走来,他穿行于空间中的样子,带着一种同时处理五六件事的 purposeful 目的性。31岁的格鲁姆仍保持着硅谷神童那种清新的面孔,这个称号他早年就得来了——13岁时在澳大利亚老家创立的第一家公司,九个月后就卖掉了(这解释了Vegemite的存在)。

  早些时候我第一次找他时,他正欢迎一小群穿着连帽衫的访客进入大楼,对于我占用他时间的请求,他立刻回应:“绝对不行,我有会。”现在他也许有10分钟。

  格鲁姆是在开始关注莱文和切尔西·芬恩实验室的学术成果时,找到了他一直在寻找的东西。芬恩曾是莱文在伯克利的博士生,现在斯坦福运行自己的实验室,专注于机器人学习。他们的名字不断出现在机器人领域所有有趣进展中。当他听到传闻说他们可能正在筹备什么时,他找到了卡罗尔·豪斯曼,一位也在斯坦福任教、格鲁姆得知参与其中的谷歌DeepMind研究员。“那是一次典型的‘就是它了’的会面,开完会走出来你就知道,就是它了。”

  格鲁姆告诉我,他从未打算成为一名全职投资者,尽管有些人可能觉得以他的履历为什么不呢。离开他作为早期员工所在的Stripe后,他做了大约五年的天使投资人,早期投资了Figma、Notion、Ramp、Lattice等公司,同时寻找合适的公司去创立或加入。他的第一笔机器人投资是2021年投给Standard Bots,这让他重新接触到了小时候搭建乐高Mindstorms时就热爱的领域。他开玩笑说,作为投资者他“度假时间多得多”。但投资只是保持活跃和结识人的方式,不是最终目标。“离开Stripe后,我花了五年时间寻找要加入或创立的公司,”他说,“好的时机、好的团队、好的想法——这极其罕见。执行力固然重要,但你在一个烂点子上拼命执行,它还是个烂点子。”

  这家成立两年的公司现已融资超过10亿美元,当我问及资金消耗时,他迅速澄清实际烧钱没那么快。大部分支出用于计算资源。片刻之后,他承认,在合适的条件下,与合适的伙伴合作,他会筹集更多资金。“我们真正能投入使用的资金没有上限,”他说,“总可以投入更多算力来解决问题。”

  这种安排特别不寻常之处在于格鲁姆没有给投资者的一样东西:将Physical Intelligence转变为盈利项目的时间表。“我不给投资者关于商业化的答案,”他谈到包括Khosla Ventures、红杉资本和Thrive Capital在内的投资者时说,这些投资者给公司的估值是56亿美元。“这有点奇怪,人们居然能容忍。”但他们确实容忍了,而且可能不会永远容忍,这就是为什么公司现在资金充裕是明智之举。

  那么,如果不是商业化,战略是什么?另一位来自谷歌DeepMind的联合创始人Quan Vuong解释说,战略围绕跨实体学习和多样化数据源展开。如果明天有人构建了一个新的硬件平台,他们不需要从头开始收集数据——他们可以转移模型已有的所有知识。“将自主能力搭载到新的机器人平台上的边际成本,无论那是什么平台,都会低得多,”他说。

  公司已经在与少数不同垂直领域的公司合作——物流、杂货、街对面的一家巧克力制造商——以测试他们的系统是否足够好,能用于现实世界的自动化。Vuong声称,在某些情况下,他们已经做到了。凭借其“任何平台,任何任务”的方法,成功的表面积足够大,可以开始勾选那些今天已准备好实现自动化的任务。

  追逐这一愿景的不止Physical Intelligence一家。构建通用机器人智能的竞赛正在升温——这是构建更专业化应用的基础,就像三年前吸引世界的LLM模型一样。总部位于匹兹堡、成立于2023年的Skild AI,就在本月以140亿美元的估值筹集了14亿美元,并且采取了明显不同的方法。虽然Physical Intelligence仍专注于纯研究,但Skild AI已经将其“全能体”Skild Brain商业化部署,称去年仅在几个月内就在安防、仓库和制造领域创造了3000万美元的收入。

  Skild甚至公开抨击竞争对手,在其博客上辩称,大多数“机器人基础模型”只是“伪装”的视觉语言模型,缺乏“真正的物理常识”,因为它们过于依赖互联网规模的预训练,而不是基于物理的模拟和真实的机器人数据。

  这是相当尖锐的哲学分歧。Skild AI押注商业部署会创造一个数据飞轮,每个现实世界的用例都能改进模型。Physical Intelligence则押注,抵制近期商业化的诱惑将使其能产出更优越的通用智能。谁“更正确”需要多年才能见分晓。

  与此同时,Physical Intelligence以格鲁姆所说的异常清晰的方式运作。“这是一家非常纯粹的公司。研究员有需求,我们就去收集数据来支持那个需求——或者新硬件,无论是什么——然后我们就去做。它不是外部驱动的。”公司曾有一个5到10年的路线图,规划团队认为可能实现的目标。他说,到第18个月,他们已经超额完成了。

  公司约有80名员工,并计划扩张,不过格鲁姆说希望“尽可能慢地增长”。他说,最具挑战性的是硬件。“硬件真的很难。我们所做的一切都比软件公司困难得多。”硬件会坏。到货慢,延误测试。安全考虑使一切复杂化。

  当格鲁姆跳起来赶赴下一个约定时,我留下来看着机器人继续练习。裤子仍然没叠好。衬衫仍然顽固地正面朝外。西葫芦皮堆得不错。

  存在一些明显的问题,包括我自己的疑问:是否真的有人想要一个机器人在厨房削蔬菜皮?关于安全性,关于狗对家里的机械入侵者发狂,关于投入这里的所有时间和金钱是否解决了足够大的问题,还是创造了新问题。与此同时,外界质疑公司的进展,质疑其愿景是否可实现,以及押注通用智能而非特定应用是否有意义。

  如果格鲁姆有任何疑虑,他也没有表现出来。他正在与那些在这个问题上钻研了数十年的人合作,他们相信时机终于成熟了,而这正是他需要知道的全部。

  此外,硅谷从一开始就一直在支持像格鲁姆这样的人,并给予他们很大的自由度,深知即使没有明确的商业化路径,即使没有时间表,即使不确定到达时市场会是什么样子,他们也很可能找到出路。这并不总是成功。但当它成功时,往往能证明许多次的不成功是值得的。

纳趣吧声明:未经许可,不得转载。