与首席科学家Zhiyuan的对话:在大型模型中过度的
时间:2025-04-08 09:57 作者:365bet体育注册

资料来源:36KR所需的气泡。文字| Yu Lili封面的来源| IC图片当前出现的智能曲目落入了视线。一方面,朱小胡胡等投资者逃脱了泡沫,而另一方面,许多投资者在去年年底预测的这一方向反复活跃,并具有高价值融资。其中,除了一些新进入Zhijia公司外,一些公司的价值观去年涨幅强烈。腾讯对Zhiyuan机器人的最新赌注是最引人注目的。这也是在体现情报领域进行腾讯投资的第一个赌注。 2023年早些时候,这家公司由华为计算机产品线的前总裁邓太太(Deng Taihua)和“华为天才男孩”(Huawei Genius Boy)等人Zhihuijun创立了一张记录,该记录在其建立的一个月内完成了3亿天使融资。不仅如此,它在接下来的几个月中也很快达到了10亿美元,这成为了世界上最快的浮雕智能公司成为独角兽。在中国最明智的公司中,Zhiyuan无疑是最高知名度。市场上没有声音。在3月发布了第一个通用压花码头模型之后,Zhiiuan宣布与压纹智能公司体力情报(PI)建立合作伙伴关系。媒人是科学家Lu Jianlan,他昨天宣布了他的联合Zhiyuan。了解Lu Jianlan参与Google X和Google DeepMind研究工作。在伯克利人工智能实验室(BAIR)的博士后时期,SIA是PI的创始人之一Sergey Levine教授团队的主要成员。 Lu Jianlan分享了一些媒体,介绍了他为何加入Zhiyuan以及许多关于智能曲目的外部误解。以下是来自某些问题的摘录,并与暗流相结合。最终笑的人应该是整个软件堆栈路线和硬件集成。问题1:由于朱小胡胡的逃生,今天许多人认为体现的智力有很多泡沫。罗江:泡沫也意味着关注和资源,这是将赌注提出来。出现了大量资源,当他们达到一定的一点时,他们发现自己的期望没有得到满足,因此他们开始下降,并且在一段时间后他们可以再次开始上升。这是非常正常的。在此阶段,技术停车的每一步都将通过,例如自主驾驶。自2016年Waymo以来,到目前为止,自动驾驶真正看到了商业用途和着陆的曙光。体现的智能是一个更复杂和系统的事情,它指的是累积技术的时间更长,而不是通过计算功率或建模模型来分解。问题2:具体智能的最关键变量是最热模型的最热变量吗? Lu Jianlan:体现身体的过度评估是GR在这个行业中误解了饮食。这两个有相似之处。一些大型模型技术也可以转移到浮雕和机器人中,但不能相等。例如,Malmy LLM模型可以使用50%的精度为60%。因为您有某人的大脑,所以Chatgpt可以让您喝农药,所以不能喝农药,因为您要判断自己。但是在机器人中,这种准确性是没有用的。想象一下,您的家机器人每三个小时将杯子扔进咖啡桌,将手机扔出窗外,或者咖啡发送咖啡每20分钟释放咖啡。像Zhijia一样,与十年前相比,这两个物种的成功率很高,但所有这些都将具有更高的成功率。因为每种类似的失败行为都会对物理世界产生后果。因此,使用大型模型的周期比较体现的图像是对Katalesson在课程和行动智能上所面临的独特挑战的低估。问题3:作为不同阶段的演变,由大型模型和制造业涉及的大型模型和硬件部分表示的软件部分的重要性是什么? Lu Jianlan:软件和硬件同样重要。当前,该软件不会转换为一个点,并且硬件不会转换为一个点。目前尚未就两者的包含方式达成共识。问题4:软件和硬件中最关键的要点是什么? Lu Jianlan:就软件而言,即使大型模型很强,但很长一段时间内都不是记忆。很难尝试所有交叉任务,分层控制和实时反馈。无论是否使用仿真,都没有关于多少真实数据或需要多少合成数据的结论。这包括使用的RL,因为如果RL用于实现Realworld,样本效率,培训稳定性和一般泛化技能都是挑战。硬件,例如一些高性能的硬件平台,仍然非常昂贵的,某些传感器反馈还不够好,例如触觉传感器,没有达到成熟的状态,而且它们也有很好的改进空间。也有许多本体论,包括执行器在内的解决方案。我认为后者不是解决所有问题的本体论,但是基于不同行业和解决方案有许多标准化的本体。问题5:数据问题似乎是最有争议的,但与产卵和鸡产卵的问题非常相似。 Lu Jianlan:是的,看起来头部和尾巴在移动。如果没有数据,则很难在现实世界中部署机器人一定程度。但是您认为,如果1,000个机器人在星巴克,乘以7至24小时,一个月内发送的数据也可能超过我们今天看到的机器人数据集的大小。此外,机器人和汽车之间还有另一个区别。如果汽车不是100%确定的,那么您很难geT到现实世界,因为汽车的安全性在各个方面都过于严格。但是机器人可以从一些封闭和半封闭的空间开始,并且可以将其打开70%或80%的机会,以便更多的数据可以恢复和改进系统。问题6:在自主驾驶的早期阶段,关于数据问题也有很多讨论。 Lu Jianlan:当自动驾驶于2016年开始时,由于缺乏数据而进行了许多辩论。但是现在有很多数据。特斯拉去年以500亿英里的速度发布了Roadada的数据,并且无法安装数据中心。因此,我们应该记住的不是有很多数据,而是应该执行哪些算法设计以更好地连接数据。因此,硕士和生态产品拥有一家具体的智能公司,可以部署机器人本身将获得巨大的首要利益。问题7:您认为,整个软件和硬件堆栈路由是否需要?一些公司只想做自己的角色。罗Jianlan:在自主驾驶的早期,有些人专门从事大脑制造,但现在所有OEM都开始产生自主驾驶。十年前,当无人机非常受欢迎时,许多无人机公司出现在中国和埃斯塔德斯州。美国公司表示,他们不会做硬件。我记得当时,英特尔在美国开设了20多个实验室,并制作了无人机导航路线。当然,这是因为美国没有制造业,也没有工业链,所以它只能是大脑。但是现在您不记得它们,因为它们消失了。我们今天记得的名字是:DJI(DJI)。尽管只是大脑也可以与硬件结合使用,但我认为这应该是软件和硬件的全栈路线,您将最终笑。如果机器人意识到操纵,这是AGI问题8:Zhiyuan已经拥有CTO Zhihuijun,Yao Maoqing是Zhiyuan机器人研究的执行董事研究所,他也有技术背景。在报告您之间有关系吗?如何分裂劳动分工?罗江:我们有点平坦,高度的团队合作。 Zhihuijun在系统工程中有一些深入的积累。杨总统控制着战略方向的一般情况。我将更负责促进某些算法路线和某些外部技术生态的整合。我们有一个平行的关系,我们强调的不仅仅是集中在项目上的共识。问题9:Zhiyuan目前选择与PI(体育智能)合作? Lu Jianlan:首先,Zhiyuan和Pi在概念中具有许多兼容性,强调了真实数据的重要性,并促进了基于现实的体现智能的实施。这是合作的主要背景。此外,Pro确立的ITPESOR,例如Sergey Levine和Chelsea芬恩(Finn),体现情报领域的开拓者。目前,它是世界上最好的智力公司之一。问题10:在一家迎接的智能创业公司中,Zhiyuan使用一种生态方法来生成一家公司,该公司与使用大公司的方法非常相似。是故意的吗?罗江:我们认为,体现情报的复杂性不仅仅是一家公司负担得起的。因此,我们强调开放和协调。一方面,它可以帮助一些外部公司实现其某些局面,另一方面,它也将其技能引入了我们的生态系统。问题11:为什么没有像Openai这样的领先田野中的领先的明星公司?罗江:由于这个行业没有遇到一些特定的技术解决方案,因此没有人早些时候且声音很大。问题12:现在每个人都看到了许多有关机器人的演示视频。他们非常,但是最后,他们都是remo由人控制。我们如何做出独立的决定? Lu Jianlan:独立决策与遥控器之间的区别与您认为正在与Chatgpt交谈的差异,但实际上,它背后还有其他人在另一台计算机上打字。它完全完整是两件事。本质是对机器人和建模不确定性的评估,然后用实施的动作链代替。对于机器人,颜色的位置和变化与记得的不同之处。 Pangthis部分在理解范围,预言和机制方面的能力是最关键的技术。问题13:最近,明智的制造商愿意展示自己的肌肉技能。他们中的许多人专注于执行长周期和复杂的任务,每个实践点都不同。您如何指代长期和复杂的任务? Lu Jianlan:漫长的周期是一个非常主观的词。我们可能更担心AB完成一项任务,具有更复杂的依赖性和整体的能力,而不是在某些完整条件下,一分钟是很长的旋转,而少于一分钟是一个短周期。至于复杂的任务,至少操纵,Yushu可以是更多的本地运动。有一些未解决的抽水问题。例如,当机器人与外界接触时,复杂的物理现象和物理模型就会发展。然后,在多模式,高维视觉输入下,如何完成一些更高的敏捷任务,同时达到很高的成功率。这是50年来操纵最关键的挑战,我们将尝试做一些此类工作。问题14:操纵,机器人操纵问题,是当下的一部分。 Lu Jianlan:如果机器人确实实现了操纵,那就是Agi。这比LLM更先进。如果文明为零至十,LLM可以计数近三个,如果他的操纵已实施,至少应该有七到八。现在是进入体现精神的最佳时机。问题15:实施机器人AGI最感兴趣的是什么? Lu Jianlan:该系统如何进行研究和整体能力具有更强的独立技能。 2016年,在Google发布了深度机器人学习的第一个角色之后,它使用了基于学习的机器人要在现实世界中部署,但没有人,但今天它是独一无二的。我们在Zhiyuanxin建立的有源的智能研究中心不是一个简单的科学机构或简单的工程实施机构。这是一个中间状态,我希望它可以打开从主要科学到技术实施的链接。问题16:受大型模型的影响,强化研究也开始成为体现智能领域的一种趋势。 Lu Jianlan:现在Lahat开始朝这个方向看,因为我们有Deptseek R1和GPTO1。在50年历史的机器人领域,尽管许多教授已经为解决这些控件的一系列稳定性做了先驱,但我在过去的十年中注意到,该领域的发展始终来自其他领域,例如CV或NLP。今天有很多人浪潮,这些浪潮在当今具有体现的智力,其中一些是CVS,有些是基于学习的,也有一些主要的机器人,每个机器人都有不同的观点。问题17:如今,许多大型制造商,包括电子消费公司在内的行业也都进入了体现的情报。您认为像Zhiyuan这样的初创公司的独特好处是什么?罗江:许多人的命运实际上是一个积极的信号,表明他们更多地引起了人们的注意。作为下一代智能终端,机器人自然专注于电子消费公司。他们在用户体验,人工,成本控制和供应链集成中积累了非常有力的积累。像Zhiyuan这样的团队对他们对基础行业逻辑的理解有更大的好处。它们可以更垂直,更精致,我们可能会更好地使用智能,最终将相同的方向组合在一起。问题18:您认为智力的宝石是什么周期?现在仍然是进入市场的好时机吗?罗江兰(Lu Jianlan):从2016年开始,我觉得浮雕的身体已经过去了将近十年的探索。一开始,它被称为机器人研究。我认为这是卡帕纳(Kapana)现在的时间。几年后,我们将在某些特定的环境中看到一些成功。实际上,现在在全球现实世界中部署了500万个机器人,但它们都是盲人机器人,他们的运营依赖于完全定位并进行重复的编程和就业。在改善智能时,我们输入了机器人应用程序的窗口时间。虽然完美,但所有圆形机器人可能不会在十年甚至更长的时间内到达,但机器人有用在某些情况下的价值和持续的学习能力将早起。因此,现在是进入游戏并取得突破的最佳时机。