竞泰资本
近日,谷歌放出了其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5。这是首个被广泛开放给所有开发者的Gemini机器人系列模型,它将作为机器人的高级推理大脑。
Gemini Robotics-ER 1.5(简称 Gemini Robotics-Embodied Reasoning)是一种视觉-语言模型 (VLM),可将 Gemini 的智能体功能引入机器人技术领域。Gemini Robotics-ER 1.5 是一款思考型模型,能够推理物理世界、原生调用工具,并规划逻辑步骤来完成任务。
展开剩余80%01
|Gemini Robotics-ER 1.5 有哪些新本事?
这是谷歌专门为机器人打造的AI模型升级版,更聪明、更灵活、更安全,能让机器人“听懂话、看懂事、做对事”。
1. 空间感更强,指哪打哪
像人一样“看懂”周围环境,能快速判断:哪些东西能拿起来?哪些太重或放不稳?能精准生成2D坐标点,比如你说:“把能拿的东西都指出来”,它能准确一个个指出来。而且反应很快,用的是轻量级的 Gemini Flash 模型,延迟低,不卡顿。
2. 能规划复杂任务,像人一样“动手+动脑”
可以完成需要“多步操作”的长任务,比如:“照着这张照片,把我的书桌重新整理一遍”不仅能看,还能想怎么搬、先放哪、后放哪,一步步规划清楚。还能“联网+调功能”,需要查资料?直接调用谷歌搜索。要分类垃圾?能调用本地垃圾分类规则等第三方程序。
3. 灵活控制“思考时间”
开发者可以自己调节要快,还是要更准?复杂任务(比如组装机器人),让AI“多想一会儿”,结果更靠谱。简单任务(比如指个物体),要求“立刻响应”,不耽误事。就像人做事:重要的事多思考,小事秒反应。
4. 更安全,不做“做不到的事”
新增了“安全过滤器”,能识别不现实的指令。比如:“举起一辆汽车”——机器人举不动,AI会直接说“不行”。“穿过一堵墙”——违反物理规律,AI也会拒绝。避免机器人瞎执行、出事故,让开发者用得更安心。
02
|机器人的“超级大脑”
Gemini Robotics-ER 1.5 不只听命令,还能真正理解复杂的指令,比如你说:“把桌子收拾干净”,它不会傻愣着,而是会自动拆解任务,先判断桌上有什么——书、杯子、纸屑……哪些要收,哪些要扔。
制定行动计划,先拿杯子,再放书,最后清理垃圾。调用合适的工具,控制机械臂的硬件。启动专门的“抓东西”AI模型。使用“看图说话+动作控制”的VLA模型来精准操作。整个过程一气呵成,像人一样“边看边想边做”。
机器人要在真实世界干活,必须“看得准、指得对”。Gemini Robotics-ER 1.5 特别擅长这一点:它能精确判断物体的位置,生成准确的2D坐标(就像地图上的定位点)。比如你让机器人“指一下那个水杯”,它能精准指向杯子把手或中心位置,误差极小。目前,在所有视觉语言模型中,它的指向精度是最高的。
简单说:有了这个“大脑”,机器人不再只是执行死命令的机器,而是能理解、规划、精准操作的智能助手,离“听话好用”的目标又近了一大步。
03
|机器人行业的未来方向:用AI走向“具身智能”
头部公司的一举一动,都指向一个大趋势:未来的机器人,必须自己有“大脑”——自研AI模型,是通往通用智能的必经之路。真正能走远的,只会是极少数具备以下能力的企业。全链条技术能力(从硬件到软件全都能做)。能整合芯片、算法、数据等资源。有长期投入的耐心和战略。
“大脑+小脑”,才是下一代机器人。现在的机器人行业,已经不再只靠“写死程序”来控制动作了。大家正转向用大模型来突破传统控制的瓶颈,比如:用大语言模型理解人类指令;借自动驾驶模型感知环境;靠多模态模型融合视觉、语音、动作。
行业重点也变了:从“单个动作”转向打造“大脑(决策)+小脑(协调)”的智能系统。
谁能胜出?未来,只有极少数技术全面、布局深远的公司,才能把各种技术“收拢”成一套标准,真正定义什么是“具身智能”——也就是:能理解世界、自主学习、灵活行动的通用机器人。
一句话,没有AI大脑的机器人,未来只能算“机器”;有大脑的,才叫“智能体”。
这场竞赛,才刚刚开始。
04
竞泰观察|三条主线,抓住“机器人智能”红利
1. 关注机器人本体厂商的“AI升级”机会
已有硬件+接入Gemini ER = 智能跃升。利好:服务机器人(家庭、医疗、清洁);工业协作机器人(如优必选、埃斯顿、节卡);自动驾驶公司(同样需要物理推理能力)。
2. 布局“AI+机器人”中间件与平台公司
ER 1.5是“大脑”,还需要“神经系统”来连接硬件。关注:ROS(机器人操作系统)生态企业;机器人中间件、仿真平台、AI集成服务商。
3. 长期押注“具身智能”应用场景
家庭助理机器人:“帮我找钥匙、热饭、关窗”;医疗护理机器人:“协助老人起坐、递药”;仓储物流机器人:“自主分拣、应对异常包裹”。哪些场景最需要“高级推理”就最可能率先爆发。
发布于:四川省众和配资-配资网站免费-上海配资网-网上配资门户提示:文章来自网络,不代表本站观点。