谷歌机器人现已能思考、搜索网络并自主学习新技能

新闻要点
谷歌DeepMind发布了两款新的AI模型:Gemini Robotics 1.5和Gemini Robotics-ER 1.5,旨在显著提升机器人的智能水平。这些模型使机器人能够进行推理、规划、主动使用网络工具(如谷歌搜索)来获取信息,并能将所学技能在不同机器人之间传递,从而实现通用化能力,超越了传统遵循预设脚本的机器人。 Gemini Robotics-ER 1.5充当“大脑”,负责制定多步骤计划和进行信息搜索,而Gemini Robotics 1.5则是一个视觉-语言-动作模型,将指令转化为实际的物理动作。这些机器人已经能够执行复杂的任务,例如根据在线天气预报整理行李或查询当地回收规定正确分类垃圾。虽然目前在复杂任务上的成功率在20%至40%之间,但这标志着机器人在理解细微差别和泛化能力方面取得了“基础性进展”。 谷歌CEO桑达尔·皮查伊强调,这些模型是迈向“真正有用的通用机器人”的重要一步。谷歌的策略是专注于AI的适应性,这与特斯拉(侧重于大规模生产)和波士顿动力(专注于机器人运动能力)等其他竞争对手的方法有所不同。Gemini Robotics-ER 1.5已通过Gemini API向开发者开放,而Gemini Robotics 1.5则面向特定合作伙伴。
背景介绍
人工智能和机器人技术是一个快速发展的领域,谷歌、特斯拉和波士顿动力等主要科技公司都在此领域投入巨资。长期以来,“泛化能力”(即机器人在新情境下应用所学知识的能力)一直是AI和机器人技术面临的重大挑战,传统机器人通常需要工程师对每一步进行精确编程。 谷歌DeepMind是谷歌旗下领先的AI研究部门,以其在人工智能领域的突破性工作而闻名。此次发布正值美国积极推动国家机器人战略之际,旨在提升其在全球机器人行业的竞争力,以应对中国将AI和智能机器人列为国家优先发展事项的背景。中国目前是全球最大的工业机器人市场。
深度 AI 洞察
谷歌在通用机器人领域的进展对工业自动化和劳动市场有何潜在影响? - 谷歌对AI驱动的通用机器人投入,预示着工业自动化可能从任务特定型向适应性更强、多功能型转变。这意味着机器人将不再局限于单一重复性劳动,而是能处理更广泛、更复杂的任务,尤其是在非结构化环境中。 - 长期来看,这将显著提高生产效率并降低运营成本,对依赖大量重复劳动力的行业构成颠覆性影响。企业可能加快机器人部署,以应对劳动力短缺和成本上升的压力。失业率可能因传统蓝领工作的自动化而上升,但同时也会催生对机器人维护、AI开发和相关服务的新需求。 - 这种转变将迫使劳动力市场加速转型,要求工人提升技能以适应新的工作角色,并可能加剧社会对通用人工智能(AGI)潜在影响的担忧。 考虑到美国和中国在AI和机器人领域的竞争,谷歌的此次发布如何影响地缘政治和技术主导权? - 谷歌的突破性进展可能增强美国在AI和机器人技术前沿领域的领导地位,尤其是在软件和AI模型层面,这与中国在工业机器人部署规模上的优势形成对比。 - 美国特朗普政府可能会将此视为国家技术优势的体现,并借此推动其“美国制造”和技术自主战略。这可能促使美国加大对国内AI和机器人研发的投资,并可能通过出口管制或技术联盟进一步限制中国获取关键AI技术,加剧两国在科技领域的竞争。 - 这种竞争将加速全球技术生态系统分裂,各国可能被迫在技术标准和供应链上选边站队,对全球化和供应链韧性构成挑战。 从投资角度看,谷歌对AI适应性机器人的押注会如何重塑科技行业的投资格局? - 谷歌专注于AI模型和适应性,而不是硬件量产或纯粹的运动能力,这可能引导投资转向软件、AI算法和平台服务,而非传统机器人硬件制造。 - 投资者可能会寻找那些能够开发或集成类似通用AI能力的公司,尤其是在边缘计算、传感器技术和数据处理方面有优势的企业。那些能够提供跨行业、多场景解决方案的AI软件公司将更具吸引力。 - 传统机器人硬件公司可能面临转型压力,需要与AI软件提供商建立更紧密的合作关系,或投资于自身AI能力的开发。这可能引发行业内的并购活动,以整合软件和硬件能力,形成更全面的解决方案提供商。