谷歌新推Gemini大模型，多模态优势尽显，将与机器人结合

admin AI新闻 2026-06-21 2

日前, 有报道称谷歌正式推出了大模型Gemini, 其最大亮点之一在于设计时便原生支持多模态, 能够实现泛化并可无缝对不同类型信息予以理解、操作以及组合, 这些信息涵盖文本、代码、音频、图像和视频, 相比现有（近似）多模态模型有着显著优势, 而且其能力在几乎每个领域都堪称最强。谷歌研发负责人Hassabis透露, 谷歌DeepMind一直在研究如何把Gemini与机器人技术相连, 进而与世界达成物理交互。他宣称, 崭新的多模态模型会成为智能体的根基, 会成为规划与推理的根基, 会成为游戏的根基, 甚至会成为物理机器人快速创新的根基 , 他说道！

借助多模态技术, 人机交互的效率以及质量能够得以提升, 如此一来, 用户同计算机做交互可以更显自然之感, 也能够更具直观性了。在机器人领域这个多模态应用颇为重要的场景范畴内, 借助多模态技术, 其所发挥的作用致使对应操作不但确保动作控制更精确, 更加进动作控制的高效性与过程协调性, 进而提升了机器人工作的效率, 优化了机器人应用的作业质地呢。此前, 由谷歌大模型PaLM-E驱动的机器人, 能够执行长跨度任务, 能够执行规划任务,在给定图像的情形下还能讲述笑话等开云真人app官网登录app, Gemini期望被应用于完善机器人任务层的实践里面, 以此推动人形机器人等细分产业加速实现商用, 相关领域的公司期望迎来机遇。

华泰证券发布的研报表明, 机器人大模型的终极目标是提升人形机器人于不同场景以及任务当中执行的成功率, 就限定的应用场景与任务来说, 从决策层面、感知层面以及执行层面三方面出发, 大模型理应具备自主可靠的决策能力, 多样化的模态感知能力以及即时精准的运控能力, 为了能够延伸至多样繁杂的应用场景跟任务, 大模型还得具备广域普遍的应用能力以及突发的展现能力, 当下大模型不停地更替改进, 已然浮现出涵盖多种能力的出色者, 然而依旧存在感知模态不完备, 及时性欠佳以及泛域一般性能力薄弱等状况。需在未来持续优化训练模型结构,优化训练方法开云真人官方下载, 优化数据集, 把多模态感知信息纳入模型,与此同时提高控制指令的生成速度世界杯2026直播平台, 提高大模型的泛化能力, 提高大模型的涌现能力。

中泰证券机械团队宣称, 鉴于后续会有大规模降本要求, 国产设备进行替代是必然趋势。并且, 滚柱丝杠在生产进程里所需的螺纹磨床或者车磨一体设备具有较大弹性, 要紧密留意浙海德曼（此为车床）、日发精机（包含磨床、车床）、华辰装备（为磨床）、海天精工（是铣床）、宇环数控（属磨床）等公司的研发进度。

国联证券持有这样的观点, 国内人形机器人这一产业会促使产业链各个环节得以发展, 一方面提示应去关注, 处于 AI 大模型、自动驾驶、算法算力这些方面存在优势并且有希望达成“数据闭环”的公司, 像华为技术、小米科技、小鹏汽车等这样处于产业链上相关环节的公司。另一方面硬件端在视觉系统、传感器、电池、热管理、谐波减速器、丝杠、空心杯电机、无框力矩电机、行星减速器、轴承、精密齿轮箱、机床等环节拥有技术优势亦是性价比高的公司, 着重推荐伟创电气、东华测试、信测标准。可以从中获得益处的目标对象有, 汇川技术, 禾川科技, 步科股份, 绿的谐波, 贝斯特, 五洲新春, 柯力传感, 奥比中光, 奥普光电, 鸣志电器, 拓邦股份。

标签： Gemini大模型多模态机器人技术人机交互产业链发展

本文地址： http://mcluo.com/post/1886.html