英伟达研究人员在机器人灵活性方面取得了重大飞跃,这要归功于 Eureka,这是一种人工智能代理,据称可以像人类一样熟练地教机器人复杂的技能,比如转笔技巧。
机器人与人类互动,人工智能,AI© 由 站长之家 提供
图源备注:图片由AI生成,图片授权服务商Midjourney
根据上周四发布的一份论文,这项新技术建立在近期对大型语言模型(例如 OpenAI 的 GPT-4)的进展之上。Eureka 利用生成式 AI,自主编写复杂的奖励算法,使机器人能够通过反复试验和强化学习来学习。论文中指出,这种方法已经比人工编写的程序更有效,提高了 50% 以上。
英伟达的官方博客中表示:「Eureka 还教会了四足机器、灵巧机械手、协作机械臂和其他机器人打开抽屉、使用剪刀、接住球以及近 30 项不同的任务。」
Eureka 是英伟达在引导 AI 语言模型方面的最新示范。最近,该公司开源了 SteerLM——一种通过训练 AI 助手获取人类反馈,使其更有帮助性的方法。
与 Eureka 类似,SteerLM 也利用了语言模型的进展,但将其重点放在了不同的挑战上——改善 AI 助手的对齐。SteerLM 通过让助手进行会话练习来进行训练,就像机器人通过实践学习一样。该系统通过乐于助人、幽默和质量等属性对助理的反应提供反馈。
例如,这就像一个机器人从标记为好或坏的视频中学习跳舞,而不是让人类审核成千上万个随机跳舞并选择哪些是好的或不好的(这是典型的 AI 聊天机器人的训练方式)。通过不断练习并获得反馈,助手学会提供适合用户需求的回应。这有助于使 AI 在实际应用中更有益。
共同之处在于创造性地将先进的神经网络应用于新的领域,不论是教机器人还是聊天机器人。英伟达在硬件和软件两方面都在突破界限。
对于 Eureka 来说,关键在于将 Isaac Gym 等模拟技术与语言模型的模式识别能力相结合。Eureka 有效地「学会学习」,在多次训练中优化自己的奖励算法。它甚至接受人类输入以调整奖励。
到目前为止,这种自我改进的方法已被证明具有高度的通用性,可以训练各种类型的机器人——四足、轮式、飞行和灵巧机械手。
英伟达的 Eureka 和 SteerLM 不仅打破了障碍,还向机器人和人工智能传授技巧和富有洞察力的交互艺术。通过每一次挥笔和机智的聊天,他们正在勾勒出一个未来,人工智能不仅会模仿,而且会与我们一起创新。
访谈
更多做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…
博思高邓绍昌:乘产品创新及客户服务之舟,在市场变革中逆风飞扬
11月24日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会,在深…