谷歌文本转图像人工智能模型Imagen首次公开亮相

谷歌在发布其文本转图像的人工智能系统方面极为谨慎,尽管该公司的 Imagen 模型产生的输出质量与 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相当,但谷歌此前并没有将该系统向公众开放。

谷歌在发布其文本转图像的人工智能系统方面极为谨慎,尽管该公司的 Imagen 模型产生的输出质量与 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相当,但谷歌此前并没有将该系统向公众开放。

不过今天,这家搜索巨头宣布将把 Imagen 以非常有限的形式添加到其 AI Test Kitchen 应用中,作为一种收集关于该技术的早期反馈的方式。

AI Test Kitchen 是在今年早些时候推出的,目的是对谷歌的各种 AI 系统进行测试。目前,该应用程序提供了一些不同的方式与谷歌的文本模型 LaMDA 进行互动,该公司很快将增加类似的限制性 Imagen 请求,作为其所谓的应用程序“第二季”更新的一部分。简而言之,将有两种方式与 Imagen 互动:城市梦想家和 Wobble。

在“城市梦想家”中,用户可以要求模型生成围绕他们选择的主题设计的城市元素,例如,南瓜、牛仔布。Imagen 创建了样本建筑和地块(城市广场、公寓楼、机场等等),所有的设计都以类似于在《模拟城市》中看到的等距模型出现。

在 Wobble 中,你可以创造一个小怪物。可以选择它的材质(粘土、毛毡、杏仁糖、橡胶),然后给它穿上你选择的衣服。该模型会生成你的怪物,给它起个名字,然后你可以戳戳它,让它“跳舞”。

IT之家了解到,与其它文本到图像的模式相比,这些互动是非常受限制的,用户不能随便创造他们喜欢的东西。不过,这也是谷歌有意为之。谷歌产品管理高级总监乔希-伍德沃德(Josh Woodward)解释称,AI Test Kitchen 的全部意义在于:a)获得公众对这些 AI 系统的反馈;b)测试哪些行为会使得系统崩溃。

不过最大的问题是,谷歌是否会想把这些模型推向更广泛的公众,会采取什么形式?目前,该公司的竞争对手 OpenAI 和 Stability AI 正急于将文本-图像模型商业化,谷歌是否会觉得自己的系统足够安全,可以走出 AI Test Kitchen 提供给用户?

THE END
责任编辑:赵龙
免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!