谷歌文本转图像人工智能模型Imagen首次公开亮相

2022-11-03 13:25 来源:IT之家

谷歌在发布其文本转图像的人工智能系统方面极为谨慎，尽管该公司的 Imagen 模型产生的输出质量与 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相当，但谷歌此前并没有将该系统向公众开放。

不过今天，这家搜索巨头宣布将把 Imagen 以非常有限的形式添加到其 AI Test Kitchen 应用中，作为一种收集关于该技术的早期反馈的方式。

AI Test Kitchen 是在今年早些时候推出的，目的是对谷歌的各种 AI 系统进行测试。目前，该应用程序提供了一些不同的方式与谷歌的文本模型 LaMDA 进行互动，该公司很快将增加类似的限制性 Imagen 请求，作为其所谓的应用程序“第二季”更新的一部分。简而言之，将有两种方式与 Imagen 互动：城市梦想家和 Wobble。

在“城市梦想家”中，用户可以要求模型生成围绕他们选择的主题设计的城市元素，例如，南瓜、牛仔布。Imagen 创建了样本建筑和地块（城市广场、公寓楼、机场等等），所有的设计都以类似于在《模拟城市》中看到的等距模型出现。

在 Wobble 中，你可以创造一个小怪物。可以选择它的材质（粘土、毛毡、杏仁糖、橡胶），然后给它穿上你选择的衣服。该模型会生成你的怪物，给它起个名字，然后你可以戳戳它，让它“跳舞”。

IT之家了解到，与其它文本到图像的模式相比，这些互动是非常受限制的，用户不能随便创造他们喜欢的东西。不过，这也是谷歌有意为之。谷歌产品管理高级总监乔希-伍德沃德（Josh Woodward）解释称，AI Test Kitchen 的全部意义在于：a）获得公众对这些 AI 系统的反馈；b）测试哪些行为会使得系统崩溃。

不过最大的问题是，谷歌是否会想把这些模型推向更广泛的公众，会采取什么形式？目前，该公司的竞争对手 OpenAI 和 Stability AI 正急于将文本-图像模型商业化，谷歌是否会觉得自己的系统足够安全，可以走出 AI Test Kitchen 提供给用户？

THE END

责任编辑：赵龙

相关阅读

恒鲁生物：“人工智能+合成生物”构建酵母细胞工厂2022-11-03
计算机专业以后想从事人工智能岗位需要重点学习哪些内容2022-11-03
人工智能，有望照亮10亿人的抑郁世界2022-11-03
人工智能在货币市场业务中的应用实践2022-11-02
Meta的人工智能音频编解码器承诺比MP3压缩率高10倍2022-11-02
继续擦亮中国人工智能名片云天励飞陈宁出席深圳企业家日2022-11-02
人工智能、艺术家和图像的未来2022-11-02
德承GPU运算旗舰机种GP-3000 抢搭AIoT人工智能物联网的新浪潮2022-11-02
躲避太空垃圾，未来！人工智能或可实现2022-11-02
有温度的人工智能：为科教兴国、人才强国贡献人大智慧！2022-11-02

展会预告

新品

多模态大模型产品亮相，海康威视发布文搜存储系列产品
近日，海康威视基于观澜大模型技术体系，将大参数量、大样本量的图文多模态大模型与嵌入式智能硬件深度融合…
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
误报率降低90%以上！海康威视发布视觉大模型周界摄像机
更准！海康威视发布大模型交通卡口抓拍系列产品
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
多模态大模型产品亮相，海康威视发布文搜存储系列产品

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

熵基科技发布《多模态生物识别技术白皮书》：科技向善，引领智能
人脸识别技术应用安全管理办法》的出台，标志着中国在隐私保护与技术规范领域的全新里程碑。
熵基科技发布《多模态生物识别技术白皮书》：科技向善，引领智能未来
智存未来，视界无界：希捷科技赋能广电行业“视听更美好”
多模态大模型产品亮相，海康威视发布文搜存储系列产品
上海新国际博览中心×海康威视：场馆运维数字化，为新一年会展举办助跑添力
华为AI训推超融合（DeepSeek一体机），推进AI行业化落地