2022年底,ChatGPT横空出世,掀起新一轮AI浪潮。
2023年,AI大模型风起云涌,全球范围内各大巨头在AI领域动作频频,各类AI大模型层出不穷。
2024年开春之际,AI圈热度再次升温,迎来颠覆性进展。
2月16日,谷歌宣布推出全新的Gemini1.5 AI模型,这是迄今为止谷歌的最大模型。据了解,Gemini 1.5建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合(MoE)架构使Gemini 1.5的训练和服务更加高效,并且可以处理128000个token的标准情境窗口。
无独有偶。同一天里,OpenAI掷下一颗“深水炸弹”,毫无预兆地发布了文生视频大模型Sora,并迅速成为了讨论的焦点,引起业内广泛关注。
根据OpenAI官网,Sora完美继承了DALL·E3的画质和遵循指令能力,能够根据用户的一句话直接生成长达1分钟的高质量视频,包含了高度细致的背景、复杂的多角度镜头,以及情感丰富的多个角色。OpenAI表示,他们正在教授AI理解和模拟运动中的物理世界,旨在帮助解决现实世界交互问题。
一位时髦的女士漫步在充满霓虹灯光的东京街头上;图源:OpenAI官网
当前,OpenAI官网上已经更新了48个视频demo。在这些视频demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。而且该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。
不过,OpenAI也承认,Sora这个模型不是完美的,其仍存在一些局限性,在某些细节生成上还存在问题,比如复杂物理场景中的错误物体等。但Sora所展示出的强大的文生视频能力,已足以让影视行业感受到了前所未有的冲击。
与此同时,自ChatGPT掀起全球浪潮以来,国内AI大模型公司也迎来了迄今获得的单轮最大金额融资。
据悉,AI创业公司“月之暗面”近期完成了新一轮超10亿美元融资,投资方包括阿里巴巴、美团、小红书和红杉中国等。本轮融资后,月之暗面估值已达约25亿美金,为国内大模型领域的头部企业之一。
公开资料显示,月之暗面成立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能。公司创始团队核心成员曾参与了Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。
2023年10月,月之暗面正式推出了首个支持输入20万汉字的智能助手产品“Kimi Chat”,主打无损记忆,在“长文本”领域上实现了突破,而这也是月之暗面做To C超级应用的第一次尝试。
龙年伊始之际,AI领域利好不断,AI大模型迎来新进展并且正在加速落地。2024年,伴随着技术的不断革新发展,我们期待AI赛道带来更多的惊喜,看到更多无限的可能。
欲了解更多行业动态以及行业最新、最前沿的产品、技术与解决方案,欢迎扫码报名4月24-26日IOTE2024国际物联网展·上海站。
访谈
更多做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…
博思高邓绍昌:乘产品创新及客户服务之舟,在市场变革中逆风飞扬
11月24日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会,在深…