终于，GPT-4 将于下周问世！不仅能搞文字，还支持视频

2023-03-14 14:36 来源:CSDN

作为当前全球最火的生成式 AI，ChatGPT 仅用了 3 个月，就几乎搅动了整个科技圈，人们不断惊叹于 ChatGPT 的强大——但微软和 OpenAI 想要的，显然不至于此。目前的 ChatGPT，由 GPT-3.5 系列中的模型微调而成。

作为当前全球最火的生成式 AI，ChatGPT 仅用了 3 个月，就几乎搅动了整个科技圈，人们不断惊叹于 ChatGPT 的强大——但微软和 OpenAI 想要的，显然不至于此。

目前的 ChatGPT，由 GPT-3.5 系列中的模型微调而成。而据微软德国公司 CTO 兼 AI 部门主管 Andreas Braun 最新透露：下周，GPT-4 就要问世了，还是多模态的。

GPT-4 的参数量将高达 100 万亿？

GPT，即 Generative Pre-trained Transformer，是由 OpenAI 提出的一系列非常强大的预训练语言模型。该系列模型基于互联网上的可用数据上进行训练，在 NLP（自然语言处理）方面表现卓越，可用于问答、文章生成、机器翻译、代码生成和对话 AI 等。

在 GPT 系列模型推出之前，传统的 NLP 模型都是针对特定任务（如分类、翻译等）进行训练的，并且往往使用监督学习，这就导致了两个问题：缺乏大量的标注数据，模型也无法概括和泛化任务。

于是，OpenAI 在 2018 年推出了 GPT-1，模型参数数量为 1.17 亿，通过未标注的数据训练出一种生成式语言模型，再根据特定的下游任务进行微调，将无监督学习作为有监督模型的预训练目标。

时隔一年后，2019 年具有 15 亿参数的 GPT-2 出现。与 GPT-1 相比，GPT-2 在结构上并没有太多创新与设计，使用了更大的数据集和更多的模型参数进行训练，以此强化并提高模型性能。

从 GPT-1 的 1.17 亿到 GPT-2 的 15 亿，超 10 倍的参数差距带来了性能上的飞跃。这似乎意味着，随着容量和参数量的增多，模型性能还有更大的潜力——因此，2020 年 GPT-3 的参数量翻了 100 倍：1750 亿，其预训练数据量也高达 45TB（GPT-2 是 40GB，GPT-1 约 5 GB）。

事实证明，海量参数确实让 GPT-3 具备了更强大的性能，它在下游任务表现的非常好。即便是复杂的 NLP 任务，GPT-3 也表现惊艳：可以模仿人类写作，编写 SQL 查询语句、React 或 JavaScript 代码等。

回顾 GPT-1 、GPT-2 和 GPT-3 这一路的发展，许多人对 GPT-4 寄予厚望，甚至还有传言称 GPT-4 的参数量将高达 100 万亿。

将在下周推出 GPT-4！

不过，去年 11 月 Cambrian AI 的分析师 Alberto Romero 就曾发文预测，GPT-4 不可能发展至 100 万亿参数：“对于下一代模型，OpenAI 会把重点放在优化数据处理而非参数大小上。因此 GPT-4 的规模可能与 GPT-3 相似，同时训练成本会更低。”

不久之后，OpenAI 首席执行官 Sam Altman 也在一次采访中，辟谣了 100 万亿参数的说法：“过于荒谬，关于 GPT-4 的谣言越传越离谱。”

距离 2020 年 GPT-3 问世已经过去两年多，业界一直都在期待 GPT-4 的发布，ChatGPT 的火爆更为此添了一把火。但对于 GPT-4，OpenAI 方面始终保密得很好，不论是发布时间还是规模大小，几乎都没有透露。

在今年 1 月，Sam Altman 表示：“我们总有一天会发布的，只要我们确定它足够安全。目前来看，GPT-4 的发布会比大家期待的要晚一些。但当我们真正发布时，人们一定会觉得，等待是值得的。”

现在看来，Sam Altman 所说的“晚一些”并没有让我们太久。

本周四，微软德国公司 CTO Andreas Braun 预告了下周 GPT-4 的发布：“我们将在下周推出 GPT-4。”除了发布时间，Andreas Braun 还透露了很关键的一点——GPT-4 将是多模态的。

这十分令人意外，因为 Sam Altman 曾在年 4 月对 Alberto Romero 明确表示：GPT-4 不会是多模态的，而是一个纯文本模型。

语言模型是多模态，这意味着什么？即：使用 GPT-4，可以生成文本、图像甚至视频。正如 Andreas Braun 所说：“有了 GPT-4，我们将拥有多模态模型，它将提供完全不同的可能性，例如视频。”

除此之外，Andreas Braun 还指出 GPT-4 将是一个“改变游戏规则”的技术，因为“他们教机器理解自然语言，然后以统计的方式理解以前只能被人类阅读和理解的内容”。与此同时，GPT-4 已基本“适用于所有语言”，例如可以用德语提问并得到意大利语的回答。

Andreas Braun 认为，通过多模态，微软（OpenAI）将“使模型全面化”。

“GPT-4 不是要取代人类工作”

听到 Andreas Braun 的“剧透”，一直关注着 GPT-4 动态的人们坐不住了：

“如果所有这些都得到证实，那下周将是疯狂的。我已经开始清理我的日程安排，为此腾出时间。”

“我希望他没有撒谎，哈哈！这听起来有点假。”

“到时候见！！希望千万不是炒作。”

但同时，也有不少人提出担忧：目前基于 GPT-3.5 的 ChatGPT，就已经威胁到部分人类岗位了，有了 GPT-4 岂不是更危险？

对此，微软德国公司 CEO Marianne Janik 回应称：“GPT-4 不是要取代人类工作，而是要以与以前不同的方式来完成重复性任务。”她建议，公司可以培训员工使用人工智能：“传统的职位描述正在发生变化，由于新可能性不断丰富，令人兴奋的新职业正在出现。”

目前，关于 GPT-4 的更多详细信息还无法得知，让我们一起静待下周它的发布。

THE END

相关阅读

GPT-4即将发布支持多模态微软：AI或催生新职业2023-03-14
微软将于 3 月 16 日举办 AI 线上活动：展示其人工智能领域最新成果2023-03-08
一加Ace 2V支持全功能NFC和红外遥控2023-03-06
设施管理(FM)如何支持可持续发展议程2023-03-03
科技部：将人工智能作为新增长引擎给予大力支持 2023-02-28
苹果混合现实头显或无需搭配iPhone使用：支持隔空打字2023-02-28
中国联通将于 MWC 2023 发布全球首款“5G Redcap 商用模组”2023-02-27
国家发改委：支持首批超100个中小城市加快推进5G和千兆光网建设2023-02-27
什么是视频切换控制？2023-02-25
什么是视频分配器?vda（video distruibuting amplifier)2023-02-25

展会预告

新品

多模态大模型产品亮相，海康威视发布文搜存储系列产品
近日，海康威视基于观澜大模型技术体系，将大参数量、大样本量的图文多模态大模型与嵌入式智能硬件深度融合…
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
误报率降低90%以上！海康威视发布视觉大模型周界摄像机
更准！海康威视发布大模型交通卡口抓拍系列产品
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
多模态大模型产品亮相，海康威视发布文搜存储系列产品

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

芯明空间智能技术助力AI安防从“看见”向“看懂”和“预判”升级
4月17日，由CIOE中国光博会联合九脉产业链共同主办的“视觉技术在AI安防中的应用”沙龙在厦门顺利举行，芯…
芯明空间智能技术助力AI安防从“看见”向“看懂”和“预判”升级
实数融合提速推进新型工业化加快建设
熵基科技再次通过CMMI5级认证，彰显软件研发高成熟度实力
南京钢铁携手海康威视：场景数字化赋能钢铁“智”造
迪拜安防盛会，共谱安全新篇