AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B，号称训练成本仅为竞品零头

2023-06-26 09:58 来源:物联传媒

AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B，该模型具有 300 亿参数，训练成本“仅有其他同类竞品模型的零头”，有望促进行业逐步降低此类模型训练成本，扩大 AI 模型在更广泛领域的运用。

据悉，MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型，可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室，相比以往成果，当下每块 GPU 的吞吐量增加了 2.4 倍以上，可带来更快的完成时间。

除了让 AI 技术更容易获得之外，MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具，可以帮助用户在预训练过程中分层加入特定领域的数据，以确保训练中开业实现多样化和高质量的数据组合。

MosaicML 公司表示，将模型扩展到 300 亿参数只是第一步，接下来他们将以降低成本为前提，推出体积更大、质量更高的模型。

THE END

相关阅读

腾讯首次披露行业大模型进展：不追求参数高，希望成本预算可控2023-06-25
深兰科技推出大语言模型平台“深兰硅基大脑SaaS平台”2023-06-21
腾讯云发布MaaS 产业大模型解决方案2023-06-20
腾讯云发布多个行业大模型解决方案，提供MaaS服务2023-06-20
探讨麦驰安防的成本，价格如何？2023-06-18
安防能否借AI大模型再次“突进”？ 2023-06-16
360智脑4.0亮相 AI大模型开启应用场景比拼2023-06-15
360发布智脑大模型4.0 远舢发布数字工业操作系统2023-06-15
1530亿颗晶体管！AMD甩出最强AI芯片，单个GPU跑大模型2023-06-15
360发布认知型通用大模型“360智脑4.0” 全面接入360全家桶2023-06-14

展会预告

新品

多模态大模型产品亮相，海康威视发布文搜存储系列产品
近日，海康威视基于观澜大模型技术体系，将大参数量、大样本量的图文多模态大模型与嵌入式智能硬件深度融合…
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
误报率降低90%以上！海康威视发布视觉大模型周界摄像机
更准！海康威视发布大模型交通卡口抓拍系列产品
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
多模态大模型产品亮相，海康威视发布文搜存储系列产品

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

大模型摄像机 | 宇视“梧桐”交通抓拍系列产品重磅发布
依托"梧桐"大模型技术多年的行业积淀与持续创新，宇视成功实现大模型技术在交通抓拍摄像机领域的工程化落地…
熵基科技旗下子公司入驻杭州智能机器人产业园
西部数据推出大容量存储方案，赋能NAS用户、创意专业人士与内容创作者
安森美推出面向工业应用的先进深度传感器
科达自控引入DeepSeek大模型推动智慧矿山与新能源领域技术升级
大模型摄像机 | 宇视“梧桐”交通抓拍系列产品重磅发布