商汤发布日日新5.0大模型，全面对标GPT-4 Turbo

2024-04-25 15:50

4月24日晚，商汤官方发文介绍了公司发布的日日新5.0大模型，并表示这是“中国首个GPT-4 Turbo级别的大模型”，日日新5.0大模型具备更强的知识、数学、推理及代码能力，综合性能全面对标 GPT-4 Turbo，并在主流客观评测上达到或超越 GPT-4 Turbo。

据商汤的测评，日日新 5.0在大部分核心测试集指标上都超过GPT-4 Turbo，也超过了OpenAI此前竞争对手Anthropic发布的Claude 3.0 Opus。

在实际使用中，商汤表示在自然语言能力方面，创意写作、推理以及总结能力均大幅提升，文生图能力也有较大提升，本次日日新5.0另一大核心指标是多模态能力，商汤提到其多模态大模型的图文感知能力达到全球领先水平，在权威综合基准测试MMBench中综合得分排名首位。

日日新5.0模型能力提升一方面得益于采用混合专家架构（MoE），激活少量参数就能完成推理，且推理时上下文窗口达 200K 左右，其次模型基于超过10TB tokens训练、覆盖了数千亿量级的逻辑型合成思维链数据，此外能力提升也在于商汤AI大装置SenseCore算力设施与算法设计的联合调优。

翻译

搜索

复制

THE END

展会预告

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…