中国信通院公布 AI 代码大模型评估，阿里云、华为、商汤等首批通过

2024-06-26 17:17 | 来源：IT之家

公开资料显示，AI 代码大模型首轮评估于今年 3 月启动，主要面向适用于金融、科技、互联网、电信、软件等各行业，生产、使用或计划使用代码大模型的企业，评估结果旨在为模型厂商提供代码大模型能力的评价和指导标准，以及为模型应用方提供有效衡量其能力水平的标准依据。

6 月 11 日消息，中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单，阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。

此次大模型评估以《智能化软件工程技术和应用要求第 1 部分：代码大模型》标准为依据，围绕通用能力、专用场景能力、应用成熟度，为模型能力提升和企业选型提供规范性参考。

IT之家注：《智能化软件工程技术和应用要求第 1 部分：代码大模型》（标准编号 AIIA / PG 0110-2023）标准于 2024 年 1 月 25 日正式发布，该标准由中国信通院与中国工商银行联合牵头发起，涵盖通用能力、专用场景能力和应用成熟度三大部分，包括 100 多个能力要求。

此次验证，依据标准开展，评价指标覆盖 6 大通用能力场景、7 大专用能力场景、3 大服务成熟度，多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度，重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度，全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。

目前，华为云盘古大模型、智谱 CodeGeeX 代码大模型、阿里云 AI 编程助手通义灵码、中国电信星辰政务大模型等首批通过评估，并在全部 100 多个能力评估中表现优秀，获得 4 + 评级。

以阿里云通义灵码为例，信通院评测结果显示：

在通用能力方面，通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出；

在专用场景方面，通义灵码提供网站开发、数据库开发、大数据开发、嵌入式开发等多个场景支持能力；

在应用成熟度方面，通义灵码具备较完善的数据合规及数据分类分级机制，且模型稳定性及可维护性表现优异，在模型推理性能、模型服务风险可控性等方面均表现优秀。

THE END

相关阅读

展会预告

新品

多模态大模型产品亮相，海康威视发布文搜存储系列产品
近日，海康威视基于观澜大模型技术体系，将大参数量、大样本量的图文多模态大模型与嵌入式智能硬件深度融合…
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
误报率降低90%以上！海康威视发布视觉大模型周界摄像机
更准！海康威视发布大模型交通卡口抓拍系列产品
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1
多模态大模型产品亮相，海康威视发布文搜存储系列产品

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

熵基科技发布《多模态生物识别技术白皮书》：科技向善，引领智能
人脸识别技术应用安全管理办法》的出台，标志着中国在隐私保护与技术规范领域的全新里程碑。
熵基科技发布《多模态生物识别技术白皮书》：科技向善，引领智能未来
智存未来，视界无界：希捷科技赋能广电行业“视听更美好”
多模态大模型产品亮相，海康威视发布文搜存储系列产品
上海新国际博览中心×海康威视：场馆运维数字化，为新一年会展举办助跑添力
华为AI训推超融合（DeepSeek一体机），推进AI行业化落地