据外媒报道,韩国研究人员最近开发了一种基于暗网数据训练的大型语言模型DarkBERT。这个AI模型旨在帮助网络安全专业人员从暗网提取有关网络威胁的情报。
DarkBERT可以研究暗网,以识别和标记潜在的网络安全威胁,包括数据泄露和勒索软件。
韩国科学技术院(KAIST)的研究人员与数据情报机构S2W开展合作,开发出生成式AI语言模型DarkBERT,该模型专门针对来自暗网的数据集进行训练。
与ChatGPT或Bard之类的聊天机器人不同,该模型旨在创建一个工具来分析数据集并回答特定的查询。DarkBERT可以验证使用暗网作为数据集是否能让AI工具更好地理解这些环境中使用的语言,从而可以为网络安全专业人员和执法部门提供帮助。
研究人员使用Tor网络训练AI模型
为了优化DarkBert适应暗网上使用的语言,研究小组通过爬行代理Tor网络创建了一个大型数据库。该研究团队还采用重复数据删除、数据过滤和预处理技术,以减轻与暗网内容相关的道德担忧,而暗网内容通常包含大量敏感信息。
该模型在16天内输入了两组数据,其中预处理的数据包括受害组织的名称、泄露数据的详细信息、威胁声明、非法图像等信息。
由于暗网的信息存在潜在风险,DarkBert在短期内不会向公众开放。然而,用户可以提出将这个AI模型用于学术目的的请求。
访谈
更多做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…
博思高邓绍昌:乘产品创新及客户服务之舟,在市场变革中逆风飞扬
11月24日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会,在深…