帮助大模型提升自身安全性科研团队发布AI安全平台_东方时间网

(资料图)

中新网北京7月9日电 (记者张素)以ChatGPT为代表的生成式人工智能广受关注，大模型亦在加速发展。科研团队近日发布新的AI安全平台，以期为大模型系好“安全带”、把好“方向盘”。

据介绍，人工智能安全平台RealSafe3.0版本由清华大学人工智能研究院孵化企业瑞莱智慧RealAI发布。该平台能够提供端到端的模型安全性测评解决方案，旨在解决当前通用大模型安全风险难以审计的“痛点”。

“大模型‘落地难’的本质在于，当前还没有找到场景、风险和规范三者之间的平衡点。”瑞莱智慧联合创始人、算法科学家萧子豪在受访时说，而在探寻这一平衡点的过程中缺少易用和标准化的工具。换言之，亟须在技术层面找到有力抓手，帮助人们科学评判大模型在场景中能否同时满足规范和低风险，助力大模型上线运行。

据知，相较上一版本，RealSafe3.0新增了对通用大模型的评测。该平台覆盖数据安全、认知任务、通用模型特有漏洞、滥用场景等近70个评测维度，可以全方位、多维度地评测通用大模型的性能，未来还会持续扩增测评维度的数量。

萧子豪介绍说，RealSafe3.0内部集成了多个自研模型和专家论证高质量数据集，来帮助用户修复模型中的问题。例如，对黑盒不可解释的通用大模型，自研红队对抗模型取代人工设计问题，显著提升攻击成功率和样本多样性。

再如，教练模型通过对被测大模型进行多轮次的“提问—回答训练”，并以训练好的评分模型对问答结果进行评分，再将评分结果反馈给大模型，使其不断强化学习到好坏答案的要点及区别，直至问答能力逐步迭代至最优。

值得一提的是，瑞莱智慧科研团队还研发出能够防范生成式人工智能恶意滥用的DeepReal2.0，即“生成式人工智能内容检测平台”。该平台支持对图像、视频、音频、文本进行是否伪造的检测，应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等。

“我们将持续迭代技术、打磨产品，以确保在这场人工智能安全‘攻防战’中始终立于不败之地，将人工智能的两面性这一‘关键变量’，转化为高质量发展的‘最大增量’。”萧子豪说。(完)

推荐内容

帮助大模型提升自身安全性科研团队发布AI安全平台

2023-07-09
台青“登陆”浙江宁波创业创新共探直播经济发展

2023-07-09
证监会拟重点开展三方面工作贯彻落实私募基金条例

2023-07-09
丰收“新”盛景 | 麦浪滚滚喜获丰收

2023-07-09
今年成都航空口岸出入境人数突破一百万

2023-07-09
第三届中国（沈阳）智能网联汽车国际大会闭幕

2023-07-09
日本早稻田大学教授尾形哲也：智能机器人“有效”比“像人”更重要

2023-07-09
中国央行、财政部等财金官员先后会见美国财政部长耶伦

2023-07-09
安徽颍上：科技创新“强引擎” 跑出经济“加速度”

2023-07-09
上海航运中心迈向“全面建成”新阶段临港新片区“硬指标”搭载“软实力”

2023-07-09
上百名台胞逛浙江义乌：“现在的大陆机会多多”

2023-07-09
完成固定资产投资3049亿元全国铁路年中“成绩单”来了→

2023-07-09
世界单体容量最大“盐光互补”电站并网发电

2023-07-09
“北斗+”应用大放异彩，这项北斗+AI道路智能巡检系统荣获金奖

2023-07-09
渝万高铁最高墩主墩承台浇筑完成

2023-07-09
杨光华院士：人工智能服务人类智力创造美好智能社会

2023-07-09
最大助力35公斤外骨骼机器人或在养老、医疗领域“大展身手”

2023-07-09
为建设制造强国注入青春动能

2023-07-09
上半年中国铁路发送旅客17.7亿人次

2023-07-09
三大改造工程，超万亿元投资！这可能是钢铁行业破局关键

2023-07-09
广东茂名荔枝产业进阶：从“夏季限定”走向“四季可期”

2023-07-09
今年上半年中哈霍尔果斯国际边境合作中心进出逾128万人次

2023-07-09
中小企业保持恢复性增长态势

2023-07-09
政策“礼包”精准发力实现企业和人才的“双向奔赴”

2023-07-09
北京丽泽金融商务区入驻企业超千家 “金融+科技”产业链初步形成

2023-07-09
全国夏管有序推进

2023-07-09
铁路2023上半年成绩单出炉：17.7亿人次乘火车出行

2023-07-09
贵州生态产品交易中心挂牌首单林业碳票交易签约

2023-07-09
货币基金是否还有吸引力？未来发展空间在哪里？

2023-07-09
世界单体容量最大“盐光互补”电站并网发电

2023-07-09
哈巴雪山隧道历经九年贯通遭遇哪些罕见难题？

2023-07-09
多家头部公募基金宣布下调管理费率

2023-07-09
经济新方位·助力中小微：税优政策助力企业创新

2023-07-09
多米尼克·J·施密特：人工智能潜力尚待充分发掘

2023-07-08
黑河口岸首次进口散装粮食可降低境内外企业运输成本

2023-07-08
2023世界人工智能大会在沪闭幕

2023-07-08
上海打造国际青年创新会客厅助力国际创新人才高地建设

2023-07-08
蔡昉：户籍制度改革可释放中国1.8亿农民工万亿元级消费意愿

2023-07-08
如何呵护自然之美？海内外人士建言高质量推进自然保护地体系建设

2023-07-08
马修军谈视觉语言通用模型与具身智能

2023-07-08
两岸人士“乡约”美丽经济凝聚产业优势互补共识

2023-07-08
879.4公斤！这块高产示范田创新疆冬小麦亩产新纪录

2023-07-08
2023WAIC观察：当大模型如“雨后春笋” 业界改变了什么？

2023-07-08
全球数字无障碍智能发展联盟在沪成立 “智”解“健康平等安全”公共命题

2023-07-08
首届中国高原心胸大会在拉萨召开

2023-07-08
文莱摩拉港—广西北部湾港集装箱航线首航

2023-07-08
全球光伏市场需求旺盛中企积极布局海外产业链

2023-07-08
第五届中国新疆亚欧金桥国际博览会开幕

2023-07-08
消暑纳凉正当时各地夏日“清凉游”带“热”文旅经济

2023-07-08
多地迎来开渔季鲜甜肉嫩的美味江鲜重上餐桌

2023-07-08