世界热消息:如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
机器之心发布
作者:之江实验室
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
(资料图片)
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
推荐
- 世界热消息:如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
- 当前快播:华润元大双鑫债券增聘基金经理尹华龙
- *ST民控:公司将采取提高营业收入和投资收益以及降低费用或收购股权等方式提高净利润_每日热讯
- 世界时讯:海联金汇:公司在汽车轻量化车身和安全结构件方面一直保持行业优势
- 今日现货黄金价格多少(2023年6月7日)
- 饱经风霜的老屋_饱经风霜的意思|全球快播
- 天蝎座的女生的弱点_天蝎座女生的弱点 世界即时看
- 世界微动态丨萌萌哒表情包gif_萌萌哒表情包
- 信星集团(01170)发盈喜 预计年度取得股东应占溢利约4500万-5500万港元 同比扭亏为盈
- 金百泽:研发了400G光模块PCB关键工艺技术-环球新视野
- 中经评论:向下扎根向上生长 “技能中国”未来可期
- 舌头发紫黑色是什么原因(起床舌头变成黑紫色是怎么回事)
- 农发行安排1100亿元信贷资金全力支持夏粮收购
- 售价9.49万元起 2024款雪佛兰科鲁泽上市
- 【中国那些事儿】英媒:下一轮工业化浪潮,中国将是弄潮儿
- 高尔夫果岭人造草坪多少钱一平方|世界信息
- 海口新学校+1
- 环球热门:中海地产:前5月合约销售金额1469.78亿元
- 这是您需要了解的新梅赛德斯-奔驰Star Mobile的知识|全球实时
- 蒙娜丽莎的诅咒在线播放_蒙娜丽莎的诅咒之谜
- 全球新资讯:【中甲】广州队宣布主帅刘智宇下课,外教萨尔瓦多上任
- 安德斯·波森
- 美股开盘:三大股指小幅低开 Coinbase低开近20%
- 这种虫子冲上热搜!千万别打,有人差点毁容、失明
- 微软总裁:正在寻找解决动视交易中英国禁令的方案
- 环球视讯!人工智能时代下,首席信息官应该扮演什么样的角色?
- 因未能按约定止损等,深圳一私募基金收警示函 全球报道
- 热消息:中国农技协四川东坡永丰水稻科技小院挂牌成立
- 山特ups电源官网_ups tnt_世界速看料
- 投诉上海华通铂银交易市场有限公司
- 云南中烟又一副总经理被查,老搭档4天前刚刚落马|焦点速讯
- 网上如何提取封存公积金?
- 罗欣药业控股股东违规减持收监管函 此前业绩暴跌 当前消息
- 广州拟出新规:电动自行车将分层次、分时段限行
- 焦点!四川彭山:电力护航 筑牢高考保电“安全网”
- 从618看空调行业的三种趋势
- 维科精密布局汽车电子零部件迎接行业回暖期
- 繁峙农商银行:多管齐下 助力业务经营高质量发展 全球信息
- 常见餐边柜设计_环球速讯
- 健康讲堂:在郑州治疗肝病正规的医院【实时排名】〔郑州肝病哪个好〕 简讯
- 德讯午评:市场“二八”分化明显 抓AI主线抢反弹
- 环球热推荐:这款奥迪RS 5 Coupe碳纤维版特别适合碳纤维爱好者
- 当前热讯:绿雕红花扮靓“兰马”赛道
- CrossOver 将为 Mac 提供 DirectX 12 支持|速读
- 信息早速递
- 乐评人与歌手互怼 谁制造了这出“闹剧”
- 信息:苹果macOS Sonoma系统已推送:游戏能力不输Wintel联盟
- excel筛选后面计数不见了_excel筛选时显示数量
- 违反禁令标志是什么违章(13450是什么违章)|环球简讯
- 135.8元/股!年内第三大高价股明日上市|全球观速讯
- 永安药业:全资子公司取得国产保健食品注册证书
- 清华大学成立新书院,名字取自校歌!今秋招首批本科生
- 每5个人里就有1个,干眼渐成“流行病”?_新视野
- 狐王青莲百度云(狐王青莲 简介是什么)
- 记者:哈弗茨转会皇马的价格预计为5000万到6000万欧
- 观点:却组词_却组词有哪些
- 天天热头条丨用一句诗形容毛血旺?
- 上市眼科医疗连锁品牌华厦眼科进驻南昌 环球关注
- 辽宁省2023年7月普通高中学业水平合格性考试补报名工作的通知
- 互联网上悄然流行起“网络算命” 半小时咨询收费高达上万元
- 世界看热讯:蔚来ET5猎装版或于6月15日正式上市
- 李宗伟用英语怎么说_李宗伟会说中文吗
- 东风日产将亮相2023安行成都站,携明星车型“绿动”蓉城_天天观速讯
- 【世界时快讯】“数字”主角精彩亮相2023年PT展
- 农业银行衢州分行被罚285万元,涉七项违法违规-环球新要闻
- 【全球独家】浦东新区气象局发布暴雨蓝色预警【Ⅳ级/一般】【2023-06-05】
- 展与城的双向奔赴
- 法治“园丁”的心声
- 停车31分钟要按小时缴费?市民缩短缴费时间周期更合理
- 世界快看点丨5G商用四周年 中国通信业最新成绩单公布
- 20.99万元起售、最高续航580公里,全新smart精灵 3上市
- 不妨以理性心态看待“高考房” 全球微动态
- 预计铁矿短期偏强震荡为主 注意波动加剧的风险
- 世界动态:武汉数据集团成立
- 当前快看:不只是朋友_歌词
- 法媒:纳格尔斯曼将在周二与经纪人一同前往巴黎,希望招募亨利
- 每日看点!北京南站停车收费标准
- 燃钢之魂女主是谁_燃钢水晶瓶
- 收据可以当报销凭证吗_收据可以作为报销凭据吗
- 环球热文:新款比亚迪宋PLUS DM-i 实拍图片曝光,外观全面调整,车身增长明显
- 四年级下册数学期中试卷(四年级下册数学)
- 执事们的沉默(执事)
- 润贝航科:润和新材料的部分国产化航材已获中国商飞工艺材料产品批准书
- 车辆检测完,车子无法开了,是“暴力”还是“巧合”
- 全球热推荐:照片恢复软件(照片恢复)
- 滚动:宜兴团购网
- 当前信息:钾明矾商品报价动态(2023-06-04)
- 乳腺癌的早期症状有哪些表现_乳腺癌的早期症状有哪些
- 神奇宝贝系统小说大全600章以上(神奇宝贝系统)
- 全球今亮点!售194.28万元 奥迪A8L新增车型正式上市
- 哈尔滨招商银行工资待遇
- 全球热议:国民教育系列大专学历是什么意思(受国民教育序列的专科)
- 甘肃法院生态环境司法保护典型案例发布
- 京多安庆祝夺冠:了不起的温布利时光,非凡的球队! 每日头条
- 夜市升腾烟火气
- 绘画火车停止官网在哪下载 最新官方下载安装地址|天天报道
- 魂商城_天天报资讯
- 红杏枝头春意闹的意思(红杏枝头春意闹原文及译文)
- 更化(关于更化介绍) 全球速看
- 每日报道:张云松回应球队调整:选莱登原由,10人到期有人离队,但框架不变
X 关闭
行业规章
X 关闭