天天热点!干货 | AI算法透明性实现与评估
2023-01-13 17:23:29 来源:程序员客栈
以下内容整理自清华大学《数智安全与标准化》课程大作业期末报告同学的汇报内容。
我们主要从分析问题、解决问题、效果评估和实际验证四方面,推动这一课题的研究,并形成相应的研究成果。
(相关资料图)
第一部分:AI算法透明概述
第一部分,AI算法透明概述,主要凝练了当前AI算法透明性存在的挑战。
近年来,人工智能技术的发展使得其透明性问题日益凸显,为保障用户对算法知情,实现监管机构对算法进行有效规范治理与问责,算法透明性必不可少。
然而,算法透明性更类似于原则性的提议,具体如何落实透明性要求,并对其进行有效评估,尚未形成共识。
因此,我们对AI算法透明当前存在的诸多挑战进行了总结,主要涉及三个维度:技术、评估和制度。
技术上,很难处理AI算法的黑箱问题;
评估上,对透明程度的要求很难把握尺度;
制度上,算法问责机制仍然模糊。
为有效应对这些挑战,我们首先给出算法透明性实现路径,解决技术和制度问题,之后提出算法透明评估清单应对评估问题,最终在推荐系统下进行实践与应用。
第二部分:实现AI算法透明
宏观上,我们首先需要AI算法透明性治理范式,针对当前在算法监管立法等多个层面的挑战。我们希望打破透明性中耦合的机制主义和管理主义,形成一种以法律规制为主导,技术适配为基础的多元一体、多方协作的AI算法透明性治理范式。
微观上,这一范式的实施措施落实到学术、法律、技术和场景四方面。
学术上,国内外学者研究主要从多方视角相关主体出发,提出了若干在法律规制和技术适配方面的思考。
法律上,鉴于算法透明,是实现算法问责的重要机制。主要可以总结为两种实现AI算法透明的模式:赋权模式和行为规范模式。赋权模式属于事后救济,而行为规范模式属于事前预防和事中约束。
这里我们具体对比了不同国家地区的法律,发现各国都采取健全算法问责机制等措施。此外,我们也注意到欧盟还强调对算法参数的公开。
技术上,我们聚焦于实现从不透明模型向可诠释模型、可理解模型转变的可解释技术,该技术具体分为事前解释、事后解释和可诠释模型。针对不同的应用实例,又会有更为细致的方法。
不同的应用场景,对AI算法透明体现出不同的场景需求。我们也分别在自动驾驶、材料化学、智能教育和建筑设计,四个细分领域内进行了需求分析和方法探索。
第三部分:评估AI算法透明
鉴于现有法律规制大多在宏观层面强调算法透明监管原则,却鲜小有具体措施。因此,我们提出一套相对详细、可实施的评估标准,以细化并落实算法透明度合规要求。
首先,面向算法使用者的AI透明度评估清单的设计目标,在于保障知情权。内容主要分为算法概述与技术信息,要求算法开发方对这些内容进行说明。
算法使用者的AI透明度评估清单相较于面向用户的清单,由于监管方需要根据算法评估内容进行等级评估,所以该技能较为严格,需要说明的内容也更为复杂。
为配合透明度评估清单的使用,我们还提出了透明度评估等级表。面向不同使用场景的算法分为五个等级进行评估,不同等级对于算法开发者应当达到的透明度有不同要求,且逐步加强。
具体这个清单是如何工作的呢?如左图所示,评估流程有助于监管方对算法开发者在事前、事中和事后阶段做出责任分配。
在开发方与使用者方面,开发方遵照透明度用户指南向算法使用者提供算法的透明度指南。之后,使用者需要阅读指南,以此确立两方权责分配并获得知情。
第四部分:AI算法透明实践
我们选择推荐系统作为典型实例,也是因为推荐系统最能体现AI算法透明的要求。如果能让外界理解为什么信息被推荐给乙方,其实就达到了这个场景下的透明度要求。
通过实现推荐系统的透明性,也能提升用户对系统的信任程度,使系统推荐结果得到检验,同时受到有关方面的监管。
考虑到推荐系统目前采用的AI推荐算法众多,所以我们设计了一个推荐系统外的解释系统或算法,用于对推荐系统进行解释或直接作为一个整体对外提供具有解释性质的推荐。
其核心算法是采用知识图谱与强化学习的技术,充分挖掘推荐系统中的可解释模型,以此进行相关的路径挖掘,并利用解释路径对推荐系统行为加以解释。
这里我们采用一九年一个公开的购物网站公布数据进行结果演示,在利用上述算法完成解释系统后,对数据集进行路径挖掘,得到左图所示的结论。
基于上述深层的推理路径,对推荐系统的多个推荐实例进行解释。结果表明,方法不仅能够帮助推荐系统获得有希望的推荐结果,而且能够有效为推荐系统找到不同的用于推荐解释的推理路径。
之后,我们分别将未加入和加入这一解释算法的推荐系统,按照前一章节设计的流程进行算法评估。结果表明,融入解释算法后的推荐系统,在透明度上有明显提升,但监管方也注意到,新的具有解释性质的推荐系统,在技术和社会风险上处理方法上有缺,要求对当前算法做进一步改进,并对提交的材料进行补充。
感谢各位的聆听!以上就是我们小组要汇报的全部内容。
编辑整理:陈龙为你推荐
天天热点!干货 | AI算法透明性实现与评估
23苏城投SCP002票面利率为2.2900%
全国教育工作会议提出这些2023年人才培养“关键词”
小孩闭上眼睛捉迷藏经典句子(热门48句)
论语十二则翻译及原文 论语十二则翻译及原文内容
世界微动态丨2023济南制药机械展|中国(济南)国际制药机械与包装技术展览会
全球聚焦:2023春节假期会延长吗 建议春节假期延长至9日
全球热点!正在消失的信仰:马斯克陷入财富黑洞 特斯拉市值崩塌
今日热闻!形容娘家港湾的句子(精选316句)
2023年军队文职人员公开招考咨询服务电话和电子邮箱
今日31股涨停 主要集中在电子、房地产等行业
焦点热议:富临运业董秘回复:截至2023年1月10日,公司股东人数为35,509人
区块链板块1月10日跌0.67%,*ST文化领跌,北向资金增持8.17亿元
每日时讯!铜陵有色: 铜陵有色金属集团股份有限公司关于发行股份、可转换公司债券及支付现金购买资产并募集配套资金暨关联交易相关内幕信息知情人买卖股票情况自查报告的公告
最新快讯!1月10日山东利华益集团油品报价上涨
今日精选:聚众搞封建迷信犯法吗?
世界热议:京东金条贷款逾期16天还不起会影响征信吗
全球今亮点!爆冷夺视后!TVB知名女星颁奖礼盛装打扮被搭档吐槽:像乌鸡一样
全球讯息:盗窃600元应该怎么判
中邮消费金融逾期十天还不起会影响征信吗
推荐内容
- 天天热点!干货 | AI算法透明性实现与评估
- 23苏城投SCP002票面利率为2.2900%
- 全国教育工作会议提出这些2023年人才培养“关键词”
- 小孩闭上眼睛捉迷藏经典句子(热门48句)
- 论语十二则翻译及原文 论语十二则翻译及原文内容
- 世界微动态丨2023济南制药机械展|中国(济南)国
- 全球聚焦:2023春节假期会延长吗 建议春节假期延
- 全球热点!正在消失的信仰:马斯克陷入财富黑洞
- 今日热闻!形容娘家港湾的句子(精选316句)
- 2023年军队文职人员公开招考咨询服务电话和电子邮箱
- 今日31股涨停 主要集中在电子、房地产等行业
- 焦点热议:富临运业董秘回复:截至2023年1月10日,
- 区块链板块1月10日跌0.67%,*ST文化领跌,北向资
- 每日时讯!铜陵有色: 铜陵有色金属集团股份有限公
- 最新快讯!1月10日山东利华益集团油品报价上涨
- 今日精选:聚众搞封建迷信犯法吗?
- 世界热议:京东金条贷款逾期16天还不起会影响征信吗
- 全球今亮点!爆冷夺视后!TVB知名女星颁奖礼盛装
- 全球讯息:盗窃600元应该怎么判
- 中邮消费金融逾期十天还不起会影响征信吗
- 观点:劳动合同期五年试用期
- 8K电视凉了?CES 2023新品少的可怜:销量份额0.1
- 世界热点评!平安回家路 共赴春之约——长春站启
- SaaS行业都在裁员,海外:行业进步;国内:走投无路
- 天彩控股(03882)并购秀生活另一面 中国自动
- 快资讯丨闪电贷网贷逾期二个月还不起影响征信吗
- 环球看热讯:日本10年期国债收益率触及政策上限
- 环球消息!这样一场医联体现场巡诊让基层医院患者
- 焦点速讯:第39届哈尔滨国际冰雪节启幕
- 世界热点评!国产秀肌肉!全球首款8K激光电视来了
- 世界资讯:中证鹏元关注眉山市东坡发展投资集团有
- 湖南灵活就业人员医保缴费比例是多少?
- 永兴材料董秘回复:目前公司二期年产180万吨选矿
- 北京电信“AI巡检员”上线 公路检测快100倍
- 【环球聚看点】《叮,你有一份来自国宝的考卷请查
- 环球快讯:泉州新建3所学校,增加学位6900个!
- 全球快资讯:幸福蓝海:充分准备迎接2023年春节档
- 通讯!南京水痘疫苗错过了接种时间可以补吗
- 世界热资讯!动物也懂协同合作 两只雪豹一起偷鸡
- 天天日报丨A股异动 | 重庆港涨4.3% 控股子公司
油气
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
经济
-
中新网通辽10月18日电 (记者 张林虎)18日,记者从内蒙古自治区通辽市奈曼旗公安局获悉,国家一级保护动物--梅花鹿误入当地村民羊群,
-
中新网杭州10月18日电 (王题题 胡燕婕)云天收夏色,浅秋正渐浓。10月18日,浙江杭州市西湖游船有限公司推出的惠民多站点“西湖环湖游
-
中新网福州10月18日电 (记者 龙敏 王东明)福州市晋安区官方18日晚间通报,18日14时47分,晋安区岳峰镇化工路爱摩轮商业广场项目摩天
-
中新网兰州10月18日电 (闫姣 艾庆龙 吉翔)“红山白土头,黄河向西流。”不少人疑问,天下黄河向东流,为何甘肃永靖县这段黄河却向西
-
中新网北京10月18日电 《清华城市健康设施指数》18日在北京发布。报告成果显示,城市健康设施指数领先城市以中心城市和东部沿海城市