干货 | AI算法透明性实现与评估

以下内容整理自清华大学《数智安全与标准化》课程大作业期末报告同学的汇报内容。

我们主要从分析问题、解决问题、效果评估和实际验证四方面，推动这一课题的研究，并形成相应的研究成果。

第一部分：AI算法透明概述

(资料图片仅供参考)

第一部分，AI算法透明概述，主要凝练了当前AI算法透明性存在的挑战。

近年来，人工智能技术的发展使得其透明性问题日益凸显，为保障用户对算法知情，实现监管机构对算法进行有效规范治理与问责，算法透明性必不可少。

然而，算法透明性更类似于原则性的提议，具体如何落实透明性要求，并对其进行有效评估，尚未形成共识。

因此，我们对AI算法透明当前存在的诸多挑战进行了总结，主要涉及三个维度：技术、评估和制度。

技术上，很难处理AI算法的黑箱问题；

评估上，对透明程度的要求很难把握尺度；

制度上，算法问责机制仍然模糊。

为有效应对这些挑战，我们首先给出算法透明性实现路径，解决技术和制度问题，之后提出算法透明评估清单应对评估问题，最终在推荐系统下进行实践与应用。

第二部分：实现AI算法透明

宏观上，我们首先需要AI算法透明性治理范式，针对当前在算法监管立法等多个层面的挑战。我们希望打破透明性中耦合的机制主义和管理主义，形成一种以法律规制为主导，技术适配为基础的多元一体、多方协作的AI算法透明性治理范式。

微观上，这一范式的实施措施落实到学术、法律、技术和场景四方面。

学术上，国内外学者研究主要从多方视角相关主体出发，提出了若干在法律规制和技术适配方面的思考。

法律上，鉴于算法透明，是实现算法问责的重要机制。主要可以总结为两种实现AI算法透明的模式：赋权模式和行为规范模式。赋权模式属于事后救济，而行为规范模式属于事前预防和事中约束。

这里我们具体对比了不同国家地区的法律，发现各国都采取健全算法问责机制等措施。此外，我们也注意到欧盟还强调对算法参数的公开。

技术上，我们聚焦于实现从不透明模型向可诠释模型、可理解模型转变的可解释技术，该技术具体分为事前解释、事后解释和可诠释模型。针对不同的应用实例，又会有更为细致的方法。

不同的应用场景，对AI算法透明体现出不同的场景需求。我们也分别在自动驾驶、材料化学、智能教育和建筑设计，四个细分领域内进行了需求分析和方法探索。

第三部分：评估AI算法透明

鉴于现有法律规制大多在宏观层面强调算法透明监管原则，却鲜小有具体措施。因此，我们提出一套相对详细、可实施的评估标准，以细化并落实算法透明度合规要求。

首先，面向算法使用者的AI透明度评估清单的设计目标，在于保障知情权。内容主要分为算法概述与技术信息，要求算法开发方对这些内容进行说明。

算法使用者的AI透明度评估清单相较于面向用户的清单，由于监管方需要根据算法评估内容进行等级评估，所以该技能较为严格，需要说明的内容也更为复杂。

为配合透明度评估清单的使用，我们还提出了透明度评估等级表。面向不同使用场景的算法分为五个等级进行评估，不同等级对于算法开发者应当达到的透明度有不同要求，且逐步加强。

具体这个清单是如何工作的呢？如左图所示，评估流程有助于监管方对算法开发者在事前、事中和事后阶段做出责任分配。

在开发方与使用者方面，开发方遵照透明度用户指南向算法使用者提供算法的透明度指南。之后，使用者需要阅读指南，以此确立两方权责分配并获得知情。

第四部分：AI算法透明实践

我们选择推荐系统作为典型实例，也是因为推荐系统最能体现AI算法透明的要求。如果能让外界理解为什么信息被推荐给乙方，其实就达到了这个场景下的透明度要求。

通过实现推荐系统的透明性，也能提升用户对系统的信任程度，使系统推荐结果得到检验，同时受到有关方面的监管。

考虑到推荐系统目前采用的AI推荐算法众多，所以我们设计了一个推荐系统外的解释系统或算法，用于对推荐系统进行解释或直接作为一个整体对外提供具有解释性质的推荐。

其核心算法是采用知识图谱与强化学习的技术，充分挖掘推荐系统中的可解释模型，以此进行相关的路径挖掘，并利用解释路径对推荐系统行为加以解释。

这里我们采用一九年一个公开的购物网站公布数据进行结果演示，在利用上述算法完成解释系统后，对数据集进行路径挖掘，得到左图所示的结论。

基于上述深层的推理路径，对推荐系统的多个推荐实例进行解释。结果表明，方法不仅能够帮助推荐系统获得有希望的推荐结果，而且能够有效为推荐系统找到不同的用于推荐解释的推理路径。

之后，我们分别将未加入和加入这一解释算法的推荐系统，按照前一章节设计的流程进行算法评估。结果表明，融入解释算法后的推荐系统，在透明度上有明显提升，但监管方也注意到，新的具有解释性质的推荐系统，在技术和社会风险上处理方法上有缺，要求对当前算法做进一步改进，并对提交的材料进行补充。

感谢各位的聆听！以上就是我们小组要汇报的全部内容。

编辑整理：陈龙

标签：推荐系统结果表明

精彩推荐

干货 | AI算法透明性实现与评估

上一篇:

下一篇:

世界信息:七子饼茶怎么泡 七子饼茶的正确泡法

天天实时：中国将对原产于日韩的进口非色散位移单模光纤续征反倾销税

最新：机智的冬日工具暖男 体验北京汽车魔方

当前焦点!川渝共建世界级机场群：已开通国际航线240条，成都、重庆机场乘客吞吐量居全国前2位

贝利逝世，身后是不朽传奇：贫民窟到世界杯之王，生涯共进1279球，永远的“球王”

每日播报!“单飞”后的贵州习酒距离上市还有几个路口

世界今日报丨科勒荣获2022第一财经·中国企业社会责任榜责任典范奖 深耕可持续发展 许以更好的未来

预计2022年净利626亿元 贵州茅台平均日赚约1.72亿元

【世界聚看点】臻有钱借款逾期24天还能借到吗？

中仑新材旗下企业专注高性能聚酰胺创新与高质量发展

【世界热闻】2022孝感五级工伤赔偿标准如何认定

全球连线｜“喀秋莎”姐妹眼中的长江之美

环球热门:博瑞传播（600880）12月28日主力资金净买入5102.53万元

【世界播资讯】白萝卜晒干好不好?

当前时讯：​2023年春节期间常州市民卡直营网点作息时间调整

2023张紫宁长沙跨年演唱会延期举办通知

全球即时看！波神24+10奇才终结76人8连胜 大帝48+9哈登26+13

天天简讯:真是烦死这些垃圾网站了！

光大证券(06178.HK)：业务总监董捷辞职

广生堂（300436）12月27日主力资金净卖出6907.11万元

快资讯：方萍萍：2022年12月27日原油策略交易策略

当前速递！RPCS3 模拟器已支持运行所有索尼 PS3 游戏

当前要闻：昆明警方抓获6名倒卖抗原检测试剂人员：要价高于市场价3倍多

【世界热闻】主播说联播丨心中有数、手中有策、行动有力！

天天资讯：SUPER JUNIOR正规11辑Vol.2个人预告照公开

世界讯息：北京多家餐馆再现排队等位，业内预计元旦客流将持续回升

全国智慧法院信息系统建成

微动态丨外媒：美众院最终调查报告将国会骚乱归咎于特朗普一人

全球讯息：花鸭借钱逾期没还款影响征信吗？

【天天热闻】中交地产（000736）12月22日主力资金净卖出1.00亿元

天天观察：泽连斯基秘密抵美同拜登会谈，克宫回应

天天快看：壹石通：截至目前公司的勃姆石产品型号已多达15种，可满足下游市场的不同应用需求

世界观天下！五粮液获北向资金连续5日净买入

世界看点：广东：稳住就业“压舱石” 助“粤字号”经济巨轮行稳致远

天天微头条丨国家发改委：高度重视生猪市场保供稳价工作 必要时采取收储等储备调节措施

天天热头条丨金风科技(02208.HK)：MNS Wind Finance Pty Ltd将偿还部分借款 财务资助金额将减少至1.08亿澳元

小赢钱包逾期到期会上征信吗

【天天播资讯】特力Ａ董秘回复：公司拥有较为丰富的物业资源，主要位于罗湖区、福田区等

天天看热讯：安逸花借款逾期2个月拖欠多久会上征信

明阳智能董事长张传卫荣获和讯第20届中国财经风云榜“2022年度杰出掌门人”奖项

南卫股份：截至目前公司尚无生产您提问中的相关产品

异常海浪袭击南非热门海滩，多人被卷入海里3死17伤

关注：《月歌行》影视化之后的柳梢，明显就是傻白甜人设了

明明：供给逐步释放 2023年铜价或从震荡转向下跌

全球讯息：南财对话丨普林斯顿大学经济学教授马库斯·布伦纳梅尔：构建后疫情时代的社会韧性

消息！“阳”了猛灌水，容易“水中毒”！每天喝多少水合适？喝电解质水有用吗？

全球今热点：王思聪香蕉影业设新公司，经营范围含动漫游戏开发

大学生报名初级会计证的报名费用是多少

当前热讯：春秋航空: 春秋航空2022年11月份主要运营数据公告

环球最新：青岛食品：目前公司未涉及跨境电商业务

世界信息:七子饼茶怎么泡七子饼茶的正确泡法

最新：机智的冬日工具暖男体验北京汽车魔方

世界今日报丨科勒荣获2022第一财经·中国企业社会责任榜责任典范奖深耕可持续发展许以更好的未来

预计2022年净利626亿元贵州茅台平均日赚约1.72亿元

当前时讯：2023年春节期间常州市民卡直营网点作息时间调整

全球即时看！波神24+10奇才终结76人8连胜大帝48+9哈登26+13

天天微头条丨国家发改委：高度重视生猪市场保供稳价工作必要时采取收储等储备调节措施

天天热头条丨金风科技(02208.HK)：MNS Wind Finance Pty Ltd将偿还部分借款财务资助金额将减少至1.08亿澳元