科技

Facebook以AI作为审核工具，提升仇恨语言处理效率389%！

Published by

TTN 谈谈网

posted on 2021-06-05

脸书使用AI作为审核工具，提升了针对仇恨语言处理的效率达389%！

脸书亚太区内容政策经理瑪努（图片来源：Inside）

脸书IG 20亿用户

社交媒体平台上的仇恨言论一直都是很难处理的问题，随着特定的社会事件发生，比如选举，会导致此问题更严重。脸书（Facebook）亚太区内容政策经理瑪努（Manu Gummi）6月3日说，脸书和Instagram合共超过20亿用户，来自不同语言和文化，为了让大家更加自由和安全的表达意见，制定了目前的内部审查系统。

（图片来源：Martech）

内容规范5大核心

脸书社群规范包含了5大核心：意见，真实性，安全，隐私，尊严。

由于发表“意见”是自由人权的一部分，网络往往带来滥用的机会，为了确保用户有表达的自由，意见的安全性非常重要。“真实性”方面，为了让用户在平台上负责，确保用户的真实性，不能用假冒的身份。“安全”方面，不允许威胁，恐吓，伤害他人的言语或行为出现。“隐私”，确定用户身份，但又保有隐私。“尊严”，社群上人人平等，用户必须尊重自己也尊重他人，遵守社群规范。

（图片来源：inc.com）

每两周进行一次政策论坛

脸书内容政策制定小组每两星期都会举行一次“政策论坛”（Policy Forum），让多方面专家探讨当前的规范。之后，小组会针对内容咨询相关人员，内部外部相关利益者，之后再进行讨论，再做出决定，是否放入政策中实行。

关于仇恨的定义，是脸书面对的一大挑战，因为没有任何规范定义仇恨的言论。每个人对言论的容忍程度也不一样。仇恨言论也不能只是看一字一句，还要考虑到发言者和接收者的语境和脉络。仇恨言论是动态的，会随着时间过去而更变含义，因此很难掌握其变动性。

（图片来源：newsfeed）

仇恨言论的要素和等级

无论如何，脸书还是归类了仇恨言论的要素：1.有攻击行为，包含暴力，刻板印象，贬低他人等。2.攻击对象的“受保护特征”，包括种族，国籍，宗教等。

仇恨言论的严重性程度方面，脸书也列出了三个等级：

第一级，最严重，包含语言暴力，冥灭人性言论，嘲弄仇恨罪的概念，比如将非裔明星和猴子后制融合等行为。

第二级，诋毁他人的陈述，轻视，憎恨，厌恶，咒骂等。

第三级，号召排挤或隔离某方面，诋毁或毁谤。

（图片来源：Wikimedia）

AI审核提高效率

脸书自2017年开始执行内容审查，2018年使用AI人工智能作为辅助工具，脸书这几年一直在科技上进行投资，提高审核效率，也不断增加更多远的内容，保障用户的安全。

根据脸书社群守则执行报告显示，2019年12月-2020年12月间，脸书针对仇恨语言的处理效率增加了389%，AI科技主动侦测移除的仇恨言论比例为97.1%，比2017年的25%有明显进步。

（图片来源：台湾醒报）

35,000审核人员

首先，AI会不断主动侦测内容，依照仇恨言论分等级，再交给人类审核，目前脸书负责审核的人员高达35,000人，其中15,000人全天候进行人工分析。用户也可以主动检举不当言论，脸书保证会在24小时内完成审核。

为了能够提高AI辨识内容能力和精准度，脸书团队致力提升多语言理解，完整贴文理解，和排序预先秩序的功能。除了平台的内容审核，用户也可以自己管理脸书上的隐私和动态设定，从而减低看到不当内容的机会。

文章资料来源：Inside

0

0

0

0

0

Copy Link: