APP下载

网络谣言与“认知安妥性”

2020-08-06徐英瑾

中州学刊 2020年6期
关键词:背景知识网络谣言概率论

徐英瑾

摘 要:站在当代认识论的立场上看,“网络谣言”的构成要件之一——“与事实不符的虚构”——可以被替换为“目标信念的认知欠安妥性”,即“目标信念太容易为假”。而一个自动避谣系统对于一个信念的“欠安妥性”的评估,则可以按照评测“特定背景信息下目标信念的‘使真者的成真概率”的方式来进行。此外,由于上述背景知识的具体内容对于特定用户的价值观的依赖,这一方案在原则上就是与以“泯灭个体用户个性”为必然后果的大数据技术截然不同的,并因此足以构成对于大数据技术的某种对冲技术。站在更宏观的角度看,此项研究所具有的“打通人文思辨与工程学研究之间的壁垒”的意蕴,又包含了如下两个目标指向:其一,通过工程学问题自身自带的“跨文化性”,为英美认识论在华语世界的传播降低文化门槛;其二,通过上述这种工程学研究所自带的“可操作性”要求,倒逼学院哲学家对认识论领域内的“安妥性”概念进行“可编程性”检查。

关键词:网络谣言;通用人工智能;认知安妥性;概率论;背景知识

中图分类号:G20;B017      文献标识码:A      文章编号:1003-0751(2020)06-0111-10

一、导论

首先,笔者要解释本文标题中的“认知安妥性”(epistemic safety)究竟是何意。先请读者考虑如下案例:张三在化学测验之前复习不足,因此,在做选择题时,他只能通过抓阄来押答案。假设最后一题的答案是“B”,而且他也押中了,那么,这是否意味着他已经获取了囊括在该答案中的化学知识呢?从常识角度看,答案当然是否定的。说得具体一点,张三此次获取正确答案的过程包含了太多的运气成分,而只要幸运女神下次不再那么眷顾他,他就会马上得出错误的答案。此外,根据大多数人对于作为名词的“知识”(knowledge)与作为动词的“知道”(to know)的语义直觉,任何人要获取一项知识,或是要知道某事,其获知的方式都应当具有一定的公开可辩护性与可重复性,并由此在相当程度上排除掉“认知运气”(epistemic luck)的成分。因此,张三如果足够理智的话,他就不能在自我评测时认为自己已经掌握了囊括在答案B中的相关化学知识,因为他所蒙对的答案是缺乏“认知安妥性”的。由于“认知运气”本身就意味着产生错误的风险的存在,故此,我们就不妨先将“认知安妥性”(以下简称为“安妥性”)大致定义为一种能够在相当程度上豁免于错误风险的认知状态。在当代西方认识论(epistemology)①文献中,“认知安妥性”也被视为“知识之为知识”的一项必要条件。

——以上说的这些,与“网络谣言”又有什么关系呢?

由于“网络谣言”本身不是一个成熟的学术词汇,所以,在此我们只能满足于对于它的一个非常粗疏的常识定义。按照“百度百科”的说法,网络谣言是指通过网络介质( 例如微博、国外网站、网络论坛、社交网站、聊天软件等)而传播的没有事实依据,带有攻击性、目的性的话语。②按照这个粗疏的定义,网络谣言的特征有:(甲)通过互联网传播;(乙)是与事实不符的虚构;(丙)带有一定的传播目的。很明显,在这三个特征之中,(乙)最为关键,因为不借助互联网传播的谣言依然还会是谣言,而带有一定的传播目的的真信息也依然不会成为谣言。那么,(乙)与“安妥性”的关系又是什么呢?

笔者认为,“安妥性”标准乃是我们用以判断一条信息是否触发了条件(乙)的简易标准。那为何我们需要一个简易标准呢?这是因为,对于一个知识与信息处理能力有限的智能体来说,要判断一条信息是不是与外部事实真正相符乃是非常困难的,因为这样的智能体往往缺乏独立调查真相的能力与精力。相对容易做的反而是判断一条信息的“安妥性”,即判断这条信息是不是容易出错。譬如,若有条信息说有个数学功底很差的高中生通过在高考中一路抓阄而考上了清华,这样的信息虽然也可能是真的,但因为太欠缺“安妥性”(即太容易错),而依然会被任何一个心智正常的人判断为谣言。这里需要注意的是,从逻辑上看,当然存在着一条信息既欠安妥性,同时又为真的可能性,在这种情况下,按照条件(乙),该信息反而不算谣言。但考虑到这种“误杀”的可能性其实不高,将“欠安妥性”视为将某信息被判为谣言的“测试标准”,依然是妥当的。

——以上说的这些,与人工智能又有什么关系呢?

假设有一臺具有“通用人工智能”(Artificial General Intelligence,以下简称为AGI)③特征的推理机器,设计者希望它能够自动地在海量的互联网信息中将网络谣言筛选出来。那么,我们该如何设计这样的系统呢?一种目下似乎很受青睐的做法,乃是基于大数据技术而设计的。譬如,根据所谓的“多能动者的信息主体信任识别机制”,相关系统能够自动寻找每条信息背后的信息发布者的权威度或可信度(这一点又取决于发布者自身的互联网活动痕迹),然后延及对于信息传播者的权威度与可信度的计算,由此决定信息本身的可信度。④但这个做法本身却是有问题的,因为它没有办法应对如何揭穿“楚门的世界”这一难题,即,在网络本身充斥着大量虚假的网络意见领袖与“权威避谣人”的情况下,这样的避谣机制很容易被错误的网络风向带到错误的方向上去,而不能根据所传播的信息本身的质量给出独立的评断意见。换言之,这样的机制无法豁免于任何基于大数据的AI技术所无法避免的困难,即它只能根据既有的数据对未来的时态发展趋势进行推测,而无法对所涉及的信息内容本身进行真正的思考。

而要避免这个问题,笔者的建议是让AI能够对信息的内容进行独立的评断,特别是对于其“安妥性”的评估。由于“安妥性”本身意味着相关信息“不太容易为假”,而对“不容易为假”的判断又牵涉到对于信息内容的内部特征——而不是信息发布者——的判断,所以,这样的系统的运作方式,显然就应当具备英语认识论文献中所经常提到的“内在主义理路”(the internalist approach)的某些特征,以便由此提供更多的理论空间来模拟人类的内部思维过程。

那么,我们又该使用怎样的技术手段,以一种亲和于“内在主义”的方式,来表征“安妥性”与“安妥性欠缺”之间的差别呢?一条很容易被想到的表征思路就是诉诸概率论,比如将一个更具“安妥性”的信念表征为一个具有更高成真概率的信念,并将一个不那么具“安妥性”的信念表征为一个成真概率较低的信念。虽然这个想法本身还是非常粗糙的,但考虑到基于贝叶斯式概率计算的AI研究早已通过珀尔(Judea Pearl)的工作⑤而成为AI学界的通识,因此我们不妨就认为:在概率論的大框架里去理解刻画“安妥性”,至少在大方向上是具有可行性的。此外,特别需要指出的是,笔者所推崇的这种概率统计本身并不是基于那种泯灭用户个性的大数据处理技术的(尽管将概率论与大数据技术结合,其实并不困难),而恰恰是通过引入“概率值归赋者的背景知识”,而与特定用户的个性画像发生了密切关联(详后)。因此,这种技术路径与其说是大数据技术的一种,还不如说是构成了大数据技术的对冲技术。

不过,有意思的是,在西方认识论讨论“安妥性”的典型文献中,特别是在英国哲学家普理查德(Ducan Prichard)的理论框架中,处理安妥性的技术工具却不是概率论,而是“可能世界语义学”(possible world semantics),即一种通过“可能世界”的理论假设来对“反事实条件句”(counterfactuals)的含义进行阐释的技术工具。而本文首先将论证,至少站在AGI的立场上看,这一技术路径是根本无法被编程化的。与之相比较,笔者将要在本文中提出的基于概率论的“安妥性”概念,不仅不会引发“循环论证”的问题,而且它还将产生对以“斑马案例”为典型的诸认识论经典案例的足够解释力(此外,笔者还将提到“斑马案例”与一般谣言甄别过程之间的类似性)。从更宏大的视角去看,笔者所给出的技术路线,不仅对AI的研究具有意义,也将向哲学界提供一条经由经验科学改造传统的认识论理论的新道路,以便在AI时代以新的技术内容夯实奎因(Willard Van Orman Quine)所提出的“自然主义的认识论”(naturalized epistemology)概念的内涵。

二、基于“可能世界语义学”的“安妥性”概念是无法被编程的

用“可能世界”概念解释“安妥性”的学者很多,但最具代表性的乃是英国学者普理查德。他对于“安妥性”的定义,大致可以被概括如下。⑥

某主体所持有的某目标信念P是安妥的,当且仅当如下条件被满足:就与该主体所处的那个现实世界最为切近的大多数的可能世界而言,只要在那些可能世界中,主体继续以他在现实世界中持有P的方式持有P,那么,P依然是真的。

这个定义貌似还很抽象,我们不妨便用所谓的“谷仓案例”⑦来解释一下(顺便说一句,本文已经在“谣言甄别”的语境中对该案例进行了改写)。假设读者已经知道在横店影视城有大量的假谷仓(里面当然是没谷子的),以便为影视剧的拍摄提供布景。而且读者还知道,在这些假谷仓中,混有一个编号为“88号”的真谷仓(里面藏有很多优质黑龙江产压缩真空大米),以便为广大群众演员提供后勤保障。⑧同时,读者还知道,关于谷仓之虚实,乃是包括读者在内的小圈子里的秘密知识,广大公众对此是一无所知的。这时候,假设读者再获得一条新信息:有个叫“张三”的窃粮贼(他不属于上述小圈子),骑了一辆自行车进入“谷仓阵”,而且,他在没有任何内部情报支援的情况下就随机找到了88号谷仓,并偷走了其中的一袋大米。你觉得这是谣言吗?

很多人恐怕会倾向于认为这是谣言,因为张三碰巧撞上88号谷仓这件事太容易成假了。譬如,只要张三稍微转转头,或者他的自行车骑得快一点或者慢一点,他就会看到那些假谷仓,并由此错过唯一藏有粮食的88号谷仓。若按照普理查德的“可能世界语义学”的话语方式来重述这个故事,那么在这个案例中,所谓的“现实世界”,就是指“张三撞上88号谷仓”这一状况,而所谓的“与现实世界非常切近的可能世界”,就是指“张三稍微转头并由此注意到假谷仓”的那些状况。由此看来,张三的信念(即“我看到的的确是真谷仓”)之所以是不安妥的,就是因为它仅仅在现实世界中为真,却在那些与现实世界非常接近的可能世界中为假。

上文提到的“非常切近”一词,显然涉及了某种空间性隐喻,而在威廉姆森(Timothy Williamson)的知识论模型中,关于“安妥性”的空间化隐喻还得到了一种更为淋漓尽致的表达。具体而言,在他的隐喻框架中,目标信念被看成了一个圆润的球体,而其真值则被视为球与所在平面之间的关系——如果球能够在平面上停稳,则代表“真”,若停不稳,则代表“假”。至于球在平面上的投影位置,则被视为“现实世界”,与该位置接近的那些位置,就代表那些“与现实世界非常接近的可能世界”。这样一来,如果一个信念被认为是“安妥的”,那么就可以通过这种空间隐喻而被理解为:即使球稍微离开其所在的位置,并在与之非常接近的位置出现,它也能停稳当。换言之,如果它一离开自己原来的位置就马上就无法停稳了,它就是不安妥的。⑨

然而,上述这种基于空间隐喻的理解方式虽然很直观,但从计算机编程的角度看,它却很难被恰当地程序化,因为上述描述方式中已经包含了一个难以被消除的循环论证。

很明显,任何人若要按照普理查德的要求去确定一个信念是否安妥的话,他就不得不先去依次做三件事情:

(1)分辨出哪种情况是现实世界,哪些情况是可能世界;

(2)根据每个可能世界与现实世界之间的举例,来判定哪些可能世界是与现实世界“切近”的,哪些则否;

(3)在那些与现实世界非常切近的可能世界中,我们再去判断目标信念在其中是否依然是真的——若是真的,则目标信念安妥,否则相关信念就是不安妥的。

然而,上述这个路线图的步骤(1)预设(2)已经被执行了,而(2)的执行却必须预设(1)已经被执行。这种自相矛盾的状况就必然导致(1)与(2)都不能得到执行,由此导致整个路线图的崩塌。为何这么说呢?

猜你喜欢

背景知识网络谣言概率论
浅谈《概率论与数理统计》课程的教学改革
自媒体时代网络谣言界定与产生的概述
网络谣言的产生、传播与对策
提高高中生英语阅读能力的策略
论《概率论与数理统计》教学改革与学生应用能力的培养
财经类院校概率论与数理统计教学改革的探索
多媒体技术在《概率论与数理统计》教学中的应用