APP下载

因果观念发展的大数据相关关系观照

2021-07-29王天恩

贵州省党校学报 2021年2期
关键词:相关关系大数据

摘 要:随着人类认识的深化和实践活动层次的提升,人类因果观念经历了两次重要转换,形成了三种基本的因果观:实在论因果观、描述论因果观和模型论因果观。从实在论因果观到描述论因果观,肇因于从经典物理学到量子力学的发展;从描述论因果观到模型论因果观,则源自信息科技特别是大数据的发展。在三种因果观念中,实在论因果观是关于对象确定性联系的把握,描述论的因果观是将实在论因果观抽象为描述的产物,而模型论因果观则是描述论因果观发展到完全抽离具体经验条件的结果。纵观人类认识发展过程中因果观的嬗变,可以进一步看到,因果观念的两大重要转换都与信息的彰显密切相关。在量子力学中,信息便得以空前凸显,微观观测中生成的量子现象正是作为感受性关系的信息;而大数据则本身就是信息数字编码的产物,正是大数据相关关系,将因果观念从主要基于物能发展到主要基于信息。

关键词:因果观念;大数据;相关关系;整体观照

中图分类号:B026;TP311 文献标识码:A文章编号:1009 - 5381(2021)02 - 0012 - 11

由于东西方古代哲学关于原因的研究与世界事物的起源和发生发展密切相关,无论是古希腊亚里士多德的“四因说”还是古代东方的“因明学”,都并不是一般因果关系意义上的原因研究。正是由此出发,关于因果性的研究经历了一个十分复杂的过程,甚至显得越来越扑朔迷离。随着信息科技的发展,大数据相关关系为因果性研究的系统深入和因果关系的更准确理解提供了更高层次的整体观照,为因果关系研究提升到一个发展的更高层次创造了条件。在大数据相关关系更高发展层次的整体观照中, 自“四因说”和“因明学”以来,关于因果关系的理解和规定,大致经历了三个具有哲学基本观点意义的阶段。

一、实在论因果观

在古希腊哲学中,由于将原因与世界的终极思考联系在一起,因果观念的研究实际上都是关于原因的哲学研究,而且,这种研究大都具有本体论的性质。作为古希腊自然研究中关于原因知识的集大成——亚里士多德的“四因说”正是主要关注原因研究的典型成果。

亚里士多德对原因的哲学考察,虽然不是一般意义上的因果观念,而是具有本体论性质的思考,但他的“四因说”无疑呈现了因果观念的萌芽状态。作为因果观念的萌芽,以及作为原因观念最早的系统思考,亚里士多德的“四因说”一方面具有规定的原初性,另一方面包含了更丰富的内容和可能性。由于日常经验和科学的发展,在亚里士多德“四因说”的基础上,逐渐形成了作为实体或实体过程的因果观念。在因果关系研究的这一发展阶段,由于以日常生活和经典物理学为基础,人们主要把因果关系作为实体或主体之间的相互关系理解。因此,原因和结果之间的关系更多地被理解为实体过程中的基本关系,无论原因还是结果都主要作为实体来理解。这种因果观主要由认识既存世界的需要而生,属于对原因和结果关系直接的朴素把握。在这种因果关系的把握中,人们最关心的是结果由什么原因造成。在这一阶段,把握因果关系的目的主要是由果溯因。

在经典物理学中,由于与日常经验的高度匹配,因果观念的实在理解具有非常好的实体对应,因果描述和因果解释处于未分化状态,对因果观念的实体理解相对简单明了。但是,实体意义上的因果观念在哲学上始终存在一个难题,那就是原因的原因的原因……这种无穷回溯(无穷回归)。关于这一具有哲学基本问题性质的难题,思想史上的解决尝试大致有三条进路。其中,一条为牛顿所采用,那就是把终极原因归于上帝;而在哲学中的另外两条进路则分别为休谟和康德所系统探索。在西方哲学史上,近代经验论从理论上对因果观念的哲学反思,揭示了因果观念的复杂一面。

在关于因果性的哲学研究中,休谟把因果观念的来源和根据归于经验而不是先验,康德则把因果观念的由来归于先验而不是经验。休谟认为,“各个对象的恒常结合决定了它们的因果关系”[1]198,他曾大胆地提出一个没有例外的一般命题:“我们关于因果关系的知识,在任何情况下都不是从先验的推理获得的,而是完全产生于经验,即产生于当我们看到一切特殊的对象恒常地彼此联结在一起的那种经验。”[2]21在因果关系的经验论探索中,休谟只能建立起原因和结果间的时序关联,这与休谟把因果观念的来源和根据归于经验有关。但是,休谟对因果观念的经验论宣判,其实也还是留有一定余地的。这方面,休谟很像为信仰留下余地的康德。因为在休谟的因果观念中,因果概念仍保留了两种可能性。

在因果关系的研究中,休谟具有特殊地位,他从经验论出发为因果关系奠定了思想基础。休谟虽然是在观念层面讨论因果关系,但其关于因果性的讨论仍然主要在实在意义上。休谟虽然把因果观念的来源归于经验,但他所涉及的却不只是因果观念,也包括因果性本身,即实在意义上的因果关系,只不过是处于一种怀疑的状态甚至具有否定的倾向。

休谟关于原因两个定义的讨论,尽管倾向明显,但至少是对这两种可能性的客观展示。休谟给原因所下的第一个定义是:“它是先行于、接近于另一个对象的一个对象,而且在这里凡与前一个对象类似的一切对象都和与后一个对象类似的那些对象处在类似的先行关系和接近关系中。”[1]195只是在康德等关于因果性的哲学研究与统计学、计量经济学等学科关于因果性的科学研究之间,因果观念发生了两种可能性的分化。

近代经验论和唯理论的争论构成的持续张力,促成了康德对因果观的思考。由于其基本哲学观点,关于因果观念由何而来的休谟问题,康德的回答是来自先验。在他那里,因果观念和时间、空间一样,都是先天形式的;对于因果观念的理论考察,所得到的是像时间和空间一样的因果先天形式。在康德看来,因果性问题的关键在于“这个概念是否能先天地被理性所思维”[3]8,因而他完全赞成休谟关于不能通过理性理解因果关系的可能性的观点。但是,康德既不认为因果概念是从长期习惯得来的纯粹假象,也不认为因果概念仅仅得自经验,因而不把因果概念所体现的必然性当作虚构,相反,他认为与空间、时间一样,因果性是先天的。康德认为,这一点是毫无疑义的:“概念以及由之而生的原则都是先天的,即在一切经验之先建立起来的,它们具有无可置疑的客观准确性,但是,当然只就经验而言。”[3]80康德所说的原因是“世界上到处都遇得到的理性形式的原因”,他所说的因果性是“出于理性的因果性”。[3]150这样,在因果观念的哲学研究中,关于因果观念来源,出现了两个相对方面的不同努力,开启了两种不同的走向。一方面,休谟走向了因果观念的经验理解,把因果观念视之为人们在经验中的“习惯性联想”,归之于习惯性联想中经验的“恒常结合”(constant conjunction)[4];另一方面,康德走向了因果觀念的先验理解,将因果观念归之于先验的先天形式。

由此可见,实在论意义上的因果观具有两种基本形式:经验的和先验的。经验意义上的实在论因果观趋向否定因果关系的实在论理解,而先验意义上的实在论因果观则似乎具有逻辑上难以否认的地位。从休谟到康德,一方面,关于因果性的哲学研究走到了传统范式的极致,打上了一个长久的句号;另一方面,因果性问题的哲学研究,或者说因果性问题的定性研究,则困在了休谟的经验和康德的先验之间。[5]由于局限于因果关系的实在理解,随着实证科学的发展,因果观不仅越来越不能适应实证科学发展的需要,而且越来越显露了因果观念实在理解的局限,遭遇统计学、统计物理学特别是量子力学的严峻挑战。

就量的相关关系而言,量子力学的数学形式体系对量子对象已经有很精准可靠的把握,但由于(数学)描述和(物理)解释的分化,在量子力学中,因果关系的定量研究呈现与统计学和计量经济学,更与统计物理学完全不同的情景。在很大程度上,这种不同由于量化把握所呈现出来的相关关系。统计学和计量经济学与量子力学相关关系的重要区别在于:在统计物理学、统计学和计量经济学中,“相关关系必须独立于用来测量两个变量的装置。”[6]而在量子力学中,测量本身就是影响相关关系的因素。正是量子力学的特殊情景,构成了定量把握和定性把握的完全分化。人们对量子力学数学形式体系的物理意义没有任何理解,这就需要量子力学的理论解释。正是量子力学及其理论解释,构成了对传统因果观的根本挑战,从而提出了重新刻画因果概念的迫切要求。

当科学发展到量子力学,传统实体因果观在基础理论层面遇到根本挑战。在量子力学中,已经不可能像在牛顿力学中那样协调地理解因果概念。在经典物理学中,由于因素及其相互作用方式相对简单,原因和结果之间的关系可以近似地被看作是完全确定因而具有必然性;而在量子力学中,由于包括实验安排在内的因素体系及其相互作用方式的复杂性,不可能像经典物理学那样把两个相同的实验安排看作是等同的,这使每个观测都具有不可忽略的个别性,因此量子现象本身具有独特的个体性,结论必定是因果关系内含概率性。毫无疑问,概率性所反映的也是一种确定性的关系,即概率性本身的确定性。如果说,由于实践的可操作诉求,在统计理论中不得不与实体因果观相分离的话,那么在量子力学中人们就必须摒弃传统因果观,摒弃关于传统因果观念的理解。这样就有了因果概念根本意义上的重新刻画,就有了原因是因素的相互作用过程、结果是因素相互作用效应及其累积的新因果观念。

事实上,因果概念的重新刻画,正是因果观念发展的逻辑结果,甚至在亚里士多德的“四因说”中,就可以看到其逻辑萌芽。由于亚里士多德的“四因说”保留了更丰富的可能性,可以看到隐含着当代因果关系研究的思想资源。从对因果关系的理解程度看,“四因说”对于因果关系的把握无疑是相对初步的,但却可以看到从因素理解原因的更大展开空间,只是主要处在因素相互作用动态过程的凝固状态。正是在重新刻画的因果概念基础上,因果观念的哲学理解与因果关系的统计学和计量经济学等学科研究走向融合,只不过,这仍然是因果关系实在论理解的产物。也正是由此,可以看到实在论因果观的历史和认识根源和局限。

正如实体实在论,因果关系的实在论理解遇到同样性质的问题。关于因果关系的经验实在理解,不能彻底化解休谟的怀疑;关于因果关系的先验实在理解,则难以摆脱逻辑的实在性根据以及更深层次的先验的经验基础问题。在量子力学中,这些问题得以空前凸显。实在论因果观的认识根源,在罗素那里有矛盾爆发式的反映。

不仅因果关系的原因研究,而且所有将主要因素归结为单一原因的研究,必定都属于实在论因果观。实在论因果观典型地表现在日常生活和经典物理学领域。恰如罗素哲学属于实在论研究的最终形式,在现代科学发展的因果观念反思中,罗素的因果思考在某种程度上可以看作实在论因果观发展的终曲。

无论在科学还是哲学中,因果性都有一个耐人寻味的遭遇:“因果原理是现代物理学的基础层面,而且一个多世纪以来一直是关于相对论和量子力学基础争论的核心,尽管如此,一直有一系列哲学思想认为因果关系应当从物理学中被删除出去。这一系列思想源自罗素1912年发表的观点。”[7]6罗素关于因果关系的这一观点,在因果关系研究中是另一个具有特殊意义的界碑。

罗素是因果关系研究中的轉折性人物,在量子力学创立之后,他就发现一个重要现象。在《论原因概念》一文中,罗素写道:“每一流派的所有哲学家都认为因果关系是科学的基本定理或假设,而非常怪异的是,在前沿科学中……‘原因一词从未出现。”[8]罗素的这一观点引发了争议,不同看法很多,也很有道理。法莱斯(Evan Fales)认为,“罗素走得太远了,竟预见到一个物理学完全摒弃因果概念和因果性的时代。物理学从来没有放弃这些概念,很难看到这如何可能。”[9]里格斯(Peter J. Riggs)则认为,“在物理学和一般地说在科学中,因果推理和原因的追寻一直是一种基本的方法论。”[7]7其实,只要系统地考察就会发现,罗素的因果观也并不是那么确定的,在1948年出版的《人类知识》一书中,罗素对因果关系做了深入的研究。他不仅提出了科学研究的五个公式,而且其因果观念已经从传统决定论的形式走向了统计因果性。他认为,物理学“已经用统计平均数代替影响每个个别现象的严格的决定论的因果性”[10]。罗素所提出的科学研究的五个公式,正是因果性研究归纳进路的成果。这方面的研究在赖辛巴赫那里有更深入的思考。赖辛巴赫认为,因果假设在归纳推理中具有重要作用,因果解释具有归纳的性质。[11]由此,因果观念的归纳逻辑进路走向概率研究,这一走向与因果关系的量化研究具有内在逻辑关联。与统计物理学、统计学、计量经济学、生物统计学和心理测验学等学科中的因果关系量化研究进路相应,因果关系研究的另一致思方向则是逻辑学研究。这种研究似乎与因果观的定性研究无关,属于纯粹操作性的。

因果性在量子力学发展中所遭遇到的,也属于量化冲击的力量,而且是更重要的冲击力——以重新刻画的因果关系描述,即是更重要的因素,但是量子力学不仅并不排斥因果性,而且本身不能没有因果关系。典型的像波尔,特别是玻恩,他们始终坚持因果观念,就像他们描述微观对象不得不采取互补的观念,在描述微观领域时不得不使用具有根本性的概率方法。有的研究甚至得到“量子非定域性遵循因果关系”[12]的结论。在量子物理学家那里,甚至仍然可以看到基于经典物理学观念的传统实在论的因果观,玻姆就是典型的例子。他认为,“一物所满足的因果律构成其存在模式的基本和不可分的方面”。[13]正是量子力学所涉及的更深层次的问题,使因果关系的研究不得不从因果观念的实在理解走向因果观念的描述理解。实在论因果观以物能存在的直接观测为前提,因此在日常生活和经典物理学中作为典型适用场所。当科学发展到量子力学,微观领域观测的直接性不再可能,而观测的间接性则使因果关系只能通过描述把握。正是由此,实在论因果观必须转向描述论因果观。

因果观念的描述理解与因果关系的实在理解有很大不同,它在给传统因果性理解带来冲击的同时,深化了人们关于因果关系性质的理解。这一点,在大数据相关关系的观照中更为明显。从大数据相关关系看,实在论因果观理解的局限性更是非常清楚。由于大数据意味着人类活动从描述到创构的发展,实在论因果观不仅不能适应量子力学领域的因果关系,更不可能涉及大数据相关关系基础上创构的因果关系。

二、描述论因果观

在因果关系研究中,休谟的特殊地位主要体现在两个方面:一是把因果性的研究从关于原因的研究明确提升到原因和结果关系的研究,二是将因果关系作为观念之间的关系讨论。正是这两个方面,使休谟的因果观具有跨越两个阶段研究的性质:从因果关系的实在论理解跨越到因果关系的描述论理解。休谟认为,实在意义上的原因定义来自原因以外的对象,因而是有缺陷的,可以代之以另一个定义:“一个原因是先行于、接近于另一个对象的一个对象,它和另一个对象那样地结合起来,以致一个对象的观念就决定心灵去形成另一个对象的观念,一个对象的印象就决定心灵去形成另一个对象的较为生动的观念。”[1]195自从休谟将因果关系归结为观念之间的关系,就意味着从实在论因果观到描述论因果观,因为观念间的关系本身不是实在的,而是对实在的描述。量子力学是描述论因果观的物理学基础,它凸显了因果关系更基本的性质。

从因果观念的发展看,正是休谟的“习惯性联想”使因果观的发展从第一阶段向第二阶段过渡。在从原因进入原因和结果关系的讨论时,休谟关于从单纯关于原因的研究到原因和结果之间关系的研究,有一段十分深刻的阐述:“我们没有关于这一联系的观念,当我们努力去构想它时,甚至连我们究竟想要知道它的什么东西,都没有一个哪怕是模糊的意识。”[14]而关于把因果关系作为观念之间的关系研究,则与他对因果关系概率性的涉及密切相关,这无疑意味着给因果关系经验论研究带来了一大关键性转折。

从更深层次上理解,因果关系概率性的涉及是因果关系研究至为重要的关键发展阶段。早在休谟那里,因果关系的研究就已经涉及概率因果性。虽然他把这种概率因果性看作是没有必然联系的结果,但他谈到“按照这些结果出现次数的多寡,分派给各个结果所具有的特殊的分量和权威”[2]51。由此已经可以看出概率因果关系的表述了。所以在《人类理智研究》中,专门有一章研究或然性(probability)。正是在这里,因果关系的研究便明显出现了定性研究和定量研究的分化,结果是哲学上的因果观念和科学上的因果关系概念明显分化。

事实上,确认或相信“有因必有果,有果必有因”的根据不在外部对象,而在理性或者思维自身,这无疑是因果关系研究的另一关键转折。其中道理其实不复杂:因为思维不可能理解与此相反的情景。休谟把因果关系从对象(objects)之间的关系转换为观念(ideas)之间的关系,不仅正是自觉不自觉地反映了这样一种理性处境的结果,而且也是从面向对象到面向观念的转换,这意味着从实体写照转换到关系描述。事实上,在休谟和康德那里,已经可以看到因果关系理解描述转向的必然性。休谟把必然性看作是心中而不是对象中的东西,康德的先天形式虽然号称是先验的,但事实上也源于思维中的规定。[15]把因果观念归之于先验,只是对原因无穷追问的神学式终结,其根源仍然在思维中的规定。在关于因果观念的这一认识阶段,主要对因果关系作了描述理解,“原因是对因素相互作用过程的描述;结果是对因素相互作用效应及其痕迹的描述。”[16],而随着实证科学的发展,关于因果关系的描述理解在对事物过程的量化把握中达到极致,这是从统计学发展以来,关于因果关系定量研究长期发展的结果。

随着科学的进一步发展,统计力学等理论逐渐兴起后,人们不得不对具有因果聯系的事物进行统计性研究,这就有了所谓“统计因果性”,而“统计因果性”明显越来越远离因果观念的实在论理解。因为按照“统计因果性”,不仅因果联系不是必然的而是概率性的,而且它所反映的也明显不是牛顿力学中实体之间的关系。随着统计学的发展,尤其是典型的像计量经济学等经济学相关学科的量化发展,因果关系的研究不可避免地走向数学化,走向与康德的先天形式不同的方向,归根结底走向因果观念的实践理解。事实上,在实在论因果观念中,当因果关系涉及众多因素的相互作用,就为从实在论因果观走向描述论因果观提供了客观基础。面对复杂因素体系,从因果实体观念到如何描述一个对象致思,就可能引向另一个方向,即如何用因果关系描述对象。这样一来,就涉及基本的描述方式,因为统计的描述方式所得到的肯定不是传统的实体因果观,这就全面导向因果关系的量化研究。由此,因果性研究出现了“两股道上跑的车”——因果观念定性研究和因果关系定量研究的明显分野。结果在哲学上的因果观念和科学上的因果关系之间,出现了奇异的概念完全分化,促生了从实在论因果观到描述论因果观的发展。描述论因果观和实在论因果观的原则区别在于:因果观念不是对象关系的镜像反映,而是对于对象确定性联系的描述。其典型例子就是对实在对象的统计把握所得到的概率性结果,并不是对对象本身实在特性的把握,而是对实在对象的描述产物,因而概率性不是客观实在本身的特性,而是客观对象主观描述的特性。这就真正解决了量子力学中因果关系的理解问题,甚至走出了量子理论所涉及的实在论困境。对实在对象的描述和实在对象本身的区分,不仅避免了量子领域的非实在论结论,在描述层次达到对于实在论的更合理理解,而且给因果关系的量化统计进而对大数据相关关系的研究提供了更准确的解释。

自从统计学之父卡尔·皮尔逊(Karl Pearson)提出“相关系数”(correlation coefficient)概念,统计学研究就大多是关于“相关关系”的理论,而关于“因果关系”的统计理论极少涉及,皮尔逊甚至明确反对因果关系的统计研究。[17]统计学的定量研究大大推进了实证科学的发展,但在因果关系基础理论研究上的贡献则并不那么明显。统计学中关于因果关系的研究,主要是因果推断研究的成果。源自因果关系定量研究的因果推断成果,主要有格兰杰因果关系等。

由于其实践性和量化操作特点,在统计学和计量经济学等学科中,因果关系的最重要意义在于预测,在于使用。由于必须具有可操作性,因而因果关系必须是可检验的,至于是不是真正意义上的因果关系,或者说到底是因果关系还是相关关系,则相对处于次要位置。由于主要是量化的研究,而因果关系的量化把握意味着抽象化为相关关系,因此自然而然越来越关注的是相关关系。这是一种关于因果关系的量化把握,而因果关系的量化把握结果,只能是相关关系。因此,在统计学和计量经济学等学科中,才有一种基于“预测”的“格兰杰因果关系”(Granger causality)。正是“格兰杰因果关系”催生了一种快速发展的“因果检测”(causal test)研究,以至因果推断(causal inference)成了一个越来越热门的新学科。格兰杰因果关系的提出是耐人寻味的,这是一种关于因果性的新理解。

在因果关系的研究中,格兰杰因果关系是一个标志性的成果,虽然它是从描述实践的角度所进行的经济学领域的研究,实际上却是一个具有哲学性质的理论。格兰杰是一位具有哲学思维头脑的经济学家,他对因果关系的哲学研究有不同看法,认为沿着当时关于因果性的哲学研究进路,不可能得到进入统计实践的成果。因而他的因果研究从一个不同于哲学研究的角度,即从因果性的抽象理解转向因果性的量的具体操作。由于统计学和计量经济学等学科要致力于操作,所以就必须从因果性的实践出发;由于完全从相关关系的量的角度去探讨,关于格兰杰因果关系是否属于“真正”意义上的因果关系,存在争议也是必然的,但是统计学和计量经济学等学科的因果关系研究,正像量子力学中的因果性探索那样。量子力學通过数学形式体系去把握微观对象的关系,而统计学和计量经济学等学科也同样是通过变量之间的关系,去把握经济社会领域的对象。从统计学家和计量经济学家的角度思考问题,最重要的方面之一是实践操作,但这种操作性的致思,不仅对于经济学等学科具有重要意义,而且也使因果性研究完成了一个重要转向:从因果观念的实在意义上的理解转向描述意义上的理解,这种转向对于因果关系理解的进一步深化至关重要。

虽然格兰杰对哲学家们关于因果性的研究有自己的看法,但他也不管自己所反映的因果性是不是真正意义上的因果性。在因果关系的研究中,格兰杰的主要诉求是应用操作,由此可以看到“使用”在这里具有重要地位。这一方面使因果关系的理解受到相关关系发展的极大冲击,但另一方面,也恰恰是因为统计学和计量经济学等学科的发展,相关关系带来了因果关系理解的一个新的转机。

格兰杰因果关系提出之后,计量经济学就完全从因果性的定性研究转向了因果关系的定量研究,也就是从实在的因果性理论思辨转向了描述的因果性实际操作,但格兰杰因果关系仍然坚持实在论的因果观,只是关于它是不是真正意义上的因果关系的问题,在某种程度上被搁置了起来,而主要是进入量的实际操作。对于因果关系的描述理解来说,一个标志性的根本特征,正是在操作上和因果关系定性上的分离。这既是格兰杰因果关系所充分凸显的一个方面,又是它引出转机的另一方面。

格兰杰关于因果关系的研究当具里程碑意义,他把因果关系研究从单纯的理论目的转向实践,从概念转向操作。这位诺贝尔经济学奖获得者认识到,人们在研究因果关系时所使用的大多数例子,都来自经典物理学和化学[18],而格兰杰的研究是从因果性的抽象理解转向因果性的量的具体操作。统计学领域所进行的,显然是另一种形式的因果性研究。他在明确了哲学家们关于因果关系还没有达到一致的意见,还没有找到大多数人能接受,特别是产生多少对于实践中的科学家们有用的定义后,就开始在描述论因果观的基础上进行新的探索,并形成瞬时因果描述模型。

格兰杰因果关系是一种描述模型,这种描述模型实际应用的有效性为实践所证明,但这种模型的实在论意义却不能确定。因此有人提醒:“就我们的目的来说,更好的做法是把格兰杰因果关系和外生性概念区分开来,而把前者当作一个处理时间序列数据的有用的描述工具。”由此可以看到,实践操作上的一些问题,归根结底源自理论上的问题。“由于涉及滞后,分布和(或)自回归模型引出了经济变量中的因果关系话题。在实际应用中,格兰杰因果关系模型引起了相当关注。但人们在运用格兰杰方法论时不得不格外谨慎,因为在模型使用中的滞后长短异常敏感。”[19]科学理论的发展越来越表明,抽象理论描述所具有的,实际上是描述意义,其实就意义的寻求本身而言,已经证明不是一种传统意义上合理的研究进路(approach),这不是格兰杰因果关系本身的问题,而是因果关系量化理解的结果,这种研究在现代哲学中与归纳逻辑研究相联系,基本上从必然性退离到或然性,凯恩斯、卡尔纳普和波普等实际上都趋向于以描述的因果性代替实在的因果性,只是在量子力学的理论解释中才典型地表现出来。

因果关系的量化表征,使因果关系从实在关系转化为变量之间的函数关系。由于所表达的——或可以弱化为相关关系,而事实上量化的相关关系主要是对因素之间、结果之间以及因素(常常是主要因素)和结果(效应)之间关系的量化表征,函数关系并不是对因果关系的直接把握。人们早就认识到,在相关关系中,“两个变量之间存在有意义的线性关系,并不意味着一个变量是另一个变量的原因。”[20]但由于可以对当下过程进行了解和把控,因而可以帮助对未来进程进行预测。这种因果理解是应把握当下事物过程并预测未来进程之需而生,属于对原因和结果关系的量化,因而是相对间接的把握;但从对因果关系的理解程度看,这种量化把握却是相对精确的,因而在统计学和计量经济学等学科中得到广泛应用。在这种因果关系把握中,人们最关心的是特定因素对当下和未来结果的影响。而在这一认识阶段,把握因果关系的目的从第一阶段的由果溯因转向由因(素)索果,由此导致因果关系理解发展的重要进程:科学中的因果关系概念与哲学中的因果关系概念不仅开始完全分化,而且哲学意义上的因果概念(观念)在科学中渐呈边缘化趋势,科学中的因果概念甚至与因果关系的哲学理解相抵触,以至在统计学和计量经济学等学科中,甚至出现两种概念相冲突的现象。在统计物理学、统计学和计量经济学等学科中,因果关系的理解客观上出现以相关关系的定量研究淹没因果观念的定性理解的现象,甚至出现排斥因果性哲学理解的趋势。这种发展趋势不是单方面造成的,关于因果观念的哲学研究在某种程度上漠视因果关系定量研究,也是相对消极的另一方面因素。

在哲学家们看来,统计学和计量经济学等领域的因果关系研究主要是应用性的,因此没有引起太多的重视。一方面,在哲学中,因果性研究“囚禁”在经验和先验的分立中;而另一方面,在科学中,因果关系的研究则似乎“放逐”在远离因果观念领地的经验领域。在这样的发展形势下,因果关系的量化研究,必定走向主要把握相关关系。科学中对因果概念的理解或相关关系的把握,典型地表现在统计物理学、统计学和计量经济学等学科中。而当这种进路深入到基础科学——(典型的是)量子力学中时,因果观念的研究则遇到了根本的挑战和困难。

尽管对于因果关系的研究贡献有限,统计学及相关学科对相关关系的研究却具有不可替代的重要地位。只是当涉及更深层次,一些关键问题就随之出现。相关变量具有相互关系及其相关方向,它们之间的相关程度,在统计学和计量经济学等学科中由相关系数(Correlation coefficient)确定。为了反映变量之间相关关系的密切程度,皮尔逊设计了统计指标。出于一种纯粹实际操作的目的,相关系数在一般情况下具有重要操作价值,但它有一个缺陷:数据组的数量对相关系数接近于1的程度影响较大,容易因为波动太大而造成假象。数据组的数量太少,相关系数容易偏大,反之容易偏小。当只有两组数据时,相关系数的绝对值总为1。这种严重失实的现象,既是单纯的相关关系定量研究不可避免的局限,也是因果关系量化的问题所在。

在因果关系的描述理解中,难以面对的一个基本问题就是相关关系的因果关系意味,也就是因果性和相关性之间的关系。罗素正是由此一度走向否定因果关系的方向。由此科学中的因果关系研究与哲学中的因果观念研究出现重新融合的重要趋势,而数字技术特别是大数据的发展,则使因果模型从描述扩展到建构,因果观念从而推进到一个新的发展阶段。

三、模型论因果觀

因果观念的发展是一个不断展开的过程,从实在论因果观到描述论因果观再到模型论因果观,随着认识的深化不断展开。在休谟的因果观念中,不仅隐含着描述论因果观,而且还是模型论因果观的萌芽。

休谟把人们通常认为是事物之间的联系看作是观念之间的联系,事实上涉及一个具有根本意义的范式转换。而将这种观念间的联系原则进行分类,则是休谟首次进行的。正是把事物之间的联系看作观念之间的联系,意味着把抽象概念、描述甚至理论体系归结为模型。由外部定义就是根据外部客观事物的相互作用定义,而内部定义则是观念间的关系。这后一个定义不仅意味着描述的因果观,而且隐含着因果模型描述的胚胎。

随着信息科技特别是大数据的发展,人类认识和实践面临新的发展形势,进入了一个新的发展阶段。大数据相关关系给人们提供了越来越多的便捷方式,似乎在很多情况下可以规避因果关系的艰难探索,直接运用相关关系解决问题。由此一来,因果关系的研究不仅面临大数据相关关系的挑战,而且面临创构的因果关系这样一个新的研究课题。

新的课题意味着新的视野,在大数据相关关系层次对因果观念的发展作整体观照,正可以看到重新刻画的因果概念进一步扩展的空间。重新刻画的因果概念,不仅为量子领域的因果关系描述提供了更合理的模型,而且为回应大数据的发展所带来的相关关系给因果关系的挑战,准备了更宽广的因果模型构架,从而为因果关系和相关关系的融通理解奠定了基础。正是从大数据相关关系层次,可以更清楚地看到因果观念嬗变的内在逻辑。

在科学中,无论是作为实体相互作用的经验现象,还是变量之间的关系,因果关系必须具有前因后果的时序性。甚至在哲学中,原因和结果之间具有先后时序性也一直是一种原则性的规定。这既是传统因果观中“铁的因果链”必不可少的预设,同时也是其阿喀琉斯之踵。

因果关系的实在理解和描述理解,相对于人类认识的不同发展阶段,都是因果关系规定发展的合理形态。今天,大数据的出现和发展,正酝酿着因果关系理解的更高层次,催生因果关系规定的新形态。

因果关系在哲学中的定性研究和在科学中的定量研究,似乎是一种导致矛盾的分歧,事实上则构成了一种强大的张力,极大地推动了因果关系的理论研究和实践把握,不仅将因果关系从实体意义上的关系推进到描述意义上的关系,而且把描述论因果观进一步提升到模型论因果观,并从描述的因果模型推展到创构的因果模型。

描述论因果观无疑开启了因果关系新的理解,但由于描述模型本身最初与统计模型的天然关联,不可能真正使因果观念的休谟式经验理解和康德式先验理解在新模型的基础上走向融合和统一。事实上,基于描述不可能找到二者融合和统一的新基础。因为大数据意味着创构,而创构不是描述,创构过程既不能基于实在论因果观,也不能以描述论因果观为基础;创构意味着模型,创构的因果关系意味着必须有创构的因果模型。由于无中生有的创构与既定存在的描述具有根本不同,因果关系的模型论理解在创构活动中得以空前凸显。描述论因果观和实在论因果观适用于对对象的描述而不适用于对象的创建,特别是具有创生性的信息创构,因此描述论因果观必须转向描述和创构一体化的模型论因果观。人类在大数据基础上的创造活动是创生意义上的创构活动,必须转向描述的因果模型和创构的因果模型一体化的模型论因果观。由此可见,只有发展到大数据,人类根据自己的需要在大数据相关关系基础上创构,建立起创构的因果模型,才能在描述的因果模型和创构的因果模型的统一理解中,不仅与实践联系起来,而且进一步与人的需要联系在一起。这正是自因果关系的量化研究开启以来,直到大数据完全量化的发展凸显的相关关系,为因果模型的扩展带来的新的发展空间。对于因果关系和相关关系来说,正像“人体解剖对于猴体解剖是一把钥匙”[21],在大数据时代,因果关系和相关关系及其相互关联有了更高层次的整体观照。

自从人类学家弗朗西斯·高尔顿(Francis Galton)在18世纪提出“(向均值)回归”的概念,模型的使用就发生了根本性的转换。线性回归模型意味着从严格意义上的“物理模型”转向“统计模型”,即从刻画物理机制转向刻画变量之间的关系。由此可以看到描述与模型的天然关联。因果性理论的统计学研究标志着一个重要转折,即从基于经典物理学的因果性研究转向因果关系的统计描述研究,而所谓统计因果性其实已经不是在经典物理学意义上谈因果性,而是将因果性的研究从实在层面转向了描述层面,而描述的不断抽象化发展,正是模型典型化的过程,结果就是典型的模型。虽然描述和模型之间具有密切的发展关系,但描述和模型之间又有重要因果观后果。描述意味着可以是对实在对象的摹写,而模型却可以与实在对象完全是两回事。这一点,从博克斯(George Box)的模型观可以得到更准确的理解。他认为,“模型都是错的,只是有些有用”。[22]这就决定了模型论因果观和描述论因果观的分野,只是二者间具有发展的一体化关系。而且,因果关系的模型理解和因果关系描述理解还具有不同的意义。多变量时间序列分析的最新进展表明,修正的模型结构可以处理由瞬时相关关系造成的令人困(迷)惑的效应(结果)。[23]更重要的是,模型论因果观在更深层次反映了因果关系的性质。

正如因果性研究的描述论转向,意味着因果关系是对实在对象的确定性关系的描述,因果性研究的描述转向,也意味着因果关系其实是一种描述模型。随机性作为计量经济学等学科中因果描述模型的“黄金准则”,正说明统计因果性的描述而非实在性质。“因果关系只能决定于随机性的断言是随机性作为因果推断‘黄金准则(gold standard)的具体说明。”[24]由因果关系的量化研究,特别是格兰杰因果关系等的提出,使人们逐渐认识到,随着科学的发展带来人类认识的深化,模型和对象之间的关系越来越不是直接反映而是应证(justification)关系。[25]对象和相应模型之间就不再是客观描述的关系,描述产物其实更是一种模型。在这个意义上,正是在因果关系描述理解的基础上,发展出了因果模型的理论研究,并基于因果模型的研究发展出更丰富的理论。实际上,展开因果概念的重新刻画就可以清楚地看到,当我们面对外部世界,在关于既存对象的认识中,因果关系越来越只是一个模型。正因为如此,在这种认识中,在大数据相关关系的整体观照中,可以得到关于因果关系的更高层次理解。一方面,在大数据中,因果关系通过量化蜕变为变量之间的相关关系,因果关系的描述理解构成对传统因果观空前严峻的挑战。另一方面,其实大数据中的因果性和相关性,或者大数据的因果关系和相关关系,从量的维度深化了对因果观念的理解,为因果概念的进一步展开提供了更高层次的整体观照。正是在这个维度可以看到,通过进一步展开重新刻画的因果概念,不仅因果观念的实在论理解和描述论理解就会在新的发展阶段走向融合,而且会由此展开一个创构因果观念的新的层面,从而将作为两种不同发展趋势的关系统一起来。正是在这一发展阶段,因果关系不仅可以被理解为描述模型,而且可以被作为创构模型理解。作为因素的相互作用过程,关于原因的这种理解只是到大数据时代才得以充分展开。在大数据基础上,作为描述模型的因果性和作为创构模型的因果性两方面构成完整形态的因果模型。

一方面,正像完全是数学形式体系描述的量子力学,大数据完全在量化的基础上理解因果关系,因此相关关系的地位和作用空前凸显,由相关关系取代因果关系的倾向在某些实践层面有其一定的合理性。随着现代科学的抽象发展,因果关系的量化使科学领域对因果性的把握,从主要对因果关系的把握扩展到对因素和结果(效应)关系及其因素间和结果间等相关关系的把握。正是因素和结果关系具有因果关系和相关关系双重性质,或者说,正是因素和结果关系,为因果关系性质保留最多的相关关系,大大拓展了因果模型的把握空间,从而不仅避免了描述意义上量化把握的局限性,而且開辟了因果关系研究的广阔空间。而因素分析方法之所以可以避免上述失实等缺陷,则因为因素分析不仅更具体,而且可以与定性分析相结合。因果关系定量分析和定性研究的结合,意味着在统计意义上的因果描述模型和实在意义上的因果创构模型之间,存在着重要探索空间。另一方面,在创构模型中,相对于潜在结果的因素关系展示了一个创构的可能性空间。相关关系取代因果关系虽然意味着对因果关系更间接的把握,但由于以大数据为基础,更由于在信息文明时代,这种量化的把握具有非同寻常的意义。虽然只是对因果关系的量化把握,但由于可以对因素及其相互作用进行把控,因而可以按照人们自己的设想创构自己需要的结果。这种因果关系的把握是应大数据时代创构从未存在的新对象的需要而生,主要是对因素进入相互作用过程和状态的把握。在这种因果关系的把握中,人们最关心的是因素以什么方式进入什么样的相互作用,从而形成什么样的结果。在这一阶段,把握因果关系的目的从“由因(素)索果”进一步推进到“由因(素)构果”。[5]在这一认识阶段,因果性和相关性之间的关系已经具备澄清的基础和背景,描述的因果模型进一步扩展到创构的因果模型。在因果创构模型中,因果关系的理论和实践理解得以融通,亚里士多德“形式因”“质料因”“动力因”和“目的因”的内在逻辑得以充分展开。

大数据不同于大自然的性质,不上升到模型论因果观,就不可能把握大数据相关关系。面对大数据基础上的创构(典型的是人工智能)不同于对既存对象的描述,不从描述论因果观进一步提升到模型论因果观,不可能满足大数据基础上创构的因果模型需要。在这方面,珀尔将大数据和人工智能相结合的因果观,标志着模型论因果观的成熟形态。

四、三种因果观的整体关联

在大数据相关关系的观照中,从实在论因果观到描述论因果观,再到模型论因果观,呈现出一个发展的整体。在三种因果观念中,相互之间的认识递进关系显而易见。实在论因果观是就物能和信息相互作用的过程,描述论因果观是就观念间的关系,而模型论因果观则是就引擎体(agent)和对象之间的实践关系而言的。因此,模型论因果观并不是描述论因果观的否定,描述论因果观也不否定实在论因果观,而是因果关系理解层层细化深入的结果。三种层层递进的因果观,具有不同的适用范围。实在论因果观只适用于宏观低速运动领域,描述论因果观扩展到还适用于微观领域,而模型论因果观则进一步扩展到还适用于创构领域。实在论因果观是关于对象确定性联系的把握,描述论因果观是将实在论因果观抽象为描述的产物,而模型论因果观则是描述论因果观发展到完全抽离具体经验条件的结果。三者构成引擎体把握对象确定性联系之间的层次关联,反映了从感性具体到思维抽象,再到思维具体的发展过程。其中,实在论因果观处于感性具体层次,描述论因果观处于思维抽象层次。然而,模型论因果观则处于思维具体层次,它将抽象的定性描述和定量描述结合起来并构成二者一体化的整体观照。

正是在大数据基础上,从描述的因果模型到创构的因果模型,意味着二者的深层次融合,为存在论意义的更高层次的因果模型奠定了基础。在以往的观念中,因果性研究是一个特殊的认识论领域,“因果关系的认识论研究我们如何得知因果关系。”[26]在大数据条件下,相关关系基础上创构的因果模型,不仅在关于因果性的认识论研究中,使人们对因果关系的认识达到了一种更完整的形态,而且使因果关系的研究得以深化到存在论研究层次。由霍金关于“依赖模型的实在论”,可以联想到关于因果关系研究的存在论转向。

依赖模型的实在论认为,一个物理理论和世界图景是一个模型以及一组将这个模型的元素与观测连接的规则的思想。因此,去问一个模型是否真实是无意义的,只有是否与观测相符才有意义。[27]依赖模型的实在论给人们的印象,一方面是富有启发的合理性,另一方面又是隐约可见的悖理性。其根源就在于“模型”和“实在”的这一逻辑关联既涉及新的研究范式,又涉及两种不同研究范式的混合,从而构成了某种富有启示意义的范式悖论。汲取其合理因素,超越这一悖论性命题,必须进入存在论层次。

在描述的因果模型和创构的因果模型基础上,进一步探索存在论意义上的因果模型,正是因果关系进一步研究的重要课题。因果关系的存在论层次研究,必须从大数据进一步深入到信息层次,在信息性存在基础上进行。

参考文献:

[1]休谟.人性论[M].北京:商务印书馆,1996.

[2]休谟.人类理智研究[M].北京:商务印书馆,1999.

[3]康德.任何一种能够作为科学出现的未来形而上学导论[M].北京:商务印书馆,1982.

[4]HUME D. A Treatise of Human Nature[M].London:Oxford University Press,1888:87.

[5]王天思.大数据中的因果关系及其哲学内涵[J].中国社会科学,2016(05):22-42.

[6]ROBERT R,PAGANO. Understanding Statistics in the Behavioral Sciences[M].Tenth Ed.. Wadsworth:Cengage Learning,2013:138.

[7]PETER J,RIGGS. Quantum Causality[M]//Studies in History and Philosophy of Science.Berlin:Springer Science & Business Media,2009.

[8]RUSSELL B. On The Notion of Cause[M]//Mysticism and Logic and Other Essays.London:George Allen & Unwin Ltd.,1913:180.

[9]FALES E. Causation and Universals[M].London:Routledge,1990:78.

[10]羅素.人类的知识[M].北京:商务印书馆,1983:387.

[11]REICHENBACH H. Experience and Prediction[M].Chicago:The University of Chicago Press,1970:370-371.

[12]AHARONOV Y,ROHRLICH D. Quantum Paradoxes:Quantum Theory for the Perplexed[M].Weinheim:Wiley-VCH,2005:87.

[13]BOHN D. Causality And Chance In Modern Physics[M].London:Routledge & Kegan Paul Ltd.,1984:11.

[14]HUME D. An Enquiry Concerning Human Understanding[M]. New York:Oxford University Press Inc.,1999:146.

[15]王天恩.创构时代的思维规定[J].南国学术,2019(3):367-379.

[16]王天思.微观认识论导论:一种描述论研究[M].南昌:江西人民出版社,2003:301-314.

[17]KEYNES J M. A Treatise on Probability[M]. London:Macmillan and Co. ,Ltd,1921:186-426.

[18]GRANGER C W J. Testing for causality:A personal viewpoint[J].Journal of Economic Dynamics and Control,1980 (2):329-352.

[19]古扎拉蒂.计量经济学基础[M].第四版.北京:中国人民大学出版社,2005:658-659.

[20]DAVID F G,PATRICK W S,PHILLIP C F,et al. Business Statistics:A Decision Making Approach[M].8th Edition. New Jersey:Prentice Hall,2003:587.

[21]马克思,恩格斯.马克思恩格斯选集:第2卷[M].北京:人民出版社,1995:23.

[22]BOX G E P. Robustness in the strategy of scientific model building[M].New York:Academic Press,1979:202.

[23]FAES L,NOLLO G. Extended causal modelling to assess partial directed coherence in multiple time series with significant instantaneous interactions[J]. Biol Cybern,2010,103(5):387–400.

[24]HECKMAN J J. Econometric Causality[J].International Statistical Review,2008,76(1):1–27.

[25]王天恩.理论和实践关系的历史反思与当代刻画[J].思想理论教育,2018(09):4-10.

[26]RUSSO F. Causality and Causal Modelling in the Social Sciences: Measuring Variations[M].Berlin:Springer, 2009:2.

[27]史蒂芬·霍金,列納德·蒙洛迪诺.大设计[M].长沙:湖南科学技术出版社,2011:5-37.

The Development of Causal Concept from Big Data Correlation Point of View

Wang Tian'en

(Shanghai University,Shanghai 200444,China)

Abstract:With the deepening of human cognition and the upgrading of practical activities, the development of causal concept has undergone two important transformations and formed three basic views of causality:realistic,descriptive and modeling. The first transformation arose from the development from classical physics to quantum mechanics;the second originated from the development of information technology,especially big data. Among the three causal concepts,the realistic causal concept is the result of grasping certainty relation among objects,the descriptive causal concept is the product of abstracting realistic causal concept into description and the modeling causal concept is the result of the development of the descriptive causal concept,which is completely divorced from the specific empirical conditions. From the evolution of the causal concept in the process of human cognitive development,we can further see that, in fact, the two important transformations of the causal concepts are closely related to the manifestation of information. In quantum mechanics,information is highlighted unprecedentedly,and the quantum phenomena generated in microscopic observation are the information as the receptive relationship;Big data itself is the product of digital coding of information,and it is the big data correlation that develops the causal views from being mainly based on material energy to being mainly based on information.

Key words:causal concept;big data;correlation;holistic view

责任编辑:王廷国

收稿日期:2020-12-29

基金项目:本文为国家社科基金重点项目“大数据相关关系和因果关系研究”(项目批准号:17AZX003)的阶段性成果。

作者简介:王天恩,男,江西莲花人,上海大学马克思主义学院教授、博士生导师,上海大学“伟长学者”特聘教授。研究方向:信息、大数

据和人工智能哲学。

猜你喜欢

相关关系大数据
地区公路投资与经济增长关系探究
以数据新闻获奖作品探析数据新闻特征
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
上市公司经营状况与信息披露透明度相关性分析
大学生复原力与负性生活事件、心理健康之间的关系