APP下载

数据科学视域下的出版学研究方法

2017-12-09杨晓新

出版科学 2017年6期
关键词:出版学研究方法科学研究

杨晓新

[摘 要] 出版学作为一门独立的学科,想要获得突破与发展,必须依赖于科学有效的研究方法,但关于出版学研究方法的研究成果屈指可数。本文以数据科学为背景,分析目前出版学研究方法面临的困境,阐述科学研究方法在出版学中的演变,并提出数据科学对出版学研究方法的影响。

[关键词] 出版学 第四范式 科学研究 研究方法 数据科学

[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2017) 06-0046-05

[Abstract] As an independent discipline, publishing science relies on scientific and effective research methods in order to achieve breakthroughs and development. However, there are few studies in this field now. Based on the data science, this paper focuses on the analysis of the dilemma that publishing research methods encounter currently, expounds the evolvement of scientific methods in publishing science, and indicates the influence of data science on publishing research methods.

[Key words] Publishing science The fourth paradigm Scientific research Research methods Data science

出版学作为一门独立学科,是日本学者在1969年首先提出并创立的[1]。经过近50年的快速发展,出版学专业已得到社会的认可。但按照传统的观点,一个学科得以独立,必须具备三个条件:研究对象,理论体系和研究方法。综观目前国内出版学的著作和研究文献[2][3][4][5],关于研究对象和理论体系的成果较多,但对于研究方法的研究,却只有少量文献有迹可循,这与当前出版业其他方面的研究成果产生了巨大反差。巴普洛夫曾说过:“初期研究的障碍乃在于缺乏研究法。无怪乎人们常说,科学是随着研究法所获得的成就而前进的。研究方法每前进一步,我们就更提高一步……因此,我们头等重要的任务乃是制定研究法。”[6]研究方法和理论体系密不可分,理论的探讨归根到底是对研究方法的探讨,研究方法的完善在某种程度上也是学科的完善。因此在当前出版业发生急剧变化、新媒体新技术不断涌现、新问题层出不穷的背景下,如何完善出版学的研究方法,从而进一步深化出版学研究,成为当前亟待解决的重要难题。

1 出版学研究方法现状

研究方法是人们解决科学问题时所采取的基本手段、途径和规则,它对于学术规范的形成和完善起着决定性的作用。出版学自成立诞生之初,学者们对其研究方法就存在不同认识。通常认为出版学是传播学的分支,研究方法应该与传播学一样。以日本学者清水英夫为代表,部分学者认为出版学的研究方法与一般大众传播研究一样,“出版”也大致存在着哲学的、历史的、机能的三个研究领域……研究出版学的方法,还在探索之中[7]。国内学者也基本认同这种说法,如彭建炎认为出版学研究方法分为三个层次:哲学方法、一般研究方法和特殊研究方法,而目前尚未找到这种特殊的研究方法[8]。随着出版学研究的深入,不少学者认为具体问题具体分析,不同的问题应该采用不同的方法。余敏认为研究方法主要是哲学方法和一般研究方法,一般研究方法主要指出版学从其他学科中借用的对自己仍然适用的方法……如观察法、分析法、归纳法、比较法等[9]。李新祥认为出版学的研究方法主要有相关学科為出版学研究提供的方法,包括科学的马克思主义哲学、系统科学方法、传播学研究方法及其他相关学科如社会学、管理学、统计学、法学等提供的方法[10]。刘永红认为出版学研究方法一方面要不断加强出版学不同研究方法的整合,另一方面也要注重并逐步加大个案研究方法与比较研究方法在出版学研究中的运用[11]。罗紫初专著《比较出版学》就从出版学的学科理论、出版事业、出版实务和出版技术与未来四个方面入手,运用比较研究法对跨国度的出版活动实践和理论进行比较分析,以发现其异同、特点及其形成的原因,并由此揭示出版活动的普遍规律[12]。概而言之,由于出版学是研究出版的形成与发展以及探讨出版工作规律的社会科学[13],研究对象主要是出版物、出版工作和出版业等,因此学者普遍认为不同的对象应采用不同的研究方法。由于出版学既具有文化属性,又有产业属性,所以在基础层面上是马克思主义的哲学方法,但在具体问题层面可以采用多样化的研究方法,如比较研究法、个案研究法、调查研究法、定量研究法等。

人类的出版历史已有几千年,但出版学作为一门学科进行系统研究的时间却很短。它在建立之初,就遭遇“出版无科、发行无学”的尴尬境地,学者们不断寻求学科独立性的佐证,但又因研究方法的非独特性而陷入两难。大量地借鉴其他学科的研究方法而引人非议,以至于出版学在很多人眼里并非是一门学科;同时,出版学科的研究人员过多采用定性与思辨的研究方法,对于同样的事物,按照不同的视角去观察和思考往往会得出不同的研究结果。正如爱因斯坦说过:“你能不能观察眼前的现象,取决于你运用什么样的理论。理论决定着你到底能够观察到什么。”[14]由于价值期待不同以及偏好不同,使得研究成果因人而异,其客观性大打折扣,难以得到学界以及社会的认同。

2 研究方法是出版学科发展的必然诉求

出版学的发展与完善是每位出版研究者都关心的问题,一个不能为社会生产服务的学科是不具备生命力的。现行的学科体系是研究者安身立命之所,从这个意义上讲,出版学迫切需要具有说服力的学科成果,而成果的建构必须源于合理的研究方法,不讲究方法的研究只能是“墙上芦苇,头重脚轻根底浅”,不具指导性和实践性。endprint

研究方法直接决定着研究过程的科學性,决定了研究成果的深度和广度。出版学和其他所有学科一样,早期研究过程中一般以主观经验主义和拿来主义为主,对研究方法的研究不够。例如,出版学领域常见的以“基于某理论的……”命题的研究文章,研究者以这些理论作为自己研究的重要依据,而忽视了适用环境和条件。以“最新技术”为“先进技术”,忽视了技术使用的时空空间。对研究成果的价值判断不是依据实际的社会效益,而是依据主体的主观想象解释,因而这种局限于个人经验的研究方法直接影响成果的普适性,成为出版研究者为人诟病之处。

出版学科如果没有科学的研究方法保驾护航,其学术地位在很大程度上会受到削弱,也难以成为一个独立的具有专业价值的学科,甚至其存在的必要性都会受到质疑和挑战。随着出版事业的不断发展,大量现实而具体的问题涌现出来,这些问题不再局限于观察和经验总结等方法,研究的成果需要有验证性和可操作性,具有学术价值。它要求研究者能够共同遵守规范的研究方法,研究过程的论据要有说服力,研究的数据要求准确,推理过程符合逻辑性,结论能反映客观规律,具有指引性、合理性、适用性以及实践性,能够更好地服务于社会出版事业发展。唯有此,才能彰显出版学的学科特性和专业价值。

3 数据科学推进下的出版学研究方法

出版学科发展必然会受到研究方法的影响,科学正确的研究方法所产生的研究成果又会带动学科的发展。随着从大数据探索“未知的秘密”成为学科研究必不可少的一部分,出版学的研究方法也在悄然改变。

3.1 当前研究方法受到的挑战

吉姆·格雷(Jim Gray)在《第四范式:数据密集型科学发现》一书中指出[15],科学研究的范式包括四个阶段:几千年前,科学以实验为主,主要描述自然现象;数百年前,科学出现理论研究,主要利用模型和归纳;几十年前,科学出现计算科学,主要对复杂现象进行仿真模拟;现在科学是数据科学,将理论、实验和计算仿真统一起来,即科学研究范式经历了实验科学—理论科学—计算科学—数据科学四个阶段。实验、理论和计算仿真是研究对象一定范围内的数据,而数据科学是将对象所有数据进行关联分析。数据科学并没有否认实验、理论、计算仿真的科学合理性,在数据科学的研究方法下,仍然需要从原有的观察经验入手,提出假设,然后根据假设进行实验验证,得出结论又需要通过理论来进行推演验证,而数据科学方法是服务于这三种方法并通过数据将其有机地统一在一起。

库恩提出科学的发展是由于:“范式改变的确使科学家对他们研究所及的世界的看法变了……在革命之后,科学家所面对的是一个不同的世界……在科学革命的时候,常规科学传统发生了变化,科学家对环境的知觉必须重新训练。”[16]当社会环境发生变化,科学研究者在解决新的问题时,原有的方法受到质疑,达不到解决问题的效果,这就促使新方法的产生。当前信息技术一日千里,研究条件发生了巨大的变化,研究对象的数据化为研究者提供了新的研究路径,研究过程的科学性带来研究成果的可复证性。通过直接挖掘反映研究对象的数据世界,可以找到隐含的自然或者社会规律,这使得原有的研究方法受到了各个方面的挑战。主要表现为:(1)数据的获取,互联网和物联网技术的发展,给科研带来了各种不同规模和性质的大数据,其体量不仅巨大,而且结构繁杂,呈现动态变化。对象越复杂,越全面,其研究结果越能反映问题。(2)数据的管理,数据的跨平台、跨结构、跨组织,给科研带来的数据管理领域不仅要涉及各类业务,而且范围覆盖整个组织乃至全球。(3)数据的分析,多层次、多维度的离散数据,让科研的过程变得非常有趣。传统的研究方法是通过数据建立具有因果关系的数学模型,而数据科学的方法是让“数据说话”。研究不再通过理论预设来解决问题,而是要发现数据背后的自己不知道的问题,“数里淘金”或许成为研究者的必备能力。(4)数据的呈现,科研人员需要将结构或非结构化的数据从浩如烟海的复杂数据中理出头绪,先将数据降维,化繁为简,再聚合关联,通过不同的维度呈现数据背后隐藏的价值,这给科研工作带来巨大的挑战。

3.2 出版学研究方法的演变

出版学同其他学科一样,研究方法也经历了实验、理论、计算仿真和数据科学方法的变迁和演化。目前各个研究方法相互关联,互为支撑,共同构建了出版学学科的研究方法。实验方法以归纳为主,带有一定主观性,主要依靠的是研究人员的观察和实践积累;理论方法以推理演绎为主,通过总结和概括提炼出具有较高的适用性的理论;计算仿真方法是建立数据模型,利用计算机分析来解决科学问题;数据科学方法是通过研究密集型的数据,依靠数据管理和分析方法进行科学研究。

在出版学科早期探索中,科研人员通过剔除“无关”信息,获得理想化的条件后,在个人经验积累前提下观察总结出版学的基本规律。例如王振铎先生提出的“编辑学三原理”,即“文化缔构原理、符号建模原理、讯息传播原理”[17]。不少学者表示肯定,并对其深化和拓展,但也有不少学者对其质疑、论争。李经女士认为“文化缔构原理”是编辑活动的理想状态,在人类历史上和现实生活中,情况往往并不是那样,因此把编辑活动看做人类社会精神产品生产流程中的一个“中间环节”更为恰当[18]。学者的视角不同,使他们在对待相同的问题时有不同的见解。这是因为在早期的出版学科研究中,研究者对实践经验的观察带有强烈的个人体验,他们从经验事实中抽象出了新的概念和思想,带来鲜明的人文色彩甚至是“天才”的视角。

如果说实验研究方法为出版学的研究打下了坚实的事实基础的话,那么理论研究方法则成为现代出版学的逻辑推理基础,通过理论概括和逻辑推演,总结归纳出版学的一些原理或者特征。如出版传播中的结构模式,在总结了拉斯韦尔的五W模式和香农—韦弗模式后,李新祥认为,传统的直线模式缺少反馈途径,没有揭示传播者与接收者传播的双向性和互动性,结合系统科学理论,并提出“出版传播过程的系统结构模式”[19]。由于传统的经典理论,其严谨性使得使用的适用范围有限且存在一定的问题,如果照搬挪用到出版学中,这势必会产生“东施效颦”的效果,因此根据出版自身特点,在前人理论的基础上通过逻辑推理,总结出版学科的理论是学科发展必然之路。endprint

随着出版研究的深入,研究对象越来越复雜,传统的研究方法难以处理这些动态的、真实的现象,于是建立数学模型来模拟出版的一些复杂问题,并通过计算发现相关的规律,如出版产业中的一些经济问题。李智慧和刘薇根据中国图书市场1994—2004年的相关数据,运用多元回归的算法,提出中国图书市场宏观经济模型:

其中Y表示人均购书量、X1 表示平均印张价格、X2表示品种、X3表示进口数、X4人均购书额表示支付能力、X5人均收视时间和 X6人均上网时间表示替代品、X7成人识字率表示教育程度、X8人均 GDP表示经济增长、c(9)表示其他变量[20]。其模型只是通过10年的数据得出,是否科学合理尚需更多的数据进行验证,但通过数学模型,可以将出版市场的供求矛盾表现得非常透彻。计算仿真方法是用数学模型通过分析、比较、计算等方法对客观事物关系的反映,它能将复杂的问题本质化、简明化。出版是人类一项复杂的涉及人文和经济的活动,如果通过数学模型来仿真出版的系列流程,其对出版的研究将能提供精确的指导。

随着物联网、云计算、AI技术的发展,出版领域的数据采集、传输、存储、分析和显示等环节都发生了重大变化,出版的所有内容都可以映射为数据。数据是内容的反映,通过研究数据的集合,可以发现内容背后的秘密,如读者行为模式的挖掘等。当当网在第10届网络书香节上,通过不同的维度分析了读者10年的阅读变迁。数据显示,男女图书消费比例在2006年基本持平,但到2015年,女性的图书消费量已经是男性的1.5倍。数据进一步显示,女性购买大量的童书和教辅资料[21]。针对读者购书行为数据的变化,图书市场产业链的作者、出版社、销售商等就可以有针对性地进行内容调整,以适应读者的需求。通过数据科学方法将用户的各种数据进行整理,建立多维的用户信息,把每位看不见的用户当“人”看,分析、归纳总结出他们的阅读时间、地点、爱好等,最终勾勒出用户的“可视化”信息图,精准洞察用户痛点,赢得用户长期认可。

随着数据时代的到来,研究方法的综合应用越来越明显。科学的探索必须从实践问题入手,提出假设,然后收集处理各种数据并进行数据挖掘,得出结论后再进行理论推演并解决问题。各种研究方法的综合应用将突破原有研究模式,对科学研究将会产生重大影响。当各种对象都可以被量化进行数据化处理,包括行为、心理、偏好、情绪等,那么就可以建立模型、构造公式、发现规律,其结果必然经得起验证,从而保证研究成果的科学性。马克思曾强调,“一种科学,只有在成功地运用数学时,才算达到了真正完善的地步”[22]。研究对象的数据量化是科学化的前提保证,出版学必须要强调以数据科学作为科学研究的基本方法,以数据为驱动,基于学科的理论分析,研究问题,发现规律。

4 结束语

出版学的研究方法问题是出版学研究的最基本课题之一,它关系到学科的地位和发展前途,是研究者在进行科学研究中必须遵循的前提条件。数据时代的来临,科学研究的第四范式也日趋成熟,虽然出版的数据目前还未能在出版领域中凸显,但以数据为研究对象已初见端倪。出版学科也应该应势而谋,加强数据科学方法的研究以促进学科的发展。所以笔者建议如下。

4.1 确立数据科学研究方法思想

出版学科的建立和发展是一个由局部到整体、特殊到普通、已知到未知不断丰富和发展的过程,运用不同的研究方法可以将不同的观点、不同的知识、理论进行碰撞、融合、贯通,彼此相互补充和印证,更好地促进学科的发展。数据科学研究方法的应用是科学研究的必然趋势,出版学的研究学者应该积极顺应时代的要求,接纳新的研究方法,探索在新的研究视角下出版学科拓展的方向。建立数据时代下出版学科的研究方法,将实验科学、理论科学、计算仿真科学和数据科学的研究方法有机统一,相互促进,推动学科知识体系的发展。

4.2 规范数据科学研究方法流程

数据科学研究是以数据为驱动的科学探索,通过数据挖掘,从大量的密集型的数据中提取出有关联性的信息和知识,其强调的是“规模数据+关联关系”。因此在对数据进行分析时,就应该按照一定的标准流程进行,比如首先明确研究任务,熟悉研究领域;其次选择任务的数据源,并对数据进行清洗;再次对数据进行预处理,然后选择合理的算法,进行数据挖掘;最后,通过模型的创立,对挖掘的结果进行可视化分析,发现趋势或者规律。数据科学研究流程的规范性对于研究结果的科学性至关重要,倘若在研究过程中忽略数据清洗,就会出现数据错误或者冲突数据,从而导致研究结果的偏差或者完全错误。因此,为保障科学的研究成果,研究人员必须严格规范研究流程。

4.3 合理采用数据科学研究方法

研究方法是人们从大量的科研实践中逐步形成的,与一定的研究内容相适应。在具体研究方法的使用中,研究者既要对研究方法要素有充分的认知,也要对研究内容有所把握,以防止方法与内容的互斥。数据科学的研究方法也不是完美通用的研究方法,也存在一定的局限性,比如在研究结果上是内容相关性,而相关性仅是代表着过去,不一定能推而广之,只有掌握了事物之间的因果关系,才能举一反三,实现科学的预测。因此,在运用数据科学方法进行研究时,要将实验、理论以及计算仿真研究方法恰当地融合,在不同阶段选择使用不同的研究方法,以保证科学合理的研究成果。

注 释

[1][9]余敏.出版学[M].北京:中国书籍出版,2002:32-33,7-14

[2][13]张志强.现代出版学[M].苏州:苏州大学出版社,2003:16-17,16

[3]罗紫初.出版学原理[M].武汉:武汉大学出版社,1999:58-66

[4]师曾志.现代出版学[M].北京:北京大学出版社,2006:24-39

[5][11]刘永红.出版学研究方法的现状与完善[J].大学出版,2008(3):15-20

[6][8]彭建炎.出版学概论[M].长春:吉林大学出版社,1992:77,78

[7]清水英夫.现代出版学[M].北京:中国书籍出版社,1991:21-22

[10]李新祥.出版学核心[M].北京:中国书籍出版社,2010:195-199

[12]罗紫初.比较出版学[M].武汉:武汉大学出版社,2006:3

[14]周昌忠.创造心理学[M].北京:中国青年出版社,1983:6

[15]Tony Hey,StewartTansley等.第四范式:数据密集型科学发现[M].北京:科学出版社,2012:1

[16][美]托马斯·库恩.科学革命的结构(第四版)[M].北京:北京大学出版社,2012:112

[17]王振铎.《编辑学原理论》修订版自序[J].编辑之友,2005(1):38-39

[18]黄先蓉.出版学研究进展[M].武汉:武汉大学出版社,2006:46

[19]李新祥.出版传播学[M].杭州:浙江大学出版社,2007:206-207

[20]李智慧,刘薇.中国图书市场的宏观经济模型[J].出版参考,2005(12):17

[21]当当发布10年图书消费报告[J].当代图书馆,2016(2):69-70

[22][法]保尔·法拉格.回忆马克思[M].北京:人民出版社,1954:8

(收稿日期:2017-06-28)endprint

猜你喜欢

出版学研究方法科学研究
欢迎订阅《林业科学研究》
欢迎订阅《纺织科学研究》
纺织科学研究
纺织科学研究
关于“学案导学,分层互动”教学模式中学情的研究
谈谈翻译史的研究方法
社会主体研究方法在中国特色社会主义体系中的运用
天津游泳运动员思想政治现状调查与分析
出版学的学科分析