APP下载

健康知识付费产品描述的文本特征对购买量的影响*

2023-03-12张薇薇

图书馆论坛 2023年3期
关键词:购买量可读性语气

张薇薇,朱 玲

0 引言

我国居民健康意识逐步增强、重大慢性病过早死亡率逐年下降,但慢病防控工作仍面临巨大挑战[1]。随着网络用户健康素养的提高,各种专业健康信息服务平台,如好大夫在线、丁香医生等,逐渐成为医疗专业人员提供健康医疗服务、分享专业知识的有效工具,也是普通用户了解疾病、寻求治疗和提升健康水平的重要途径。为了应对持续知识贡献不足和分享质量下降的问题,在线知识付费产品应运而生,一方面有助于用户获取高质量知识,另一方面也激励和促进了专业知识贡献,提升了互联网知识交流的效果。随着知识付费产业规模逐渐扩大,用户更具有选择权,知识生产者吸引用户购买产品的难度逐渐加大[2]。因此,探索在线知识产品购买量影响因素的相关研究成为学术界和知识付费产业的热点话题。

随着人们对医疗服务质量要求的提升,越来越多的用户付费购买更有针对性和更详细的健康信息[3]。在线付费阅读起源于网络文学产业[4],互联网健康产业效仿健康知识付费阅读模式,以吸引更多高质量的科普文章。例如,好大夫在线开设有健康知识免费与付费阅读板块,为患者和普通用户提供图文、语音、视频等形式的科普知识,累计已达百余万篇。然而,这其中所含的付费知识产品比例非常低,绝大多数是可供用户免费阅读的文章,后者的知识含量和内容质量通常远不如前者。虽然偶尔会出现一些具有较高购买量的热点文章,但是总体而言,目前健康知识付费产品的购买量仍然普遍较低,影响和阻碍了专业人员创作高质量知识产品的积极性。

知识付费产品描述是指能够提示产品内容特征的有关文本,包括产品简介、内容描述、标题、引言、知识主题等。由于信息不完全、收益难以定义和量化,知识付费产品的潜在用户有必要通过产品描述等内容质量信号来衡量其价值[5]。知识付费产品描述在知识产品化以及说服用户购买的过程中扮演重要角色[6],具有传递商品信息并激起购买欲的重要作用[7],对于产品的不同描述会显著影响用户的支付意愿[8]。而健康知识产品描述作为医疗专业人员和普通用户之间沟通的第一道桥梁,具有提示健康知识内容、吸引用户购买的作用。因此,有必要深入挖掘健康知识付费产品描述的内容特征及其对用户知识付费行为的影响机理。现有文献主要从知识生产者、知识消费者等视角对产品购买量进行研究,忽视了知识产品内容,尤其是产品描述的文本特征对用户购买量的影响。

本文以国内最大的互联网医疗平台“好大夫在线”付费阅读知识产品为例,采用内容分析法对抽样采集的付费健康知识样本从产品描述的内容视角进行多维度特征提取、编码和测度,探索健康知识产品描述的文本特征及其对用户购买量的影响。本研究一方面有助于提高健康知识产品创作质量,另一方面也有助于理解普通用户对健康知识产品的选择与采纳过程,可为知识贡献者和健康医疗服务平台提高用户购买量提供参考。

1 文献综述

1.1 健康知识产品描述的文本特征研究

海量互联网健康信息正在争夺用户注意力,创建有吸引力的标题变得尤为重要[9]。公众阅读信息时会策略性地使用标题所表达的信息,以便在阅读文本之前就构建出其余文本的整体含义或重要主题[10]。标题在影响读者记忆和信息重用方面起到重要作用[11],能够为读者提供理解整个故事所需的知识,并保留在读者记忆中[12]。已有研究表明,标题特征会对用户的被吸引程度、注视时长等产生影响。例如,标题长度[13]、句式[14]、位置[15]会影响文本阅读量、点赞数;较大的字体[16]、高信誉来源[17]会增加用户对标题的注视时长。

而健康知识的文本可读性既是决定患者阅读和理解文本难易程度的指标,也是影响患者对健康信息利用能力的主要因素[18]。相关研究主要包含两个方面:一是文本信息可读性评估公式的研究[19-20];二是研究文本可读性概念、公式的应用和影响[21]。随着互联网健康产业的发展,用户的健康信息需求也受到关注。例如,对不同疾病[22]、不同人群[23]的健康信息使用情况进行研究,探索和挖掘用户感兴趣的主题类型,或者揭示用户关注度较高的健康知识主题[24]。

综上可知,网络健康知识产品描述的文本特征研究主要集中在标题、语气、文本可读性以及健康信息需求的主题挖掘等方面。相较于其他类型的产品,付费健康知识产品描述的相关研究还非常少,有关其文本特征提取、分类、编码和应用的研究更是缺乏。

1.2 知识付费产品购买量的影响因素研究

付费知识具有经济学意义上的产品价值属性,知识消费者对知识付费产品的购买量受多种因素影响。现有文献对于知识付费产品的研究主要集中在知识生产者的分享动机和知识消费者的付费动机两个方面[5],一些研究直接采用用户购买的知识产品数量来衡量知识付费行为[2]。而聚焦于用户知识付费行为方面的研究表明,影响因素来自用户自身、价格效用、内容质量、技术平台、外部社会环境等多个方面[2,25]。

在内容质量上,其是影响用户在线知识付费的关键[26],对知识内容的把控也是提升用户继续付费意愿的关键因素[27];用户付费态度受到感知质量和体验的直接影响,而付费态度会直接影响付费意愿[28]。在知识生产者上,知识生产者声誉会通过预期收益间接影响消费者的付费意愿[29],并在知识产品描述的语言风格与产品销量间具有显著的调节作用[6];“得到”付费课程的实证研究表明,对购买量影响最大的是教师知名度,而粉丝吸聚仍是知识产品变现的首要逻辑[30];而网络信息也能为用户购买决策提供支持[3]。在知识消费者上,价格对用户购买决策具有负向影响[3],但当产品评论数量足够多时,价格对销量的负向影响减弱[5];而也有研究发现感知成本对用户持续付费意愿的影响并不显著[31]。在知识付费产品特征上,其对用户购买量的影响不容忽视,加强内容设计是知识付费发展的重中之重[30];知识产品特征描述是知识产品化过程的关键环节,也是内容线索的重要组成,影响消费者购买决策[6]。在产品类型上,其对用户知识付费行为具有调节作用。知识产品有实用型和娱乐型之分,知识生产者声誉和经验对实用型知识产品购买量的影响较娱乐型知识产品弱[2],这意味着,虽然实用型知识产品的购买量会受到生产者声誉等情境因素的影响,但相比于知识内容本身,其影响较弱。付费医疗健康知识属于典型的实用型产品,因此普通用户更加关心知识产品的内容。

综上所述,知识付费产品购买量受到内容质量、产品特征、知识生产者、知识消费者、产品类型等多种因素的影响。以往研究较多集中于知识生产者和知识消费者因素,近期学者开始关注产品特征、产品类型,尤其是知识付费产品描述的内容特征与线索等对用户购买量的影响。就研究情境而言,现有文献多聚焦于知识问答社区,鲜见关于互联网医疗健康服务平台知识付费产品购买量的相关研究。

2 研究设计

2.1 研究方法

本研究旨在探索健康知识付费产品描述的文本内容特征对用户购买量的影响,因此如何抽取关键文本特征作为内容线索和影响因素,并进行量化分析至关重要。内容分析法是一种以研究大众传播的信息内容为主的社会科学研究方法[32],也是一种基于定性研究的量化分析方法,利用推理和比较对研究对象的内容特征进行分析[33]。本文的研究对象是产品描述信息的内容特征,既包括显性的信息内容,也包括潜在、隐含的信息内容。同时,健康知识产品描述的文本单元数据量较小(仅含标题和引言),结构化程度低,缺乏内容元数据[34]。经过系统比较,内容分析法既能够从定性分析的视角对健康知识付费产品描述的文本内容进行特征提取和编码分析,又能够对编码结果进行客观定量的统计分析,可以科学有效地探索本文提出的研究问题。

经过内容分析后,所提取的文本特征因素皆为分类变量,需要考察多个特征因素对用户购买量(因变量)的影响以及它们之间的交互作用。因而,在后续的统计分析中倾向于采用多因素方差分析法。以方差分析模型为代表的多因素分析方法效率高、适用范围广,适用条件有样本独立性、随机误差正态分布以及方差齐性[35]。本研究将采用内容分析法对健康知识产品描述信息的文本特征进行提取和编码,然后采用多因素方差分析法对编码结果进行统计分析。

2.2 数据采集与样本筛选

一般而言,内容分析法的研究过程可分为4个阶段:提出问题、抽取样本、选择分析单元、建立分析类目[36]。本研究选择“好大夫在线”作为样本数据源,原因包括两个方面。一是“好大夫在线”创立于2006年,拥有数量众多的专业医生群体以及庞大的用户群体;在我国互联网医疗平台中具有代表性,认知度和使用比例名列各大医疗网站之首[3]。然而鲜见关于“好大夫在线”付费健康知识产品描述方面的研究。二是“好大夫在线”开设有健康知识阅读板块,主要由三甲医院的职业医师为用户提供图文、语音、视频等形式的科普知识和诊疗经验,具有很高的权威性。其中,图文知识板块给予知识生产者创作产品描述(包括标题和引言)、选择付费阅读的功能,这为本文探索健康知识产品描述的文本特征及其对用户购买量的影响提供了丰富的内容素材和现实场景。

(1)数据采集。使用内容分析法进行资料分析时,如果难以对全部内容进行普查,就必须通过抽样选择最有利于分析、信息含量大、具有连续性、内容体例基本一致的样本进行研究[36]。经过观察和筛选,本文选择“健康知识”模块中知识贡献度和用户活跃度都较高的儿科、内科、外科、生殖科4个科室进行抽样调查。考虑到本研究主题围绕健康知识产品描述的文本特征,故排除了视频和语音两种类型,仅针对“图文”形式的付费知识进行调研。采用Python编写的网络爬虫软件,对以上4个科室“图文”类型的付费知识产品记录进行爬取,数据采集时间为2020年9月初,合计获取原始记录集3,516条,包含科室、医生姓名、医师职称、发布时间、标题、可供免费阅读的文章内容(以下简称“引言”)、付费金额、点赞数、购买量等字段信息。

(2)样本筛选。采集原始记录数据时除了设定科室限制,并没有其他约束条件。根据内容分析法的样本抽取原则[36],原始记录在分析之前须经过严格的数据清理和样本筛选,以控制文本特征以外其他外部因素的影响。首先,剔除广告发布、字段信息不全的记录;其次,为了控制图表等非文本因素的影响,移除所有包含图表的记录;然后,考虑到购买量的分布情况,从剩余数据中剔除购买量严重偏离均值和中位数的少数极端值记录。在多因素方差分析中,极端值的影响远大于方差齐性等问题的影响[35];具有很高购买量的知识产品往往受到医生声誉等外部因素的影响,保留这些数据容易使分析结果产生偏差。此外,由于本研究将重点探索那些能够吸引用户购买的健康知识产品文本特征,因此购买量很低甚至为0的记录也不符合本研究的要求。经过筛选最终得到1,594条记录,对后续将要开展的内容分析而言,该数据量已足够大。经初步统计分析,发布年份、医师职称、付费金额等控制因素对购买量没有显著影响。样本集合中有88.7%的科普文章发布时间在近4年(2017-2020),早期样本量较少。其中,2017年占16.5%,2018年占40.9%,2019年占25.4%,2020年占5.9%。

2.3文本特征编码、测量与假设

本研究综合采用样本数据解读式内容分析[37]、现有相关研究的推理分析[34],归纳与演绎、定性与定量相结合等方法,开展文本特征的提取、编码和测量工作。文献调研表明,网络健康知识产品描述的文本特征研究集中在标题、语气、文本可读性以及健康信息需求的主题挖掘等方面。同时,样本数据的定性分析显示,付费知识产品描述的文本信息主要由标题和引言构成。因此,本研究从标题、引言、主题3个文本特征维度选取“标题语气”“引言可读性”“引言呈现方式”“健康知识主题”为主要特征变量和影响因素。筛选依据有:一是基于对样本记录的定性分析,标题特征主要有语气、长度等,引言文本特征主要有可读性、表述或呈现方式,而标题和引言共同指示了样本记录的知识主题;二是基于对样本数据的定量分析,经过初步统计分析可知,标题长度对购买量没有显著影响,故没有纳入特征因素。

编码过程由两位研究人员同时进行,总共分为三轮。第一轮,随机抽取100条数据进行独立编码,让编码人员对编码类目有一个初步的了解,然后将编码结果进行一致性判断,将不一致部分交由第三人进行讨论,直至达成一致;第二轮、第三轮分别选择300、1,194条数据进行编码,重复以上操作,直至完成所有文本编码。

2.3.1 标题语气

标题语气分为陈述语气、疑问语气、感叹语气3种类型。陈述语气是对健康知识客观事实的说明,一般以句号结尾,不带有主观情绪;疑问语气是对所陈述事实的疑问,多以问号结尾;感叹语气所表达的感情色彩会比较强烈,多以感叹号结尾。不同标题语气可能会对健康知识购买量产生一定的影响。标题制作时善用修辞、妙用语气词,有助于吸引读者目光、满足读者的信息需求[38]。语气是文本叙述的情绪,会影响社会舆论和大众情绪。社交媒体发布信息的语气会影响公民的参与行为[39],媒体报道的语气对选民感知有实质性影响[40]。因此,本文提出以下假设:

H1:健康知识产品描述的标题语气对用户购买量有显著影响。

2.3.2 引言可读性

由于中英文语言差异,英语文献可读性测评工具汉化后应用于中文语料分析存在局限性。而国内汉语可读性计算公式多针对语言教学文本开发,不能直接用于健康文本的评估[41]。有学者设计了针对特定主题的健康文本可读性测评工具,但是公式过于复杂,实用价值不高。某些研究采用平均词语数目来测量医生回复文本的可读性[42],虽然简单易用,却不能反映健康文本的特殊性。为此,本文采用秦琴等[20]改编过的中文健康信息可读性计算公式测量引言可读性。该公式既体现了普通文本可读性特征(如平均句长),又反映了健康医学文本的特殊性(包含医学专业术语占比),内容如下:

R表示健康知识的可读性值,X1表示总字数,X2表示平均句长(即总字数/总句数),X3表示医学专业术语占比。通过Excel分别统计每条数据的总字数X1、总句数,并计算平均句长X2;对于医学专业术语占比X3的计算,仍然借鉴文献[20]的做法。首先,对每条引言文本进行分词处理,并统计语词总数;其次,依据LetPub专业科学术语在线词典提供的医学术语,将分词结果与医学术语词典进行比对,统计出每条引言文本中医学专业术语的数量;最后,计算医学专业术语在各引言文本语词总数中的比例,即得到X3。根据以上数据分析结果,得出引言可读性值的分布情况,结合文献[20]中对食品安全健康教育材料可读性的分布情况,将处于(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],(6,7],(7,12]文本可读性水平的R值分别编码为1、2、3、4、5、6、7、8。

已有研究表明,从视觉角度提高文本可读性能减轻用户认知负荷,促进健康信息利用效率,优化用户健康信息搜寻体验[43]。文献[7]研究发现,电影简介的文本可读性对首周票房影响较大。而基于“好大夫在线”患者数据的实证检验显示,医生回复文本的可读性对定向就诊意向有正向影响[42]。因此,本文提出关于引言文本可读性与用户购买量的假设:

H2:健康知识产品描述的引言可读性对用户购买量有显著影响。

2.3.3 引言呈现方式

经过三轮编码和讨论,最终确定引言呈现方式的5种基本类型:统计数据、概念引入、问题解答、病例引入、总体概括(具体含义如表1所示)。此外,经过对样本数据的分析,发现很多引言文本是复合型的,即同时包含2种或2种以上的类型,编码示例如表2所示。付费阅读情境下,用户在购买之前无法浏览知识内容的全貌,只能通过产品描述(主要是标题和引言)进行选择和判断,因此引言呈现方式与表述技巧显得尤为重要。已有研究表明,对于知识产品的不同描述会显著影响用户的支付意愿。例如,产品描述的详尽性、相关性[2],描述语言中的可信度、独断性、论证清晰性等[6],皆对知识产品购买量有显著正向影响。综合以上分析,提出如下假设:

表1 单一型引言呈现方式的类型与示例

表2 复合型引言呈现方式的编码示例

H3:健康知识产品描述的引言呈现方式对用户购买量有显著影响。

2.3.4 健康知识主题

本研究借鉴金碧漪等[24]对健康知识需求类别的划分,结合样本数据的内容分析,将健康知识主题划分为基础病理知识、疾病治疗、疾病预防、疾病管理、诊断与检查等5类(具体编码如表3所示)。用户对不同主题的健康信息需求有差异,国内外各需求类目占比差异巨大,预防信息需求将持续上升。因此,提出如下假设:

表3 健康知识的主题类别

H4:健康知识产品描述的主题对用户购买量有显著影响。

3 研究结果与分析

3.1 描述性统计

筛选之后样本数据的文本特征编码及其统计结果如表4所示,超过一半付费知识标题使用陈述语气(56.52%);就引言文本的可读性分布而言,绝大多数(82.62%)处于(1,5],其中(3,4]区间的样本数超过四分之一;就引言呈现方式而言,“概念引入”“问题解答”“病例引入”“总体概括”比例较高,复合型相对较少;就健康知识主题而言,基础病理知识与疾病治疗的分享最多,疾病预防知识的分享最少。

表4 健康知识产品描述的文本特征编码与统计结果

3.2 健康知识付费产品描述的文本特征对用户购买量的影响

依据上文的内容分析结果,统计分析各文本特征对用户购买量的影响。以标题语气、引言可读性、引言呈现方式、健康知识主题作为反映健康知识贡献特征的关键因素和自变量,以付费知识购买量作为因变量,采用多因素方差分析法检验各因素的主效应和交互效应(结果如表5所示)。其中,方差齐性(F=1.105,p=0.100)通过检验。由表5可知,引言可读性(F=3.299,p<0.01)、引言呈现方式(F=8.914,p<0.001),以及健康知识主题和引言呈现方式的交互作用(F=1.485,p<0.05)对健康知识购买量均有显著影响。

3.2.1 标题语气对用户购买量的影响

观察表4可知,标题绝大多数采用陈述语气和疑问语气,较少使用感叹语气。而由表5可知,标题语气(BY;F=0.299,p=0.741)对健康知识购买量的影响不显著,即医生在分享健康知识时无论采用哪种语气的标题都对其购买量无显著影响。此外,标题语气与健康知识主题的交互作用不显著,这与纪雪梅等[44]的研究结果不同。原因可能是,后者研究的公众评论带有强烈的情感特征,易受标题语气、态度等情感因素影响;而本文研究的付费知识购买更多是基于理性判断,不易受标题语气等感性因素影响。

3.2.2 引言可读性对用户购买量的影响

由表5可知,引言可读性(YR)对在线健康知识购买量具有显著影响(F=3.299,p=0.002)。根据表4统计结果,有82.62%健康知识的引言可读性处于(1,5]区间,而有48.18%的引言可读性处于(2,4]区间内。通过购买量均值差异的比较可知,购买量随引言可读性变化呈现“M型”趋势,如图1所示。引言可读性处于YR4(3,4]区间的样本购买量均值最高,达到第一个峰值。组间比较结果显示,YR4组购买量均值显著大于峰值左右的YR1(p=0.001)、YR2(p=0.000)、YR3(p=0.025)、YR5(p=0.001)。由此可知,引言可读性低于YR4时,样本购买量随着可读性区间增加呈现明显的递增趋势;高于YR4时,购买量显著递减。其中,可读性区间处于YR1(0,1]和YR2(1,2]时样本的购买量差异不显著(p=0.468)。可读性值超过YR5区间,购买量又呈现递增趋势,直至达到第二个峰值。此后,购买量再次递减,尤其是可读性达到YR8(>7)时,购买量显著低于YR3(p=0.032)、YR4(p=0.002)和YR6(p=0.049)。

图1 不同可读性区间的购买量均值比较

表5 健康知识产品描述的文本特征与购买量的多因素方差分析(部分)

3.2.3 引言呈现方式对用户购买量的影响

由表5可知引言呈现方式对用户购买量影响非常显著(F=8.914,p<0.001)。进一步对不同引言呈现方式进行多重比较,结果如表6所示(仅列出具有显著性的结果)。同时,绘制相应的比较图以更直观地显示不同引言呈现方式的购买量差异(见图2),其中购买量均值见右刻度线,而第一四分位、第三四分位数见左刻度线。通过图2可知:总体而言,复合型引言比单一型引言更能吸引用户购买。

就单一型引言来说(见表6及图2),“病例引入”(YC4)类引言的购买量要显著高于其他类型的引言,并且其与“总体概括”类引言的购买量均值差异最大。此外,“统计数据”“概念引入”“问题解答”三类引言的购买量无显著差异。

图2 不同引言呈现方式的购买量比较(部分)

表6 引言呈现方式之间的多重比较

而对于复合型引言,采用“病例引入+概念引入”(YC4YC2)与“病例引入+总体概括”(YC4YC5)引言的健康知识购买量均要显著高于其他复合引言。此外,“概念引入+问题解答”(YC2YC3)引言的健康知识购买量要大于“概念引入+总体概括”(YC2YC5)引言。概言之,健康知识付费用户对于以“病例引入”开头的复合引言的接受度更高,也更愿意购买此类健康知识。

3.2.4 健康知识主题对用户购买量的影响

由表4可知,健康知识付费产品的主题类型,以疾病治疗(40.53%)、基础病理知识(25.47%)和疾病管理(15.93%)为主,疾病预防(5.46%)涉及较少。进一步探究健康知识主题类型对用户付费行为影响的主效应和交互效应(见表5),发现不同主题类型对健康知识产品购买量影响的主效应虽然不显著(F=0.642,p=0.633),但和引言呈现方式的交互效应非常显著(F=1.485,p=0.033),而其与标题语气的交互效应不显著,具体原因如上文所述。

比较相同主题下不同引言呈现方式的均值(M)可知,当主题类型为“S1基础病理知识”,采用“总体概括+问题解答(YC5YC3)”(M=64.755)的引言呈现方式,则平均购买量最高,其次是“病例引入+概念引入(YC4YC2)”(M=61.277);对“S2疾病治疗”类的知识表述,“病例引入+概念引入(YC4YC2)”(M=67.537)、“病例引入+总体概括(YC4YC5)”(M=62.918)的引言呈现方式会取得较大的平均购买量;当主题类型为“S3疾病预防”时,采用“病例引入+概念引入(YC4YC2)”(M=88.209)的引言呈现方式最佳,其次是“概念引入+问题解答(YC2YC3)”(M=68.863);对“S4疾病管理”知识产品的表述,采用“病例引入+总体概括(YC4YC5)”(M=81.941)或“总体概括+问题解答(YC5YC3)”(M=78.215)的引言呈现方式较好;当知识为“S5诊断与检查”方面的内容,“概念引入+问题解答(YC2YC3)”(M=95.167)类引言触发的购买量最高。

考虑到样本数量和结果的稳健性,本文特别比较了样本数较多的单一型引言(“统计数据”除外)在不同主题类型下的平均购买量。图3的结果显示:除了“疾病预防”,采用“病例引入(YC4)”引言呈现方式的样本在各个主题上的购买量都较高,尤其是在“基础病理知识”“疾病管理”“诊断与检查”方面;采用“总体概括(YC5)”的样本在任何主题上的平均购买量都最低,尤其是在“疾病预防”“诊断与检查”方面;采用“概念引入(YC2)”“问题解答(YC3)”引言呈现方式的样本,其购买量在“基础病理知识”“疾病治疗”“疾病管理”方面都很相近;但在“疾病预防”“诊断与检查”方面,后者的购买量较高。

图3 不同主题下单一引言呈现方式的平均购买量比较

3.3 结果分析与讨论

(1)标题语气对健康知识购买量的影响不显著,说明用户对健康知识标题的语气不敏感。而在线付费课程的相关研究表明,陈述语气更易引发用户的购买兴趣[30,45]。其原因主要有:首先,在线付费课程多为视频类、音频类知识产品,这与本研究的文本类知识有所区别;其次,在线付费课程多为商业类、职场类,课程主题对用户购买量影响显著[30],而本文研究结果显示,健康知识主题对用户购买量的主效应并不显著。因此推测,用户对文本类健康知识的付费行为相对理性、客观,不易受标题语气和主题类型的直接影响。

(2)引言可读性与用户购买量之间呈现“M型”关系,可读性值在(3,4]区间达到第一个峰值(M=58.223),在(6,7]区间达到第二个峰值(M=54.832)。观察中文健康信息可读性计算公式可知,可读性值与总字数、平均句长、医学专业术语占比均呈正相关关系,即当总字数、平均句长不变时,医学专业术语占比越高,可读性值越高,文本易理解性水平越低,普通用户越难以理解,反之亦然。第一个峰值的样本量较大,显著性水平高,具有很好的统计可靠性。因此可以推断,付费健康知识的引言文本保持适度的可读性会有更高的购买量,可读性值过低会被认为缺乏专业性和科学性,而可读性值过高会导致普通用户阅读困难。对于第二个峰值,可以作以下推测:普通用户对于可读性值处于(6,7]区间的健康知识有一定难度,从而整体上样本量较少;但是对于某些长期形成、不易根治的疾病(如慢性病),患者或其家属在治疗过程中积累了一定的知识储备,对专业术语比例较高的知识文本仍有较好的理解力,在知识付费中也更加注重知识的专业性和科学性,从而形成了第二个购买量峰值。

(3)用户对引言呈现方式有明显偏好。在单一型引言呈现方式中,“病例引入”类最能吸引用户做出购买决策,而“总体概括”类的购买量显著低于其他类型。由此可见,用具体病例引入的呈现方式更能激发用户对健康知识的深度关注和付费意愿。相关研究也发现,故事型信息对接受者情感反应的影响更显著[46],可以增强信息的趣味性和情感价值,吸引用户的注意并做出选择[47]。“总体概括”类引言的购买量最低,可以推测用户在健康知识付费决策中比较关注知识的含金量,而相对概括、抽象、知识含量低的“总体概括”类引言对用户吸引力较弱,相应的付费意愿也最低。类似地,“问题解答”“概念引入”两类引言的知识含量比“总体概括”高,因而购买量显著高于“总体概括”类引言。从图2可知,单独使用“总体概括”引言呈现方式时,购买量很低;若与其他呈现方式搭配,则能大幅提升用户购买意愿。例如,“病例引入+总体概括”“概念引入+总体概括”“总体概括+问题解答”的购买量均显著高于“总体概括”。由此可见,贡献者在编制付费健康知识的引言时,不能仅仅展示内容框架,还要给出其他有价值的信息,如病例、概念、解答,方可吸引用户购买。

(4)健康知识主题分布不均衡,且与引言呈现方式的交互效应显著。“疾病治疗”与“基础病理知识”类的样本数比例最高,“疾病预防”类的比例最低。不同主题之间样本量差异较大,可能与知识生产者多为有临床经验的医疗职业人员有关,他们在基础病理、疾病治疗方面积累了丰富的经验知识和大量的病例报告。随着人们对亚健康问题关注的增强,同时伴随着公众健康素养的提高,会有更多用户对“疾病预防”“疾病管理”方面的知识付费产品感兴趣,因此健康服务平台应当采取激励措施提高这方面的知识贡献量。如前文所述,健康知识主题单独对购买量无显著影响,而与引言呈现方式结合时却有显著效应。贡献基础病理知识时,可采用“总体概括+问题解答”的引言呈现方式,以问答形式,对临床患者询问较多的问题进行列举和解答。对于疾病治疗知识,“病例引入+概念引入”与“病例引入+总体概括”的引言都是较好的呈现方式,先引入病例激发用户兴趣,再解释疾病名称或给出下文要阐释的问题纲要。对于疾病预防知识,如果采用单一引言,那么“问题解答”类表述方式更能吸引用户购买;如果采用复合引言,那么“病例引入+概念引入”的表达方式会取得更好的效果,即先介绍具体病例,再由病例引出疾病概念,进而阐释如何预防。对于疾病管理知识,“病例引入+总体概括”或“总体概括+问题解答”的引言皆可。对于诊断与检查方面的知识,可以根据具体情形选择使用“病例引入”“概念引入”“问题解答”,或者两两结合的方式,但需要避免单纯使用“总体概括”的方式。

4 结语

本文以“好大夫在线”知识付费阅读产品为例,深入研究健康知识付费产品描述的文本特征对用户购买量的影响和作用。首先,采用内容分析法对抽样采集与层层筛选的1,594条健康知识付费产品描述的样本数据进行文本特征的提取、编码与测量,并提出若干研究假设。其次,采用多因素方差分析法检验相关假设,并对数据结果进行分析和讨论。主要结论有:(1)健康知识产品描述的标题语气对用户购买量没有显著影响,即用户对健康知识标题的语气总体不敏感;(2)付费健康知识产品描述的引言保持适度的可读性会有更高的购买量,可读性值过低会被认为缺乏专业性和科学性,而可读性值过高会因专业性太强和可理解性低而导致用户购买量减少;(3)引言呈现方式对用户购买量有显著影响,通常复合型引言比单一型引言具有更高的购买量,单一型引言中引入病例叙事更能激发用户对健康知识的深度关注和付费意愿。此外,引言不能仅仅展示内容框架,还要给出病例、概念、解答等有价值的知识信息,才能吸引用户购买;(4)健康知识主题对购买量没有显著影响,但与引言呈现方式的交互效应显著。针对基础病理知识、疾病治疗、疾病预防、疾病管理等不同主题,可以采用不同的引言呈现方式,以提升用户付费意愿和购买量。

本研究有助于丰富和完善健康知识付费产品描述对用户购买量作用机理的相关研究,进而深化对在线健康信息用户知识付费行为的理解,同时为在线健康知识付费产品的创作者、管理者和服务方提高购买量、推动健康知识交流效果提供启示和建议。基于内容分析法的样本抽取原则,本文仅选取4个科室的数据,今后的研究可深入探讨诸如慢病管理等纵向主题领域付费知识的产品特征。此外,本调研围绕付费阅读产品描述的文本特征展开,而视频类、音频类健康知识也很受用户欢迎,后继研究可对不同媒介的健康知识付费产品的描述特征及其影响进行深入探究。

猜你喜欢

购买量可读性语气
明知故问,加强语气
可读性
新编《小老鼠上灯台》
知识付费产品特征对购买量的影响
新冠疫情期间,中国家禽购买量下降
语气不对
注意说话的语气
2018年全球黄金大卖
对增强吸引力可读性引导力的几点思考
浅谈对提高党报可读性的几点看法