APP下载

基于网络文本分析的适老化阳台绿化植物选择研究

2021-09-07何雨忆许秀环颜玉娟陈华超

湖北林业科技 2021年4期
关键词:高频词词频长尾

何雨忆 许秀环 刘 星 颜玉娟 陈华超

(1中南林业科技大学风景园林学院 长沙 410004;2湖北省林业科学研究院 武汉 430075)

近年来,有学者从阳台绿化的意义,阳台的环境因子分析,植物选择原则和种植形式以及养护管理等方面进行研究,阳台植物选择时应考虑阳台环境、生态因子、观赏效果和功效。随着人口老龄化加剧,在养老问题的探讨下,居家养老因其更加人性化和更加容易被接受而受到广泛关注,居家养老被称为“没有围墙的养老院”[1]。阳台植物在居家养老中能发挥园艺疗法的作用,一是为老年人提供感官刺激,包括视觉、味觉、听觉、触觉、嗅觉,增强其的认知能力;二是可以调节情绪,激发老年人的创造性,带来满足感和成就感[2]。学者们将植物的园艺疗法与养老问题相结合,探究实施方案、配置原则和植物选择,而园艺疗法与养老社区设计以及适老化植物景观配置的研究较少,适老化阳台植物的选择还有待探讨。

随着互联网的快速发展,大数据时代到来,网络文本内容分析逐渐兴起,广泛应用于旅游研究领域,利用网络共享的网站、社交媒体、贴吧、在线评论等话语可以研究游客的旅游目的地意向感知、认知、情感表达等[3]。有学者开始利用网络话语进行风景地意向评价[4]、女性对历史景观感知研究[5]、公园正负面评价[6]、绿地使用空间分布研究[7]等。相较于问卷调查、实地走访等传统获得数据的方法,网络大数据具有6V特征,即大量性、多样性、变化性、价值性和真实性。

本文以长时间待在家里的老年人为对象,利用网络文本分析的方法进行适老化阳台植物的选择研究。选取国内花百科、踏花行和藏花阁三大养花交流论坛,利用Python、ROST-CM、Gooseeker等相关技术软件爬取,并处理评论数据,在文本分词后进行词频分析、情感分析,分析老年人对植物的认知评价,筛选出适老化阳台植物种类并总结选择原则。

2 研究方法与技术

2.1 数据获取

2.1.1 样本选取

在数据获取渠道方面,对购物网站、社交媒体、论坛贴吧等关于阳台养花评价进行筛选,选定三个以纯分享养花感受为主的论坛即花百科、踏花行和藏花阁。藏花阁和踏花行是国内最早的家庭园艺论坛,开通时间早,访问量大,数据量多,日更新频率高,注册群体以即将步入居家养老的中老年人为主;花百科主打植物科普和养花分享,科学性强,评论质量高。三个网站均设有家庭园艺中心、阳台园艺、养花日记等与阳台植物相关的模块。

2.1.2 数据爬取与数据清洗

用Scrapy爬虫框架爬取网页中用户发表的账号、标题、浏览次数、发布时间和评论内容。在数据结构化后将内容导入Excel,进行数据清洗,去除重复和空白内容,删除广告文本和基本信息大量缺失的文本,删除过短或纯符号等无意义内容,最终得到136 293条评论数据。

2.1.3 文本分词

用ROST-CM 6.0软件对评论内容进行中文分词,参考《园林树木学》、《园林花卉学》、花百科和各大网站,在自定义词表中补充了2 000种植物学名,包含评论中出现的所有阳台植物学名以及部分品种名称;分词后过滤英文、数字、单字和网址等无意义词汇,得到名词、形容词、动词、副词和代词等53 056个词汇。

2.2 数据分析

2.2.1 词频分析

本文利用Goooseeker软件对分词后的文本进行词频分析,以词云图的形式将植物种类高频词可视化处理,凸显核心词汇,并用Excel对六类高频词选择指数函数和幂函数模型进行拟合,分析长尾结构[4]。

2.2.2 情感分析

本文利用Goooseeker软件对高频词中前五十的阳台植物进行情感分析,首先采用三大主流的情感词典:知网Hownet、台湾大学NTUSD和清华大学李军中文褒贬义词典,整理出基础情感词典,否定词典和程度副词词典,采用人工校对中性评价,正面和负面评价的方法,添加与阳台植物种植养护相关的正负面词语,最终得出自定义词典36 502个词汇。

3 结果分析

3.1 老年人对阳台植物的认知与感知

通过词频分析,对高频词进行分类和归纳,发现关于阳台植物评价的高频词可以分为五大类型,说明老年人对阳台植物的认知和感知集中在植物状态、感知评价、园艺管理、情感表达和时间环境等五个维度(表1)。

表1 五种类型高频词词表

筛选出每个类型中词汇频次排序前50的词汇,为进一步分析阳台绿化植物评价内容中关注的焦点,探究影响阳台植物选择的关键因素,分别将植物状态、感知评价、园艺管理、情感表达、环境因素排序为自变量,词频为因变量,进行曲线拟合,发现高频词符合幂函数(如图1~4),模拟方程判定系数R2值分别为0.966 4、0.914 9、0.958 2、0.885 3及0.985 8,表明拟合优度很高,符合长尾理论,词频呈明显的“长尾”分布特征,即少数词汇代表大部分人的意向与评价。其中拟合曲线头部的词汇反应共同倾向和关注重点,长尾词则是代表少数意向。

3.3.1 植物状态类高频词

如表1所示,植物状态包括“开花”“枯亡”“发芽”“生长”“结果”等,高频词几乎涉及到植物生长发育中所有的状态,反应出老年人在种植阳台植物的过程中会持续观察植物的状态,感受植物的生命的历程。词频满足如图1所示的长尾结构,排序靠前的“开花”词频为7 255,“花苞“词频为6 681,“小苗”词频为4 099,而长尾词如“落叶”词频为195,“新枝”词频为140,“落花”词频为70,说明老年人对阳台植物的认知集中在植物开花的过程。

图1 植物状态词频长尾结构

3.1.2 感知评价类高频词

据表1分析发现,感知评价包括“花朵”“花色”“叶片”“株型”等,说明人们重视阳台绿化植物的观赏特征,“好看”“漂亮”“很美”等形容词反应出人们在种植和欣赏植物的过程中会感受到植物的美,获得自然的治愈力量。满足图2的长尾结构,头部词汇“花朵”词频为8 474,“花色”词频为7 180,“好看”词频为2 545,长尾词如“难看”词频为139,说明老年人尤其关注植物开花的特性并且在感知评价中趋于好评。

图2 感知评价词频长尾结构

3.1.3 园艺管理类高频词

词频分析表1显示,园艺管理包括“分享”“播种”“浇水”“修剪”“记录”“打顶”等,说明老年人会充分参与到植物的生长过程中,有意愿付出精力去照料植物,并学习园艺技术,也出现了“分享、记录、拍照”等,老年人把阳台植物当作生活的一部分,乐于分享养花的经历。如图3的长尾结构,头部词汇“分享”词频为4 330,“播种”词频为4 095,“浇水”词频为2 495,修剪词频“2 067”,而“嫁接”“打药”“移植”等较复杂的园艺活动词频均在200左右,说明在阳台植物种植时,老年人倾向于简单、易于操作的园艺活动。

图3 园艺管理词频长尾结构

3.1.4 情感表达类高频词

在情感表达中如图4和表1,“开心”词频为1 135、“惊喜”词频为1 112,为老年人种花过程中最主要的两种情绪;“收获”“幸福”和“成就感”词频在500左右,也是老年人常见情绪,“为难”“揪心”“不顺”等消极情绪的词汇出现在尾部,词频在20左右,说明阳台植物为老年人带来积极情绪为主,具有园艺疗法的效果。

图4 情感表达词频长尾结构

3.1.5 时间环境类高频词

如表1所示,时间环境包括“阳台”“春天”“太阳”“温度”“天气”“气温”“阴雨”等,说明人们关注阳台的环境特征,包括阳台朝向、光照、温度和天气,联系阳台环境选择阳台植物,观察植物状态,感受四季的变化,增强时间感和季节感。如图5的长尾结构,头部词汇“阳台”词频为7 489,“春天”词频为5 138,“太阳”词频为3 295,说明大部分老年人通过阳台绿化植物感受春天和阳光,观察植物的同时也会观察阳台的小环境。

图5 时间环境词频长尾结构

3.2 初选常见的阳台植物种类

经过文本分词和词频分析,共得到植物842种,包括部分植物商品名,共计词频43 207次,其中出现频次小于10的植物有441种,频次介于10到100的植物有303种,频次大于100的植物有92种,频次大于200的植物有50种。选取频次前300的阳台植物经过可视化处理,得到图6所示的词云图,图中字体大的表示词频高,在网络文本中出现频次高,字体小的表示词频低,在网络文本中出现频次少,在大量评论文本中出现频次高的阳台植物具有大众化、普遍化、接受度高、观赏性强、适应性强的特点,可以根据图6字体大小简单直观地筛选出如菊花Chrysanthemum×morifolium、洋桔梗Eustomagrandiflorum、矮牵牛Petunia×hybrida、长春花Caatharanthusroseus等常见阳台植物种类。

图6 常见阳台植物种类词云图

选择词云图中词频大于200的阳台植物,得到如表2所示的常见阳台绿化植物词频统计表,这些种类在网络文本中出现频率高,是老年人常种的植物,可以作为进一步适老化分析,表中菊花频次为1 899次,是本次网络文本分析中最常见阳台植物,洋桔梗词频为1 292次,矮牵牛词频为896次,词频较低的杜鹃Rhododendronsimsii为208次,朱顶红Hippeastrumrutilum为230次。

表2 常见阳台绿化植物词频统计表

3.3 筛选适老化阳台植物种类

针对词频分析中初选的50种阳台绿化植物进行情感分析,根据情感分析结果对50种植物排序,积极情绪占比越高,表明老年人对该植物在观赏特性、生态习性、环境适应性、园艺疗法这几个方面的总体评价越高。

如表3所示,频次高、常见的阳台植物并不完全对应高的积极情绪,如菊花、木茼蒿Argyranthemumfrutescens、君子兰Cliviaminiata和向日葵Helianthusannuus,消极情绪均占比25%以上。不同的植物由于生态习性、观赏特性、环境适应性等不同,会产生不同的生长状态、观赏体验和治愈保健效果,引起情绪和评价的不同。积极情绪大于65%的植物有5种,分别是矮牵牛、美女樱Glandularia×hybrida、洋桔梗、角堇Violacornuta和大花马齿苋Portulacagrandiflora;积极情绪介于60%~65%的植物有22种,积极情绪介于55%~60%的植物有17种,积极情绪小于55%的植物有6种。在这50种阳台绿化植物中,推荐选择积极情绪大于60%的27种阳台植物适合老年人居家种植。

表3 常见阳台绿化植物情感倾向统计表

4 讨论与结论

4.1 讨论

(1)本研究的创新之处是以网络文本为数据,进行适老化阳台植物选择研究,区别于传统的问卷调查法和实地调研法,用网络大数据进行文本内容分析,包括136 293条评论数据,能够打破数据来源的局限性,扩大研究人群和研究范围,保证评语的多样性、真实性和时效性,同时利用软件进行定量分析、可视化分析,得出更加准确、客观的结论。但网站数据缺乏用户信息,不确定评价对象的年龄阶段均符合步入居家养老的中老年人。

(2)本文通过词频初步筛选出50种常见的阳台植物,再用情感分析对常见阳台植物进行适老化评价,积极情绪越高,则表示植物在观赏特性、生态习性、环境适应性、园艺疗法这几个方面的总体评价越高,植物越适合居家养老的老年人,由此推荐27种适老化阳台植物。以情感倾向为评价方法能得出总体推荐结果,无法探讨具体影响因子,童丽丽等学者利用层次分析法选择城市生态绿化树种[8],能够得到影响因子及权重,结合各方面进行植物的综合推荐。

(3)本文采用Gooseeker软件进行文本内容分析,有别于刘逸等学者利用ROST-CM文本分析软件进行情感分析和词频分析[9],该软件操作更简易,错误率低,适合处理大量数据。

(4)本文从适老化的角度出发,网络文本分析得出选择阳台植物应考虑观花特性,养护管理难度。结合符小宁等学者从观赏价值大、适应性强等方面选择阳台植物[10]和李树华等学者提出植物通过五感促进身心健康[11],得出适老化阳台植物选择应考虑植物的观赏性、安全性、适应性和疗愈性。

4.2 结论

(1)老年人对阳台植物的评价集中于植物状态、感知评价、情感表达和时间环境五个方面。词频均满足长尾结构分布,少数词汇代表大部分人的意向,发现老年人在种植阳台植物过程中普遍关注阳台植物的开花特性,倾向于简单、易于操作的园艺活动,通过阳台感受春天和阳光,感到开心、惊喜为主,也会收获幸福感和成就感。

(2)适老化阳台植物选择时应考虑植物的观赏性、安全性、适应性和疗愈性。综合植物的观花特性,阳台的生态因子,老年人的心理安全和生理安全和植物五感治愈功效。

选择花期长,花多且大,花色艳丽,全株无毒无害,生长势强,病虫害少,抗逆性强,易于管理的植物。同时应选择释放芳香气味,质地细腻柔软,能食用且有保健功效,色彩多样,叶片能与环境共响的植物。

(3)根据研究结果推荐27种适老化阳台植物。一二年生草本植物有7种,包括矮牵牛、美女樱、洋桔梗、大花马齿苋、蓝雪花Ceratostigmaplumbaginoides、虞美人Pagaverrhoeas和长春花。宿根花卉有8种,分别是角堇、菊花、南非万寿菊Osteospermumecklonis、旱金莲Tropaeolummajus、石竹Dianthuschinensis、天竺葵Pelargoniumhortorum、勋章菊Gazaniarigens和矾根。球根花卉有4种,分别为百合Liliumbrowniivar.Viridulum、水仙Narcissustazettavar.chinensis、韭兰和风信子Hyacinthusorientalis。水生花卉1种,为睡莲Nymphaeatetragona。观花木本有6种,分别为玫瑰Rosarugosa、球兰Hoyacarnosa、绣球Hydrangeamacrophylla、茉莉Jasminumsambac、木茼蒿和小木槿。

猜你喜欢

高频词词频长尾
基于动态语义记忆网络的长尾图像描述生成
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
词频,一部隐秘的历史
汉语音节累积词频对同音字听觉词汇表征的激活作用*