APP下载

基于大数据技术的智慧红旗渠纪念馆建设问题研究

2022-05-31刘海刘明阳王晓钰刘世超苏云飞石悦王星祎

电脑知识与技术 2022年11期
关键词:数据采集大数据技术

刘海 刘明阳 王晓钰 刘世超 苏云飞 石悦 王星祎

摘要:信息技术的发展使得人们了解博物馆相关信息的途径已经发生了根本性的改变,同样也使得博物馆在智慧化建设过程中充满了无限可能。不同博物馆属性不同,特色也不相同,因此智慧化博物馆的建设要以博物馆自身为基础,以信息技术为支撑,以受群众欢迎为目的进行详细研究。而在以数据为基础的信息化时代,智慧博物馆的建设首先要考虑的便是数据的处理和规划问题,大数据技术以其强大的数据处理能力可以满足不同需求的数据分析。该文以红旗渠纪念馆运行中的售票数据、检票数据、游客游览调查数据、游客游览过程数据和游客网络评论数据为基础,以大数据技术中的数据采集和数据预处理为支撑,以受群众欢迎为目的对每一种数据来源都进行了详细的数据现状分析和数据处理策略分析,并对红旗渠智慧化建设提出了相应的建设意见。

关键词:大数据技术;红旗渠纪念馆;智慧博物馆;数据采集;数据预处理

中图分类号:TP311        文献标识码:A

文章编号:1009-3044(2022)11-0011-04

随着人类社会和科学技术的不断发展,博物馆从传统形式向数字博物馆转变,这是科技的重大进步,为广大民众的生产、生活提供了极大的便利[1]。而博物馆从数字化到智慧化的进一步提高也已成为目前的主流发展趋势,这是科技和人文发展的必然结果。红旗渠纪念馆是为纪念六十年代林县人民为了改变缺水旧面貌,发扬“自力更生、艰苦创业、团结协作、无私奉献”的精神,修造红旗渠这一伟大创举而建立的[2]。对红旗渠纪念馆进行智慧化建设研究对于扩大红旗渠的影响力,传播红旗渠精神具有十分重要的作用。

1 研究背景与意义

博物馆是征集、典藏、陈列和研究自然和人类文化遗产实物的场所,对馆藏物品分类管理,为公众提供知识、教育和欣赏的文化教育机构、建筑物、地点或者社会公共机构[3]。纪念馆是博物馆的一种特殊类型,它具有一般博物馆的基本性质,即“博物馆是科学研究机关、文化教育机关、物质文化与精神文化遗存或自然标本的主要收藏所,和基本任务——为科学研究服务,为广大人民服务”[4]。作为传统文化中最为精髓的一部分,博物馆在文化传播与文化养成方面具有十分重要的作用。然而通过笔者的调查发现,在受调查的117人中,有61人近一年没有去过博物馆(包括纪念馆) ,占比为53.51%。究其原因,笔者通过调查发现,在受调查的117人中,通过抖音、快手、微视等短视频平台了解博物馆相关信息的占42.11%,通过微博、朋友圈和QQ空间等共享数据平台了解博物馆相关信息的占35.09%。由此可见,随着信息化技术的发展,更多的人更愿意通过信息化时代的最新产物去了解和深入博物馆的相关信息。反过来,对于博物馆方而言,通过信息化时代的最新产物,博物馆方面也可以高效和准确地分析出游客的游览行为,继而改善场馆建设。因此,智慧化博物馆的建设要以博物馆自身为基础,以信息技术为支撑,以受群众欢迎为目的进行研究。

而在以数据为基础的信息化时代,智慧博物馆的建设首先要考虑的便是数据的处理和规划问题。对于红旗渠纪念馆而言,笔者通过调查发现,红旗渠纪念馆的主要数据来源包括自身产生的数据和相应的网络衍生数据。在数据特点上,具有数据格式多、数据相关性差和数据价值密度低等特点。因此,面对如此纷繁复杂的博物馆数据,如何做好数据的处理和规划就成为智慧化博物馆建设研究的关键问题。

2 研究思路

大数据技术拥有的强大的数据处理平台以及超高效率的数据处理技术实现了对大规模数据的实时统计、分析以及处理、预测[5]。就大数据数据分析工作而言,常用的大数据计算模式主要有批处理计算、查询分析计算、图计算、流计算、迭代计算、内存计算等[6]。不同的计算模式所分析的数据种类是不尽相同的,例如批处理计算模式主要分析的是大规模的数据,流计算模式主要分析的是实时的数据,并可以实时地得出有价值的结果,图计算主要分析的是大规模图结构数据。因此,尽管说红旗渠纪念馆的数据来源纷繁复杂,但是大数据众多的计算模式为其智慧化建设提供了最契合的解决方案。因此,针对红旗渠纪念馆运行过程中产生的数据采用大数据技术完全可以实现数据的处理与规划。

而从大数据数据分析全流程的角度来看,大数据技术主要包括数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化和隐私保护等几个层面的内容[7]。并且这几个层面是存在一个先后发展和相辅相成的关系,也就是说,只有提前完成了数据的采集和预处理工作才能进行数据的存储和分析工作,否则就相当于是无本之木、无水之源。也只有提前做好做完备数据的采集和预处理工作,才能为后续的大数据处理和可视化提供坚强的支撑。同时,数据的采集和预处理工作也要根据数据分析和可视化的反馈结果进行适当调整,以使得整个大数据系统更加完善和符合实际的需求。鉴于大数据数据分析全流程的复杂性,本文主要就智慧化红旗渠纪念馆的大数据数据采集和预处理工作展开研究。

3 研究概述

通过笔者对红旗渠风景区的調查发现,在受调查的114人中有76人没有去过红旗渠风景区,占比为66.67%,调查结果图如图1所示。在调查问卷中,笔者并没有指出红旗渠纪念馆为红旗渠风景区的组成部分,而是独立地设置了是否去过红旗渠纪念馆这个问题,调查结果显示在同样受调查的114人中,有84人没有去过红旗渠纪念馆,占比为73.68%,调查结果图如图2所示。也就说在去过红旗渠风景区的38人中,有8人次没有去过红旗渠纪念馆,占去过红旗渠风景区人数的比例为21.05%。

在进行调查结果分析之前,首先对红旗渠纪念馆做一个简单介绍,红旗渠纪念馆是隶属于红旗渠风景区的一部分,游客可以凭借所购红旗渠风景区门票实现对红旗渠纪念馆的免费游览,但是红旗渠纪念馆与红旗渠风景区的青年洞、创业洞和一线天等依水渠而建的景点(以下简称红旗渠) 并不在同一个地方,根据笔者的实地考察,两者之间的距离差不多有20公里,自驾的话需要30分钟左右。虽说两者不在同一个地方,距离较远,但是按照目前的道路规划来看,进入红旗渠风景区纪念馆是主要途径。那么究竟是什么原因导致去过红旗渠的游客没有再去红旗渠纪念馆参观呢?根据笔者自身经历和现场与游客交流,结合与红旗渠纪念馆相关工作人员的沟通,最后进行相关资料查询得出两点大致的结论:

(1) 依靠红旗渠建立的景点太多,而且部分景点知名度非常高,像青年洞景点,已经成为游客打卡拍照必去的圣地,所以很多游客会直奔红旗渠,而把红旗渠纪念馆放在备选项。红旗渠本身又是依山而建,道路崎岖,容易使人在游览完后,出现时间不够用、精力不足等情况,继而放弃对红旗渠纪念馆的参观。

(2) 红旗渠纪念馆本身与其他博物馆(包括纪念馆) 相比,没有明显地领先于其他博物馆的特色。其实这也是当代纪念馆存在的一些共性问题,纪念馆一般是为纪念某历史事件或者某历史人物而建立的能弘扬和传播相关精神的博物馆,相比较某些存在国宝级或者珍稀级文物的历史类博物馆,往往对游客的吸引力会有所折扣。

针对上述问题,笔者认为要想提高红旗渠纪念馆对游客的吸引力,增加红旗渠纪念馆的访问量和游客喜爱度,最根本的是要依靠现有数据,经过大数据分析技术,结合实际情况,从内部建设展开。下面本文将就红旗渠纪念馆现有的内部数据进行数据现状分析,并根据分析结果展开大数据数据处理策略研究,最后提出相关的实质性智慧化红旗渠纪念馆建设意见。

4 研究内容

4.1 售票数据

(1) 数据现况分析

经笔者实地调查和与红旗渠纪念馆相关工作人员进行沟通,无论是直接去红旗渠现场购票,还是通过网络购票,红旗渠纪念馆采用的都是实名制购票。通过实名制购票对于游客的购票日期、年龄、性别、出生地都会有一个详细的数据统计。但是由于网络购票平台较多,红旗渠纪念馆方目前并没有展开对于所有的购票数据整合。

(2) 数据处理策略

通过整合购票信息后各字段的大数据分析,红旗渠纪念馆可以在游客游览前根据分析结果确定购票时间段,不同地区不同年龄段人群的购票方式等数据。而实现这一技术不难,因为这些数据都是存储于红旗渠纪念馆相关售票系统数据库中的静态结构化数据,要完成这一工作,主要进行两方面的工作,一方面需要从不同的数据库中采集和汇总相关售票信息,另一方面需要对采集到的信息进行预处理,也就是按照实际需求,把不同数据库中的数据整合成统一包含购票日期、年龄、性别、出生地、购票方式等字段的分布式文件,以供后续的Spark或者Hadoop大数据批处理技术进行分析。

(3) 建议

首先,红旗渠纪念馆应该增设相应的大数据售票分析系统。其次,根据系统分析结果,红旗渠纪念馆方应进一步采取行动以发挥优势,弥补劣势,例如根据年龄段分析结果增加符合劣势年龄段的活动,根据售票日期集中段开展淡季打折活动。

4.2 检票数据

(1) 数据现况分析

无论是直接去红旗渠现场购票,还是通过网络购票,其在进入红旗渠、红旗渠纪念馆等景点时,都需要通过入口的闸机进行检票。检票方式多种多样,可以是身份证、紙质票上的二维码,也可以是网络购票的二维码,但是无论采取何种形式,其都是与个人身份信息一一对应的。目前无论是红旗渠还是红旗渠纪念馆都已经建立好了相应的检票系统,通过检票系统可以分析出一年中的旅游人数淡旺季、年龄段组成、地区组成、购票方式组成、性别组成等与个人实名信息相关的分析结果。同时根据游客进入各个景点的时间可以分析出每天旅游的高低峰时间以及参观各景点的人数。检票系统也可以反映出每天参观红旗渠和参观红旗渠纪念馆的人数是否一致,存在多少比例的差距等信息。但是根据笔者的实地调查,发现红旗渠纪念馆的检票系统功能有待进一步提高,首先检票系统目前的作用就是检票和对检票数据进行统计分析,功能较单一;其次,红旗渠纪念馆只有入口闸机,没有出口闸机,并不能真实地反映出纪念馆内游客的游览情况。

(2) 数据处理策略

如若把检票系统与售票数据结合起来,那么就可以进一步分析售票人数与检票人数的差异,可以统计出红旗渠风景区的退票率,根据退票人数各个字段的属性,红旗渠风景区各景点可以采取相应的改进措施以减少退票率。同时根据售票时间和检票时间可以进一步分析出游客从购票到游览的时间差,这对于红旗渠风景区各个景点提前,尤其是在旅游黄金期做好游客接待工作和提高游客满意度是非常重要的。而实现这一技术只需把售票系统和检票系统的数据进行统一整合,在数据处理同样采用对应的批处理大数据技术Hadoop或者Spark即可。

对于红旗渠纪念馆而言,如能在纪念馆出口处放置跟入口处一样的检票闸机,那么就能分析出各类具有不同属性的游客游览红旗渠纪念馆的总时长,例如可以分析出不同年龄段的人群在馆内参观的时长,时长其实可以从某种层面反映游客的喜爱度,这对于纪念馆做出相应的改进和调整以适应多年龄段人群的喜爱是非常重要的。同样放置出口闸机也可以对馆内游客数量进行实时控制,这对于红旗渠纪念馆实时控制在馆参观人数是非常重要的。而要实现这一技术并不难,关于数据采集只需要在原有检票系统中加一个出口闸机即可,关于数据的分析也同样采用批处理大数据技术Hadoop或者Spark即可。

(3) 建议

首先,红旗渠纪念馆需要把检票系统和售票系统进行一个有效的整合,在实际中完全可以把售票系统统一嵌合到检票系统中,并根据上述数据处理策略结果采取相应的改进措施;其次,红旗渠纪念馆需要在出口处设置一个跟入口处一样的闸机,把出口闸机数据和入口闸机数据进行一个系统的分析,并根据上述数据处理策略结果采取相应的改进措施。

4.3 游客游览调查数据

(1) 数据现况分析

经笔者实地调查,发现红旗渠纪念馆并没有在明显的位置针对游客游览过程中的问题进行问卷调查的设备或者纸质调查问卷。通过设置相应的问题,如能在游客游览过程中或者在游客游览结束后对游客游览情况进行调查,根据调查结果可以进一步优化场馆建设,改进馆品陈设,使红旗渠纪念馆更受大众欢迎和喜爱。

(2) 数据处理策略

在游客游览调查方面,笔者认为可以采取以下措施采集相关数据。首先是传统的纸质调查问卷,设置好关于纪念馆的游览调查问卷,问卷中问题不能太多,字体不能太小,一张纸单面足矣。打印好后,专人在出口或者某个区域负责进行问卷调查,最后再定期对问题进行计算机汇总。在数据处理方面,因在数据汇总过程中需人为操作,所以可以设置为规范化的结构化数据以供批处理大数据技术Hadoop或者Spark处理。虽然纸质调查的方式简单,但是存在浪费纸质资源、耗费人力等缺陷,而且并不是所有的游客都会参与问卷调查,因此数据收集具有局限性。

针对上述问题,可以把纸质调查问卷换成iPAD,或者大型电子调查问卷设备等措施。一方面避免了纸质资源的浪费,同时也减少了人工录入系统的成本,数据收集非常便利。关于电子设备的陈设位置,可以在出口处统一增设多台设备进行整体游览问卷调查,也可以在某一层或者某一个主题区域处进行部分游览问卷调查,两种方式各有优劣,前者调查整体,后者调查细节。笔者建议在出口处统一增设多台设备进行整体游览问卷调查。在数据处理方面,因电子问卷是提前在电子设备中设置好的,因此可以存储到专门的结构化数据库中,以供批处理大数据技术Hadoop或者Spark进行处理。

最后,也可以在电子购票网站设置相应的调查问卷,此种方式相比较前面两种方式节约了纸质和电子设备成本,游客可以随时随地填写调查问卷,因此数据收集极为便利。但是因游客离开红旗渠纪念馆后填写调查问卷的时间不定,随着时间推移,可能会存在一定误差。在数据处理方面,因电子问卷是提前在购票网站中设置好的,因此可以存储到专门的结构化数据库中,以供批处理大数据技术Hadoop或者Spark进行处理。

(3) 建议

建议红旗渠纪念馆在多个位置加大问卷调查的数据收集力度。首先,关于纸质调查问卷的数据收集,可以在游客休息区由专门的工作人员发放和收集,可以采取发放有关红旗渠的小礼品等鼓励性措施;其次,关于电子设备调查问卷的数据收集,可以在出口处统一增设多台设备进行整体游览问卷调查,可以采取参与调查问卷以免费领取关于红旗渠纪念馆的小礼品或者免费试玩小游戏等鼓励性措施。再次,关于电子购票网站调查问卷的数据收集,可以采取积分奖励或者抽奖获取关于红旗渠纪念馆的小礼品等鼓励性措施。对于收集到的数据要定期予以处理,并及时予以反馈。最后,红旗渠纪念馆要制作一些简单的但是能反映纪念馆特色的纪念品或者小游戏,一方面为了吸引游客做问卷调查,另一方面也间接宣传了红旗渠纪念馆。

4.4 游客游览过程数据

(1) 数据现状分析

目前国内外很多智慧博物馆都已经采用了游客游览跟踪系统,有的是采用人工智能中视频识别领域的技术,即通过在博物馆内安装多个智能摄像头。这些摄像头具备人脸识别和脸部情感识别的功能,通过这些技术可以判定某个人在某件展品前的参观时间以及对展品的喜爱程度;可以根据某个人在游览过程中的情感变化判断展厅展品的合理性;可以根据人脸识别技术判断某个区域的人流量,继而警告场馆管理方进行人流量控制;可以根据人脸识别和三维建模技术判断展厅设置的展览路线中哪条最受欢迎,继而优化展品陈设位置及展览路线。虽说此技术较为成熟,并可以做出全面的统计,但是目前人脸识别技术涉及侵犯个人隐私等行为,因此在使用上应在符合法律规定的告知当事人同意的条件下执行,并且整套系统成本也较高。还有的是通过在游览前征求用户同意的前提下,佩戴相应的不涉及个人隐私的设备执行,例如可以在游客参观前,在告知应尽信息的前提下,请游客自愿佩戴含有定位、时间统计、血压统计、心跳统计的手环进行参观。这样也可以获得游客的参观路线、详细展品参观时间、根据血压和心跳统计的情感数据,继而可以根据这些数据进一步调整展馆展品陈设位置及展览路线。但是这样统计出来的数据不代表全体,在分析结果上可能会存有一定的误差。

经笔者实地调查红旗渠纪念馆,发现并没有可以追溯游客游览过程的设备。在与红旗渠纪念馆工作人员的沟通中,笔者也发现除在一些重要的节日中红旗渠纪念馆会更改其大厅等几处的主题外,红旗渠纪念馆的大多数展品和展览路线多年来并没有发生太大变化。

(2) 数据处理策略

目前红旗渠纪念馆主题展厅建筑面积约6000平方米,布展面积达6300平方米,在展馆内有图片300張、实物1000件、展柜15组、雕塑9组、灯箱5组、投影2组、场景4组、沙盘2组、真实山体塑型1290平方米、触摸屏6组、电子签名1组、振动平台1组。作为红旗渠展馆内的最重要的数据,红旗渠纪念馆方已经对展品数据进行了详细的划分、整理和存储。如能采用智能摄像头,或者是智能佩戴设备对用户参观过程中的上述各类数据进行详细地收集,那么就能与纪念馆本身的展品数据结合起来进行统一的分析。由于博物馆的展品数据本身就是存储在静态结构化数据库中的数据,而通过智能摄像头和佩戴设备收集到的数据通过数据转换和清理也可以转化为结构化数据存储于数据库中,因此这两个数据库经过结合后可以供批处理大数据技术Hadoop或者Spark进行处理。

(3) 建议

建议红旗渠纪念馆增设相应的智能佩戴设备,例如含有定位、时间统计、血压统计、心跳统计的智能蓝牙讲解手环,手环配有耳机。在入口处设置专门的工作人员进行权益讲解,以供游客自由选择是否佩戴手环和耳机,并在出口处对设备予以收集。这里笔者并不建议设置带有人脸识别和情感分析的摄像头,一个是涉及用户个人隐私的法律问题,另一个是成本相对也较高。

4.5 游客网络评论数据

(1) 数据现状分析

随着信息技术的发展,目前自媒体平台变得异常火热,尤其是抖音、快手、微博等平台已经成了手机上的必备App,并且也成功带火了一批旅游景点,乃至于博物馆,例如河南博物院推出的拆盲盒在抖音等平台上的视频大火,不仅成功带动了博物院的经济收入,也成功让河南博物馆“火出圈”。因此,传统文化并不会因为新技术和新媒体的发展而落伍,相反传统如能与新技术和新媒体结合起来,那么传统文化就会焕发新生的活力。

网络信息千变万化,但是如能从千变万化的数据中获取到有益的信息,那么就能有效地促进博物馆的发展。目前较火的几个自媒体平台,不管是抖音等短视频平台,还是微博等信息交互平台,在这些平台中都有相应的评论、点赞和转发等体现热度的功能。如能对这些信息进行统一的采集、处理和分析,那么就能够得到对于博物馆建设和改进有益的意见。

据笔者了解,目前红旗渠纪念馆方并没有在这方面展开相应的工作,红旗渠风景区设置了相关的抖音等自媒体账号,但是红旗渠纪念馆并没有设置单独的抖音等自媒体账号。在红旗渠风景区的账号中关于红旗渠纪念馆的内容并不多,因此评论、点赞和转发等体现热度的数据并不多。

(2) 数据处理策略

如能对自媒体平台有关红旗渠纪念馆的评论、点赞和转发等体现热度的数据进行采集,继而进行处理和分析,就能实时了解纪念馆受欢迎的程度、展厅内展品的受欢迎程度。关于数据的收集,目前数据爬虫技术完全可以实现,可以通过网络爬虫技术获取不同自媒体平台有关红旗渠纪念馆的评论、点赞和转发数据,但是爬虫需要有一个前提,那就是在合乎法律规定的条件下进行。对于每天主题内容的点赞数和转发数比较容易处理和分析,但是对于主题内容的分析就不太好处理和分析了,因此从技术层面讲,首先需要对评论关键词进行大数据词频统计,然后结合评论本身的点赞数和评论内容再进一步深度地进行处理和分析。因点赞、评论和转发等数据时刻都在发生变化,并且大量的数据可能只会提供给场馆方微弱有用的信息,因此在数据处理上根据数据特征可以采取流处理技术Spark Streaming进行数据分析,其得到的分析结果也是较快的,纪念馆方可以根据这些分析结果进一步采取相应的改进措施。

(3) 建议

首先建议红旗渠纪念馆方应该在微博、抖音和快手等自媒体品台上设置自己独立的账号,定期更新与红旗渠纪念馆相关的内容,可以是视频、图片和文字等信息,一方面扩大了宣传红旗渠纪念馆的途径,另一方面也可为后续的数据收集提供基础。其次根据发布的主题内容采用大数据爬虫技术,对于评论、转发和点赞等数据进行收集和处理,根据大数据分析结果可以为场馆建设提供一些参考意见,同时也可以根据好评主题内容进一步扩大红旗渠纪念馆的知名度和影响力。

5 结束语

智慧化红旗渠纪念馆的建设要以博物馆自身的数据为基础,结合相关信息技术,以服务人民,受游客欢迎为目的进行研究。而在实际的博物馆运行过程中,数据存在数据来源复杂、数据格式多样化和数据价值密度低等特点。那么针对不同特点的数据,就需要根据数据自身的特征、数据自身的价值和数据潜在的价值进行详细的数据现状分析,并根据数据分析结果提出相应的大数据处理策略和智慧化博物馆建设意见。本文就红旗渠纪念馆售票数据、检票数据、游客游览调查数据、游客游览过程数据和游客网络评论数据进行了数据现状分析和数据处理策略分析,根据上述分析对红旗渠纪念馆的智慧化建设提出建设意见。

参考文献:

[1] 牡丹.關于智慧博物馆建设的若干思考[J].东方收藏,2021(15):68-69.

[2] 贾海丽.安阳红色旅游资源调查及其评价[J].才智,2014(33):342.

[3] 王文析.浅谈文物视频供给侧服务——河南博物院《中原藏珍》系列短片摄制推送的实践与思考[J].河南博物院院刊,2021(2):121-129.

[4] 杜丁华. 试论纪念馆的性质及特点[A]. 湖南省博物馆学会.博物馆学文集1[C].湖南省博物馆学会:湖南省博物馆学会,1982.

[5] 梁书娟.大数据时代人工智能在计算机网络技术中的应用[J].网络安全技术与应用,2021(9):74-76.

[6] 龙虎,彭志勇.大数据计算模式与平台架构研究[J].凯里学院学报,2019,37(3):73-76.

[7] 林子雨,赖永炫,陶继平.Spark编程基础(Scala版) [M].北京:人民邮电出版社,2018

收稿日期:2021-11-20

基金项目:安阳市科技计划(软科学) 项目(2022C02ZF023) ;2021年度安阳市社会科学规划项目(489) ;安阳师范学院2021年大学生创新创业训练项目(202110479164)

作者简介:刘海(1990—) ,男,河南林州人,助教,硕士,主要研究方向为大数据处理框架技术和无线传感器网络。

猜你喜欢

数据采集大数据技术
大数据技术在电子商务中的应用
大数据技术对新闻业务的影响研究
CS5463在植栽用电子镇流器老化监控系统中的应用
大数据时代高校数据管理的思考
大数据技术在电气工程中的应用探讨
大数据技术在商业银行中的应用分析
基于开源系统的综合业务数据采集系统的开发研究