APP下载

高校图书馆古籍大数据应用研究

2016-02-13张若雅

图书馆研究 2016年5期
关键词:古籍图书馆

张若雅

(苏州大学图书馆,江苏苏州215123)

高校图书馆古籍大数据应用研究

张若雅

(苏州大学图书馆,江苏苏州215123)

大数据时代来临,高校图书馆传统的古籍整理与服务模式已难以适应人文学科研究的需要,探索古籍的大数据应用势在必行。分析了古籍在信息提取、整理和应用方面与大数据的密切关系,探讨了当前高校图书馆古籍服务存在的困境,并从数据的获取与集成、存储与管理、加工与分析三个方面给出了实现古籍大数据的有效途径。在此基础上,提出四种古籍大数据的应用模式,以推动高校图书馆古籍大数据的尽快落地。

大数据;古籍;高校图书馆

2015年9月,国务院印发《促进大数据发展行动纲要》,系统部署大数据发展工作。2016年3月,《国民经济和社会发展第十三个五年规划纲要(草案)》出炉,重点提出要实施国家大数据战略。这意味着大数据已经正式上升到了国家战略的高度,得到了前所未有的重视。

大数据是一个包含不同类别的、体量巨大到无法在可承受的时间范围内用传统数据库工具进行收集、管理和处理的海量数据集合。具有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)[1]。大数据的意义不仅在于对数据量级的描述,还在于对数据进行专业化处理,挖掘其价值与规律,进而指导人们的决策,提升运营效率。不同于以往的小数据处理模式,大数据处理不是通过随机抽样的方法,而是将全部数据纳入分析范畴[1]。这样就避免了抽样数据的片面性和偶然性,实现了在全样本数据集中完整把握未知领域与事件关联性的目的,发现了过去无法预见甚至是匪夷所思的机遇和商机[2]。显然,大数据更关注的是“相关性”而不是“因果”,对于“为什么”不必过多探究,只需要通过事物之间的联系来准确预测未来的发展走向,这就是大数据的核心。因此,大数据彻底颠覆了过去人们的思维方式和认知理念,给各行各业都带来了深刻的影响和变革。

高校图书馆是一个为读者提供信息和资源的媒介,数据在这里本身就是敏感的。虽然单个图书馆的数据还达不到海量的标准,但大数据理论从全体数据中找关联并挖掘提取有价值信息的理念为图书馆的服务拓展提供了一条全新的思路。图书馆界已经在大数据应用上取得突破,然而,古籍的大数据应用却少人问津。大数据时代来临,高校图书馆的古籍整理和读者服务,仍按部就班地遵循着传统方式,与人文学科研究的拓新产生落差。探索高校图书馆的古籍大数据应用,既是新形势下图书馆职能转变和服务创新的要求,又是提高其核心竞争力的必由之路。

1 古籍与大数据

1.1 古籍信息中的大数据

数据是大数据处理链条的基础,古籍融入大数据时代的首要条件就是文本的数据化。长久以来,古籍的文本内容完全以纸本为载体,依靠人工的整理和保存传承。庞大的知识信息散落在一部部古书之中,给资源的获取和利用带来了巨大的障碍。20世纪90年代,现代信息技术飞速发展,我国开始尝试中文古籍的数字化工作,二十多年来取得了丰硕的成果,古籍收藏单位和数据加工企业合作研发了多项古籍数字产品,为古籍的检索和利用提供了极大的便利。如开发了《文渊阁四库全书》《四部丛刊》《中国基本古籍库》《国学宝典》等专业古籍数据库;完成了“高校古文献资源库”(CALIS三期)、“大学数字图书馆国际合作计划”(CADAL)等古籍信息资源的共建共享项目;搭建了各种古籍数字资源平台和书目检索系统;构建了各类地方特色数据库;涌现了一批各种格式的网络电子文献;实现了部分海外中华古籍的数字化回归。这些经过数字化的古籍文献,能够被计算机识别和存储,数量庞大,类型多样,已经从文本变为数据,并具有了一定的大数据特征。这为古籍的大数据应用奠定了基础。

1.2 古籍整理中的大数据

传统的古籍整理,一直是一个更偏重于实践的理论范畴。从选本、辨伪,到校勘、注释,无不需要深厚的文献学知识功底和长时间的材料积累。对于图书馆的古籍整理来说,重点是通过对古籍的分类、鉴定、编目、著录来帮助读者检索利用,同时还承担着古籍保护和修复的重任。在传统的古籍整理范式下,工作人员需要日复一日逐本翻阅古籍,进行书名、著者、版本、版式、源流演变等相关信息的记录和考证,制作出分类卡片和馆藏目录。这样费时耗力、原始低效的工作方法,已不能适应大数据时代的发展要求。计算机应用逐渐深入人文领域,使得古籍整理的路径和方法有了更多的选择。当今的计算机技术,已经可以实现对文本的自动校勘、自动切分和标点、自动注释和翻译,还可以借助计算机软件编制古籍书目索引和全文检索系统,并满足知识聚类的需求。由此,古籍整理的理念和内容发生了深刻的变革,古籍整理的程式大大简化,知识获取的规律有迹可循,工作人员可以将更多的时间和精力投入到数据的深入挖掘和理论探索中,古籍整理的范式也从内容整理进化到知识整理的范畴。在此过程中,古籍信息得到深度解析,古籍语义得到完整展现,对读者的个性化知识服务也成为了可能[3]。同时,引入大数据理论的古籍整理方式也大大降低了对纸本古籍的损耗,长久困扰图书馆的“藏”与“用”的矛盾得到彻底解决。

1.3 古籍应用中的大数据

在大数据和云计算出现之前,读者要想查阅某一方面的古籍资料,主要依靠图书馆的纸本馆藏。囿于个人知识结构的局限性,卷帙浩繁的古籍资源与研究者之间形成了严重的信息不对等。时空、地域等因素都可能使研究结果产生偏差,很难对某一领域形成整体的把握。因此,研究者往往缩小研究范围,截取某一时段、某一地区或某一类别作为研究对象,在相关的古籍中抽取部分数据作为论据,再进行理论阐释进而得出结论。这样的结论难免会带有主观性和局限性,不利于学科的整体发展。大数据的理念和技术,为古籍的充分利用提供了可能。研究者可以将古籍中的全部数据作为一个整体,从中很容易发现问题的实质和发展规律。过去从未发现的事物之间的相关性为研究打开了全新的视角,带来了更科学的研究方法和研究结论[4]。

2 大数据时代高校图书馆古籍服务之困境

2.1 现状

(1)服务方式陈旧。多数高校图书馆古籍部门仍沿用旧的服务模式。古籍馆员坐守书库,根据读者填写的索书单入库取书。虽程序严谨,但主动性欠缺。有的图书馆对于线装古籍及民国时期图书,不允许拍照复印,也不接待非毕业班本科生入馆借阅,这降低了古籍资料的使用效率,剥夺了读者的公平使用权利。有关古籍的参考咨询服务亦不成体系。馆员对于读者的需求把握不足,多是被动等待读者咨询,而没有主动服务的意识和途径,更不能深入科研团体内部为读者提供文献支持和课题指导。少数图书馆可以提供部分古籍的原文传递和在线阅览服务,但是并没有形成切实可行的使用规范,无法大规模推广。

(2)读者体验欠佳。古籍阅览室的读者多为研究型读者,他们对于古籍文献的需求有很强的专业性。获取文献不是最终目的,从文献中提取有价值的信息才是读者的期望。目前古籍服务人员日常更多承担的是书籍管理的任务,并不能很好地指导读者深入理解和使用文献,更做不到收集读者的大数据,根据读者的需求和喜好主动提供个性化的学科服务,因此并不能令读者感到满意。加之大数据时代来临,读者已经有更多的文献获取渠道,各种数据库和电子资源可以在很大程度上满足读者的需要,读者不必来馆查阅古籍。另外,图书馆提供的传统检索工具设置陈旧,实用性较差,不足以支持读者的各种模糊搜索请求。以上这些因素使得高校图书馆古籍用户流失严重,来阅览室的读者越来越少。长此以往,古籍服务人员终有一天会失去存在的必要。

(3)馆际交流不够。大数据时代具有数据共享的特点,而绝大多数高校图书馆古籍资源都只对本校师生开放,使得古籍信息不能得到合理的流动,尤其是一些孤本、善本、稀有珍本不能被更多的古籍研究者和爱好者得见,实乃憾事。有些高校馆已经完成馆藏古籍的全文数字化,但并不开放全网共享。各馆订购的古籍数据库更是需要本校ID或是在指定机器上才能检索使用。对于高校馆参与的数字共建共享项目,一般都只接受参建馆读者的使用要求,而大量的非参建馆读者只能望洋兴叹。馆际资源无法自由交流,古籍信息各自分割形成孤岛,与大数据时代数据爆炸共享的特征格格不入。

2.2 原因

(1)服务意识不够。由于古籍的特殊性和古籍保护的要求,长期以来,高校图书馆都更重视“藏”而忽视“用”。古籍整理“慢工出细活”的工作状态,一方面促成了古籍馆员细致而严谨的工作作风,另一方面,也造就了墨守成规的“慢服务”模式。古籍服务人员思维固化,使得古籍信息咨询服务裹足不前。这导致在大数据时代,古籍馆员没有迅速形成准确而清醒的认识,缺乏将数据转换成知识的思想意识及解决方案[5],也无法对未来的发展趋势作出预测,进而更加大了与读者不断增长的需求之间的落差[6]。因此,古籍人员应勇敢迈出践行的脚步,调整服务策略,培养大数据思维,推动古籍服务的创新与升级。

(2)知识结构欠缺。大数据时代的图书馆人才必须要具备多重知识结构,既要有过硬的学科知识储备,又要掌握图书馆学、情报学、信息检索、现代计算机技术、数据分析、外语等多项跨学科技能,甚至还要锤炼自己的沟通能力和营销技巧,要求可谓非常之高。目前的古籍馆员大多是文史专业的硕博士毕业生,虽然具有深厚的古文化功底,也具备图情专业的基本知识,但是知识构成比较单一,无法兼顾人文与技术的双重要求,对科技前沿的动态把握不足。如何调整古籍馆员的知识结构,面对人文数字化的挑战,是今后高校图书馆必须思考的问题。

(3)基础设施滞后。大数据的实时处理和挖掘分析需要强大的软硬件设备予以支持。数字化后的古籍数据量非常庞大,读者与图书馆交互产生的数据飞速增长,数据类型和结构越来越多元化,这对图书馆的存储及计算能力提出了极大挑战。要高效处理超大规模的复杂数据,实现古籍的大数据管理和应用,就必须配备与之相适应的计算机集群和软件工具。然而高校图书馆的资金有限,技术能力不足,基础设施建设滞后,难以满足新型的数据挖掘方法和深度分析的需求[7]。

3 高校图书馆古籍大数据的实现途径

传统模式的局限性日益凸显,技术与人文的合流才是大数据时代高校图书馆古籍应用与服务探索的方向。从技术上看,古籍大数据是在数据的获取与集成、存储与管理、加工与分析的过程中实现的。

3.1 数据的获取与集成

数据获取是大数据应用的基础。高校图书馆古籍数据来源主要有馆藏资源数据、网络共享数据、行为环境数据。

馆藏资源数据是通过将馆藏纸本、图片、音像资料等扫描及数字化之后形成的结构化数据,较容易被获取。图书馆平台中的古籍书目信息、自建特色数据库、馆藏古籍全文数字化资源等都属于此。但要明确的是,大数据指的不是样本的数据,而是全部的数据。由于古籍年代久远、大量散佚、纸张薄脆等因素,加之高校图书馆的人力财力不足等问题,仍然有大量的古籍原本没有得到数字化。数据的不全面阻碍了古籍大数据的开展。因此,图书馆古籍数字化事业必须要持续推进,最终实现所有存世古籍的数字化和数据化。

网络共享数据包括在互联网能免费获取或通过购买可以得到的各类文献资料数据、网页数据和古籍数据库。图书馆每年都在扩充和整合网络电子数据库资源,将这部分数据作为馆藏古籍数据资源的补充供读者使用。然而想获取高质量的完整数据也并非易事。如中国知网、万方数据库等文献资源数据库,高校图书馆付费后只能得到检索和下载权限,而无法获取可用于研究的数据;不同数据库之间的数据格式不同导致整合的困难。此外,网络古籍数据的质量良莠不齐,错误率较高,清晰度较差,重复建设严重,需要图书馆在数据收集时通过技术手段保障数据质量。

行为环境数据指的是图书馆记录到的所有与读者行为相关的非结构化数据。包括读者的进出馆及借阅情况、OPAC检索及数据库访问记录、社交媒体的使用习惯、与图书馆的互动信息等。古籍部门可以通过刷卡设备记录读者的入馆时间和次数,找寻读者来馆的规律;通过借阅登记表格统计书籍的使用频次,频率高的书籍优先数字化;调取读者的文献检索记录,挖掘潜在的读者需求;收集移动互联网数据,了解读者喜好;架设传感器采集环境数据,优化资源配置。这些数据能帮助古籍馆员有效地分析和预测知识服务的方向,是图书馆古籍大数据的重要组成部分。

收集数据的同时,还要不断集成和整合,才能最大限度发挥功效。清华大学图书馆已经尝试在检索端综合运用多来源数据,读者可以在一个检索页面一站式获得书、刊、文章及词条、书评等不同层次、不同角度的信息内容[8],值得更多图书馆借鉴学习。

当然,单个图书馆的数据是有限的。要想让古籍的大数据应用更加有效,需要积极开展与相关行业和馆际间的合作,促成学科联盟的建立。届时,联盟间形成统一的大数据运行机制,统一数据格式,共享数据内容,在数据挖掘、分析和应用上通力合作,共同促进古籍知识的传播与再利用。

3.2 数据的存储与管理

巨量的复杂数据如何存储与管理是实现古籍大数据必须要解决的问题。为数据找一个可以分类管理的“仓库”才能将大数据的价值充分发挥。

古籍大数据包括结构化、半结构化、非结构化多种类型。目前的大数据处理还无法依靠单一的技术和平台来满足所有的应用需求,因此必须细化处理技术,根据不同的数据类型选择最佳的平台和产品来存储和分析。这就要求建立一个分布式的混搭架构,用基于列存储+MPP架构的新型数据库集群来处理PB级别的、高质量的结构化数据,用Hadoop生态系统集群来处理难度更大的半结构化、非结构化数据,以此来支撑大数据的存储需求,提升数据处理性能[9]。在存储某一类型数据时,不需要将所有数据置于同一个存储空间,而要根据数据的使用频率和特点分层存储管理,并根据数据特点的变化即时调整存储层,使数据存储具有高度的灵活性和延展性。

大数据的存储和管理需要大量的资金投入,高校图书馆难以依靠自身力量实现。云计算解决了这一困局。这是一个虚拟化的基于互联网的运算方式,运用分布式计算机系统。从云计算概念延伸发展出来的云存储,能将网络中大量不同类型的存储设备通过应用软件集合起来协同工作,共同为用户提供数据存储和访问功能。云计算还拥有超强的运算能力,能将分布在“云”上的可配置计算资源快速提供给用户[10]。因此,利用云计算平台,古籍数据的存储、管理、计算和应用得以实现。

3.3 数据的加工与分析

只有将数据的潜在价值和关联挖掘出来,大数据才具有现实的意义。通过数据的加工与分析,古籍信息中各种规律和现象的揭示变得更加直观和触手可及。

(1)知识挖掘。读者对图书馆古籍数字资源的使用多数还停留在检索功能上,没有将其当作数据的观念和习惯。因此,图书馆需要借助大数据分析工具对大量异构的、模糊的、无序的古籍数据进行深度知识挖掘与知识关联,拓展读者对于古籍文献的理解和认识深度。具体应用中,对古籍的知识挖掘主要是通过文本挖掘技术来实现的。古代典籍的知识蕴含在文本内容之中,时空跨度大,覆盖面广。遵循不同朝代的古汉语词汇与语法的不同特点,对古籍文本语言进行词频分析。通过对历代人物、官职、地名、事件等特定的实体名词的聚类分析,得出可靠的时代、文化、历史的变化规律[11]。借助文本信息的分析,揭示古籍作品的人物关系、情感倾向和风格特点。知识挖掘解决了许多前人无法回答的问题,发现了很多前所未知的现象,为图书馆的知识服务提供了全新的发展方向。

(2)文本可视化。古籍文本蕴含着丰富的语义,读者单纯通过阅读典籍很难抓取到其中隐含的内容和关联。可视化技术能够通过对文本信息的分析,将其中纷乱复杂又难以用语言表达的内容和规律进行抽象概括,再以图形化或视觉符号的形式呈现出来,使读者可以运用强大的视觉处理能力快速直观地理解古籍信息的内在结构和关联,建立全新的认知系统。由此,隐性知识在可视化分析中被挖掘了出来,变为读者知识库中的显性知识,完善了读者的古籍知识架构[12]。

(3)空间信息分析。古籍中包含有大量的空间数据,或是历代地图资源,或是语言、文化、风俗在地理上的分布,或是某个地域的作家作品诞生规律,或是某个人物一生的交游和迁移线路。这些数据散布在大量的静态古籍中,难以形成系统的知识图谱被读者充分利用。运用大数据处理方式,可以将与地理有关的空间数据与属性数据相结合,以地理信息系统(GIS)技术为工具,通过数据统计、地图生成等功能,分析和展示古籍知识与地理环境的关系,从而使古籍的空间信息具有了时间与空间的序列,开放了读者从地理角度观察和研究文本的视野。

4 高校图书馆古籍大数据的应用模式

4.1 语义关联分析——以知识元素为中心

古籍知识网络中,常有节点之间的信息交流。语义分析可以从古籍文本中抽取相应的节点信息作为知识元素,构建围绕这一知识元素的知识网络。知识抽取的过程由计算机完成,它并不需要理解知识本身的含义,只需要提炼出尽可能多的知识点,再由理解知识属性的人来做出知识推断,从而分析古籍信息背后隐藏的意义。

理论上,所有的古籍信息节点都可以作为知识元素存在,它可以是某一作家作品、某一文学流派、某一理论体系、某一历史事件、某一词语或典故等。图书馆运用大数据技术,挖掘出特定范围内所有与这些知识元素相关的信息,就能建立一个知识图谱,知识信息中隐含的某种规律和联系就能迅速地被研究者所掌握和利用,研究者的研究方法被彻底革新。例如,将某一作家作为知识元素考察,所有与作家有关的生平籍贯、家族背景、求学历程、政治主张、交友状况、作品风格、图书出版、文学成就,甚至轶闻等都可以全景式展现。

4.2 学科趋势分析——以时间轴为中心

缺少科学数据,古籍研究者对于学科的热点和发展趋势难以准确把握。高校图书馆借助大数据分析技术,基于时间轴坐标,可以为研究者描绘出精准的学科动态图谱,并给出课题指导。

从前的学科服务往往依赖馆员自身的知识储备和经验积累,带有强烈的个人主观偏好。将古籍纳入大数据管理范畴之后,对学科的认识和评判将更具科学性和实践性。馆员可以利用数据挖掘技术提取学科领域的关键词进行整理归纳,将类似概念的关键词整合成规范的主题词进行聚类分析,通过相关性分析挖掘主题词之间的隐含关联,再将主题词放在时间轴上,通过可视化的手段揭示其在一定时间段内的分布规律[13]。这样,当前学科的学术图谱就会非常清晰地展示在研究者面前,研究者可以从宏观角度洞察学科领域的研究热点,提高选题的效率和准确性。

大数据的核心功能就是预测。图书馆可以记录学科主题词在某一时期研究领域的频次变化,分析主题词走向,探寻学科发展趋势。统计某一领域科研成果发表的高峰期、低谷期、半衰期,追踪学术问题的发展轨迹,判断其研究价值。收集核心科研机构研究课题,洞察学科前沿研究方向。据此,古籍研究者可以预知学科未来的发展方向,规避科研盲点和误区,促进学科研究整体的推进。

4.3 学术结构分析——以科研学者为中心

高校图书馆本质上是一个学术型机构,它为教学和科研提供学术支撑。古籍部门由于其资源的特殊性,服务对象也以科研学者和具备一定科研能力的学生为主。古籍使用者的一切学术活动都以数据的形式保留了下来,图书馆可以运用大数据技术收集、挖掘和分析学者的科研数据,自动甄别出服务对象,考察其时空分布、知识构成和类型特点。对于重点学者,可以其为中心建立知识关联网络,学者的研究课题、发展方向、学术历程完整展现,论文、图书等学术成果和期刊会议等信息开放链接,与其联系紧密的科研团队人员构成得以明确,形成一个完整的科研网络。同时,根据大数据分析结论,为相同科研和资源需求的研究人员开发学术共享平台。如抽取出最近以明清戏曲为研究对象的学者群,为其建立虚拟社区,研究者可随时进行资源共享和成果展示,为学术交流提供便利。

4.4 用户需求分析——以读者为中心

在大数据时代,针对用户个体的数据收集和分析成为可能。整合资源和数据,围绕读者的个体特征和研究需要提供个性化嵌入式服务成为未来古籍大数据应用的重要方向。

高校图书馆古籍部服务的对象在一定时期内相对稳定,对于经常来馆的读者,古籍部门可以收集其姓名、年龄、性别、学历、院系、专业、师生关系等基本信息,调取其借阅历史、检索记录、浏览内容、数字资源使用情况等所有与图书馆信息系统交互中产生的数据,经过分析与整合,判断出读者的阅读倾向、研究方向和科研兴趣点,从而主动为其提供相关的资源、服务和学科信息,追踪整个学术过程,制定最适合的学科服务方案。图书馆甚至可以挖掘读者的隐性需求,做到比读者更了解自己,预知读者的发展方向,提前为读者提供可能需要的资源。

5 结束语

高校图书馆的文献资源中,古籍是一个特殊的存在。它不仅是资源,还是遗产;不仅要利用,还要保护。在古籍数字化已趋于成熟的今天,如何将静态的数字资源转化成动态的可被重组、关联和挖掘的知识是每一个古籍从业者必须思考的问题。随着读者的个性化需求越来越强,古籍的传统服务模式受到了挑战,主动为读者提供嵌入式的学科服务成为当下古籍部门职能转变的重要方向。利用大数据的分析方法和技术手段,高校图书馆古籍的数据挖掘和知识服务都将成为现实。

[1]百度百科.大数据[EB/OL].[2016-03-30].http://baike.baidu .com/linkurl=zr48p-BaEe38jZ0LqgJbVlOPrKpfde1Aco_eN DwrbVHxxYkkMwDu1yUO0W9oQ-r9f9Sh250oTlQ488QP2 894fU-PJQ8M5NZfz3PVllczRt3.

[2]曾文雯.大数据时代下高校图书馆的应对策略[J].高校图书馆工作,2014(4):41-43.

[3]李明杰.数字环境下古籍整理范式的传承与拓新[J].中国图书馆学报,2015(5):99-110.

[4]郑永晓.加快“数字化”向“数据化”转变——“大数据”、“云计算”理论与古典文学研究[J].文学遗产,2014(6): 141-148.

[5]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的大数据[J].图书馆杂志,2012(11):63-77.

[6]兰孝慈.SWOT视阈下高校图书馆大数据管理践行的实然落差与应然路径[J].现代情报,2015(11):147-151.

[7]何胜,熊太纯,周冰,等.高校图书馆大数据服务现实困境与应用模式分析[J].图书情报工作,2015(22):50-55.

[8]邓景康.大数据环境下清华大学图书馆的实践[EB/OL]. [2016-03-30].http://www.tsinghua.edu.cn/publish/news/42 07/2013/20130829152841109507827/2013082915284110 9507827_.html.

[9]武新.三种最典型的大数据存储技术路线[EB/OL].[2016-03-30].http://www.d1net.com/bigdata/database/259911.html.

[10]百度百科.云计算[EB/OL].[2016-03-30].http://baike. baidu.com/linkurl=q2sSKTyyLsfw9FI5cA0J0_iQ3WCh9O 9bnp-bSxXMpE548V8Pa3soeCXACGZ08UtXPUEh9uD-vuZC5yjAlgtlva.

[11]欧阳剑.面向数字人文研究的大规模古籍文本可视化分析与挖掘[J].中国图书馆学报,2016(2):1-17.

[12]范佳.“数字人文”内涵与古籍数字化的深度开发[J].图书馆学研究,2013(3):29-32.

[13]陈廉芳,许春漫.大数据时代高校图书馆嵌入式知识服务研究[J].新世纪图书馆,2015(12):5-8.

(编发:王域铖)

Research on the Application of Big Data of Ancient Books in University Library

ZHANG Ruo-ya
(Soochow University Library,Suzhou 215123,China)

Big data era is coming,the traditional arrangement of ancient books and service mode of university library have been difficult to meet the needs of the study of humanities.It is imperative to explore the application of big data in ancient books.This paper analyzes the close relationship between the ancient books and the big data in the information extraction,arrangement and application,discusses the plight of ancient books service in university library at present.And the effective way to realize the big data of ancient books is given from three aspects.On this basis,this paper puts forward four kinds of big data application mode of ancient books.

big data;ancient books;university library

G250.7

G250.7

A

2095-5197(2016)05-0090-06

张若雅(1982-),女,馆员,硕士,研究方向:古籍数字化,古籍整理。

2016-06-21

猜你喜欢

古籍图书馆
中医古籍“疒”部俗字考辨举隅
关于版本学的问答——《古籍善本》修订重版说明
图书馆
关于古籍保护人才培养的若干思考
时间重叠的图书馆
图书馆
我是古籍修复师
《云南省少数民族古籍珍本集成》
去图书馆
广西古籍保护中心积极推动古籍普查工作