APP下载

DjVu技术在数字图书馆中的应用

2014-08-08孙剑

河南图书馆学刊 2014年4期
关键词:数字图书馆图像处理计算机技术

关键词:数字图书馆;计算机技术;数字化格式;图像处理;DjVu

摘要:DjVu技术是一种新型计算机文件格式,同时也是用于保存图书的文件格式,通过大量的国际实例证实DjVu技术的表现优于目前通用的PDF格式。

中图分类号:G259.23文献标识码:A文章编号:1003-1588(2014)04-0119-02

收稿日期:2014-02-21

作者简介:孙剑(1970-),郑州图书馆馆员。1DjVu技术的基本原理

DjVu(法语中“曾经见过,似曾相识”之意)是一种新型电子文件格式,主要用于存储扫描的图像文档。DjVu技术采用独具特点的设计理念,引进JB2与IW44等多项先进图像压缩编码,将图像分解为背景层 ( 纸的纹理和图片 )、前景层( 文本和线条 )和修饰层(MASK)三个可重建的编码层,采用不同的压缩算法,分离了图像文件的文字和背景,修饰层采用图压缩算法JB2编码,背景图像采用IW44压缩算法,同时应用连续投影技术避免了前景层对背景编码的覆盖,形成独特的三层格式,使其兼图像和文档的特性,既能满足图像浏览,又可实现全文检索。

同时DjVu格式采用特殊的算术编码,对二进制图像进行压缩,使之图像文件容量小,清晰度高,并使用先进的渐进载入图像处理技术,使得DjVu格式文件更加适合于互联网的在线传输和浏览。

2DjVu技术的特点

2.1DjVu图像高清晰度

传统图像的压缩格式在辨别色彩对比强烈的区域时辨识度较低,例如在图像文字的反映上不具备高辨识度,很难满足人们的需求。DjVu技术在保留文字符号的清晰度时采用较高的分辨率来大幅提高可辨性,而在反映连续色彩图和背景图片的时候则采用了较低的分辨率 。这种分层处理的方式,通过将文字和背景分离开来,将元素分开处理,使得整个图像的质量有大幅提升,进而展现该技术的优势。

2.2DjVu图像的快速显示

DjVu图像文件由于采用分层技术,可以分层快速显示。解决了原来以传统JPEG、GIF和PNG等格式在网上发布图片的容量限制,突破了图像传播的硬件和带宽瓶颈。DjVu技术不需要把文件全部传送并解码后才显示,因此,用户可以在很短的时间内就可以看到部分文件,而随后的文件也会很快显示完毕,加之DjVu图像文件本身容量小的特点,使得图片文件网络显示效果大大提高,这种网络高质量图像发布显示功能是传统压缩格式无法实现的。

2.3DjVu技术的免费、标准公开

DjVu是一个开放的技术标准,可以将其源代码嵌入各种应用软件中使用,支持IE、NS等多种浏览器, DjVu解码程序和部分编码程序可以在互联网上免费获得。DjVu网络浏览器插件,可以在互联网上免费下载,并有多种操作系统类型选择,几乎可以在所有的平台浏览,非常便捷。同时支持传统PDF、PPT、HTMI和DOC格式的自由转换,保证应用者可以充分利用已有的数字资源。

2.4DjVu格式文件输出方式灵活

同PDF格式类似,DjVu由于包含光学文字识别的文本层,在保存DjVu文件时,可根据用户需要灵活操作,既可以整页保存,也可以选择区域进行局部复制与粘贴操作,对于多页文件开可以选择单页或多页输出。

若一份文件有数百页之多,DjVu可以将其压缩成为一个文档,使得DjVu成为方便实用的网页目录快照,通过浏览器快速清晰地呈现、浏览、打印、传送和下载。

2.5DjVu格式具有文本检索等多种功能

需要特别指出的是,DjVu不仅仅是一种图像压缩技术,实际上已经发展成拥有同PDF一样成熟的多功能的内容。即显示图像的同时,具有文本的显示方式,支持文本关键字搜索,可实现全文检索与复制,能够快速获取档案中的文字内容;支持本地路径和网络路径超链接;同时包含有导航、声音和动态影响等可编程模块,相对传统格式技术更加突出。

3DjVu技术的应用

3.1DjVu技术广泛应用于多个行业

DjVu应用范围非常广泛:在商业上可用于技术手册、CAD绘图,在行政与司法方面课用于地图、城市建设、图书管理等方面,在教育上可使资料更加逼真地转化为数字形式,便利学者的学习与阅读,在文学艺术方面,是图片下载更加流畅快捷,图片更加清晰,更好地满足人们的需求。

随着信息化媒体的广泛普及和网络的超速发展,人们开启了信息化时代,网络代替了纸张,人们利用网络处理、保存和传播文件。人们对于信息的瞬间获取需要使得电脑屏幕成为各种信息的最佳显示媒介。但信息媒体是属于现代人的,在对于过去甚至远古那些鼎盛而辉煌的年代来说,更多的信息仍然在纸上,例如:大量名家著作、经典书籍、名字名画等,都非常具有传播的价值,但却很少出现在网络上。

制约这些信息在网上发布的一个瓶颈就在于扫描图像文件的大小问题。要解决根本问题,就在于如何将大容量文件压缩但又不破坏其内容的清晰度,使得人们在网络上下载速度与大小产生双赢。传统的网络图像格式,如JPEG、GIF和PNG等,在普通分辨率下的图像大小都十分巨大。这也使得网络内容开发者面对现存的印刷材料宝库只能望洋兴叹。

孙剑:DjVu技术在数字图书馆中的应用孙剑:DjVu技术在数字图书馆中的应用在过去数年中,人们对于有效处理彩色图像文件的技术需求越来越强烈,而这种技术实际上就是一种有效的彩色图像的压缩技术。当人们试图建立历史文献的网上数字图书馆,制作电子商务网站的网上购物索引,或进行网络出版时,这种技术就显得尤为重要。另外,低成本、高质量彩色扫描仪,以及高分辨率数码相机的出现,也为这类技术的应用提供了契机。

DjVu技术使得原本智能出现在纸质世界的珍贵信息轻松地转化到了数字媒介,这个桥梁使得高质量的扫描图像可以轻易地在因特网上进行发布。

3.2DjVu技术在数字图书馆中的应用

DjVu技术能够满足任何扫描的高分辨率图像和数字生成的文件,通过DjVu的方式在网上进行发布。数字图书馆可以将大量宝贵的书籍、杂志、索引、手稿、报纸和历史文献资料通过扫描在网上供读者在线阅览。原来被保存在物质载体上的信息,现在可以通过互联网的形式被更为广泛的受众所获取。

DjVu技术将成为电子图书网上发行的最佳手段。即使已经有了完全电子生成的数字版本,DjVu仍然是屏幕显示的最佳选择。例如,对于纸张上包括一定数量的颜色、图片、公式、线条和其它非文字印刷时,DjVu的超强压缩功能将大大缩小文件的尺寸,使其在性能上优于PDF格式。在网页设计方面,该技术更是有更高的优势,不仅能压缩界面和自动装载,而且还在与浏览器的兼容方面做到十分完善。同时,DjVu格式的电子书也具有文字查找功能,对于读者查找关键词也非常方便。

对图书馆的手稿和古籍印刷品进行网上发布是DjVu技术的专长。公众以前基本无法接触到的稀有珍藏,现在都可以毫无限制地在网上传播,公众只需花几秒钟的时间就可以在自己家里的电脑屏幕上欣赏到这些珍贵的历史资料。专业研究者则可以通过DjVu技术的体现,对所看到的资料的色彩、细节、纸张等部分进行细致的分析甄别。除以文字为主的文献资料外,绘画作品也可通过DjVu在网上发布。

3.3DjVu技术在数字化出版中的应用实例

3.3.12002年,由中美科学家共同发起的数字图书馆研究和开发项目《百万册图书数字化工程(CADAL)》中,DjVu技术(还有TIFF和PDF格式)被Internet Archive公司选中,作为公有领域书籍扫描后上线的格式。

3.3.22008年,国家档案局关于DjVu技术应用的科技项目通过鉴定,已将DjVu选为电子文件长期保存的一种标准格式写入了《电子文件管理细则》,国家档案系统已开始正式采用这项技术。

3.3.3浙江大学图书馆、浙江省档案馆、中央美术学院图书馆等单位的数字资源管理发布平台也都采用了DjVu技术。

3.3.4捷克国家图书馆建成了基于DjVu技术的馆藏阿拉伯文献数字图书馆。

DjVu作为一种新型的文件压缩技术,在通往信息化的道路上展现了惊人的能力和优势。明显的技术优势已经被不同行业的数字化建设所认可和应用,应用范围已经涉及图书、档案、金融、交通、房地产、测绘、制图等领域。尤其是3G时代的到来,DjVu技术应用优势更加凸现,成为手机、IPAD等无线设备发布和接收信息的最佳解决方案。相信在未来的一定时期内,随着DjVu技术在数字图书馆中的普及应用,人类宝贵的知识遗产将会得到更为广泛的传播和利用。

参考文献:

[1]梁民,王北.DJVU格式与PDF格式的对比[J].软件设计与开发,2011(6).

[2]范家如.浅谈电子文件长期保存格式DjVu[N].卫生职业教育,2009(23).

[3]黄晨.基于DjVu格式的数字图书馆[J].情报技术,2004(5).

[4]王国庆,董秋生.DjVu是值得推崇的数字图书馆存储格式[J].中华医学图书情报杂志,2008(9).

(编校:严真)

endprint

猜你喜欢

数字图书馆图像处理计算机技术
“课程思政”视域下职业学校《图像处理》课程教学改革实践
构建《Photoshop图像处理》课程思政实践教学路径的探索
基于图像处理与卷积神经网络的零件识别
基于新一代信息技术的Photoshop图像处理课程开发与建设
基于云计算的数字图书馆建设与服务模式研究
探讨办公自动化中的计算机技术应用
基于矩阵LU分解的并行处理
政府机关档案计算机管理的有效应用分析
刍议数字图书馆计算机网络的安全技术及其防护策略