APP下载

DNA存储领域的专利分析

2023-06-24吴琼乐

中国新通信 2023年2期
关键词:存储介质专利分析

摘要:DNA存储领域是一种融合DNA和存储介质的新兴技术,已引起各国家、企业和高校的关注与研究。本文以智慧芽专利库检索得到DNA存储领域专利作为研究基础,从专利视觉,对DNA存储领域的专利申请趋势、技术分布、技术主题以及申请人进行梳理分析,以期为相关企业和高校在DNA存储领域的专利布局提供借鉴。

关键词:DNA存储;存储介质;专利分析;专利3D地图

一、引言

近二十年来,随着移动互联网、人工智能等技术蓬勃发展,带来数据量指数级增长。国际数据公司统计,2018年全球数据总量已经达到了33ZB,2025年预测将达到163ZB[1]。然而,目前主流存储介质发展与生产速度明显滞后于数据量的增长[2]。海量数据的拷贝、传输和保存也面临巨大的挑战。因此,亟需一种新型存储介质以应对上述挑战。

脱氧核糖核酸DNA作为遗传信息存储载体[3],利用腺嘌呤A、胸腺嘧啶T、胞嘧啶C和鸟嘌呤G四个碱基组成代码进行存储,具备存储密度高、维护能耗低、保存寿命长等优势[3-6]。因此,DNA存储在数据存储领域成为一种极具吸引力的存储介质。

DNA存储是利用DNA作为介质,将数字信息在二进制码、四进制碱基序列和实际DNA片段之间的转化与流动[7-8];DNA存储领域主要包括[9]:①编码:将数字信息通过编码映射成A/T/C/G碱基序列,包括压缩、纠错和转换3个流程。②合成:通过人工合成技术包括第一代化学合成法[10-11]、第二代微阵列DNA合成法[12]和第三代酶合成法[13],按照顺序得到DNA片段。③存储:将DNA片段选择合适载体如体内或体外存储。④检索:利用特异性杂交技术如基于聚合酶链式反应PCR或磁珠分离技术,同特定引物序列提取DNA分子。⑤测序:利用基因测序技术包括第一代Sanger法[14]、第二代大规模平行测序法及第三代单分子测序法[15-16],对提取的DNA分子测序得到DNA序列。⑥解码:将DNA序列信息解码转换回原始数字信息[17-18]。

基于上述背景,本文将以DNA存储作为研究对象,结合专利数据对全球范围内相关技术的发展趋势、技术分类、技术主题以及申请人分布等多方面,结合图表进行统计学分析,旨在为DNA存储领域方面的专利布局提供理论基础和数据支撑。

二、DNA存储领域的专利技术分析

(一)数据库的选择

智慧芽专利数据库收录了全球158个国家/地区,总数超过1.7亿余条专利数据,每天实时更新以及对原始数据进行全面深加工,能够协助用户完成各类专业分析动作,满足用户深度的专利分析需求。

(二)检索要素选择

本文基于智慧芽专利数据库,检索日期为2022年8月16日,由于DNA存储属于新型技术,数据量较小,直接采用中英文关键词,使用检索式:脱氧核糖核酸or DNA or Deoxyribonucleic Acid进行专利检索,利用PatSnap同族智能去重,手动去除无关、异常等数据,最终得到5476条检索结果。

(三)专利申请发展趋势

不同年份的专利申请量能够反映出该技术领域的技术发展趋势[19]。根据事物发展的普遍规律,专利技术数据同样可以分为四个阶段,即技术萌芽时期、技术成长时期、技术成熟时期、技术衰退时期[19-20]。发明专利保护期限为20年,专利数据从申请到公布最长存在18个月延迟,因此2021-2022年专利数据存在不完整,仅供参考。综上所述,本文将时间限定在2000-2022年进行检索,以便全面地获取此领域的专利数据。

图1是DNA存储领域专利申请趋势。可知,DNA存储领域的整体专利申请一直处于增长趋势。总体可以分为两个阶段,第一阶段在2000-2012年,属于缓慢增长阶段即技术萌芽时期,从最初的24件经过12年缓慢增长到154件,这与当时的DNA存储领域技术不成熟以及未引起政府和科学界的重视有关。第二阶段从2013年至今,属于快速增长阶段即技术成长期,从2013年的228件到2020年的691件只经历7年时间,专利申请量明显增多。其原因一方面是2012年哈佛大学Church课题组发表论文,介绍如何使用DNA来存储一本书[21],2013年欧洲生物信息学研究所Goldman等发表论文,证实利用DNA存储多媒体文件同时引入纠错机制[22],引发科学界对DNA存储领域巨大关注,另一方面是世界各国陆续开始实施多项促进DNA存储领域发展的政策手段。综上所述,可以预见,在技术与政策的驱动下,DNA存储研究已经进入快速发展期,在未来很长一段时间内,专利申请量会一直处于稳步上升,并最终推动进入技术成熟期。

(四)专利技术分类排名

IPC分类号是根据专利申请涉及的技术方案所属的领域来确定的,通过分类号可以粗略地确定专利申请内容,大致反映专利所涉及技术主题。因此,分析某领域内专利涉及的所有IPC分类号以及这些IPC分类号下专利申请量,就能得出该领域的技术构成以及该领域内申请人关注的技术方向[23]。

图2是DNA存储领域IPC前10大类。DNA存储领域,专利申请主要集中在C12即生物化学、啤酒、烈性酒、果汁酒、醋、微生物学、酶学、突变或遗传工程,G06即计算,推算或计数这2个大类,这2个领域的专利申请量占比高达64%。其余包括G01即测量、测试;G16即特别适用于特定应用领域的信息通信技术[ICT];A61即医学或兽医学、卫生学等。

(五)专利技术主题分布图

利用智慧芽专利数据库的专利聚类和3D专利地图分析功能,结合NBER标签,对DNA存储领域做进一步智能分析。在3D专利地图中,按粉红色、深灰色、浅灰色、白色代表该技术区域内专利申请数量逐级递减。粉红色表明专利数量最密集,涉及该技术主题的專利申请量最多,是技术研发的热点[24]。白色表明专利数量最稀少,涉及该技术主题的专利申请量最少,是研发技术的空白点[24]。

图3是DNA存储领域的3D专利地图。可知,DNA存储领域的3D专利地图有多达10处粉红色,其中有8处都涉及生物技术、有4处涉及计算机硬件&软件,这与之前IPC大类主要分布在C12和G06相吻合;技术主题具体包括化学、核技术、测量&测试、信息存储等,这也与之前分类号G01、A61以及G16的分布情况也是一致的。

这说明目前DNA存储领域发展呈多样化,触及的6个技术环节即编码、合成、存储、检索、测序和解码均在齐头并进的快速发展布局,这也说明DNA存储领域已引起各方持续关注,呈现出创新活跃度增高、创新能力加强的现象。

(六)专利申请人专利量排名

专利申请人拥有专利申请量的多少,某种程度上反映其在此技术领域的创新水平[20]。图4是DNA存储领域的主要申请人。从申请量排名来看,排名前10的申请人,有4位中国申请人,值得注意,第1位是深圳华大基因,这表示中国企业已在DNA存储领域开始布局,目前发展趋势良好。从申请人类型来看,企业与高校申请人平分秋色。国外主要以企业为主包括美国生物科技公司亿明达,而国内主要集中在高校如中国科学院深圳先进技术研究院,由此可以判断出国内外申请人在DNA存储领域侧重方向不同,国外申请人更重视将其尽可能商业化,以获得经济价值,而中国申请人技术主要集中在理论研究与实验阶段。

(五)专利申请国家排名

专利申请国家的排名可以反映该国家/地区的发展前景。专利申请量越多,意味着该技术在该国家的发展前景越广阔,也在一定程度代表该技术在该国家的重视创新程度越高。

图5是DNA存储领域专利申请国家排名趋势。可知,中国以绝对优势列为第一,美国紧随其后。申请人在专利布局时,将中国和美国作为重点国家,欧洲例如荷兰、德国、英国等国家由于其知识产权发展相对成熟,也是申请人专利申请的重点区域。

根据图5的数据量计算,可知中国专利申请量远超其他地区的申请量总和。这表明,中国专利申请量主要是依靠中国申请人来实现,具体而言,中国申请人主要是在中国进行专利申请,并未在海外国家/地区进行专利布局。这可能跟中国申请人主要是高校研究院有关,高校研究院一般选择国内专利申请作为其研究成果,而其海外研究成果则主要选择在海外期刊发表期刊,并无进行国外专利申请的意识。

三、结束语

本文通过2000-2022年DNA存储领域专利申请趋势、技术分类排名、技术分类分布图、申请人排名以及申请国家/地区排名进行研究分析,得出如下结论:

抓住机遇:从专利申请趋势来看,目前DNA存储领域属于一种新型技术,不同于传统技术,该领域发展还处在技术成长期,将来会有源源不断的蓝海领域被发现。因此,中国申请人应当抓住一切可能的机遇,提高技术研发实力,争取成为全球技术发展的领头羊。

加强布局:从专利申请国家排名来看,DNA存储领域,中国和美国是全球最大的目标市场,然而中国申请人很少在海外市场布局。因此,中国申请人要提高专利布局意识,积极在海外国家进行专利申请,借此发展和提升在海外国家的竞争力和市场潜力。

提高效益:从专利申请人类型来看,DNA存储领域,中国专利权人主要是高校,目前各大高校普遍存在大量专利申请闲置,没有投入商业用途,无法带来经济效益。而企业则存在研发能力一般,缺乏基础性实验数据的问题。因此,促进企业与高校合作,实现强强联合,将专利技术尽可能转变成经济力量,让专利发挥其应有的经济作用。

作者单位:吴琼乐 国家知识产权局专利局专利审查协作四川中心

参  考  文  献

[1]ZHIRNOV V,ZADEGAN R M,SANDHU G S,et al.Nucleic acid memory[J].Nature Materials,2016,15(4):366-370

[2]宋琪,丁陳君,吴晓燕,陈方,等.DNA存储领域国际发展态势分析.世界科技研究与发展[J],2021,43(1):24-42.

[3]CEZE L, NIVALA J, STRAUSS K.Molecular digital data storage using DNA[J].Nature Reviews Genetics,2019,20(8):456-66.

[4]MEISER L C, ANTKOWIAK P L,KOCH J,et al.Reading and writing digital data in DNA[J].Nature Protocols,2020,15(1):86-101.

[5]DONG Y,SUN F,PING Z,et al.DNA storage:research landscape and future prospects[J].National Science Review,2020,7(6):1092-1107.

[6]SELBERG J, MARCELLA G,ROLANDI M,et al.The potential for convergence between Synthetic Biology and Bioelectronics[J].Cell Systems, 2018, 7(3): 231-244.

[7]CEZE L, NIVALA J, STRAUSS K. Molecular digital data storage using DNA[J]. Nature Reviews Genetics, 2019, 20(8):456-66.

[8]MEISER L C, ANTKOWIAK P L, KOCH J, et al. Reading and writing digital data in DNA[J]. Nature Protocols, 2020, 15(1):86-101.

[9]许鹏,方刚,石晓龙,刘文斌,等.DNA存储及其研究进展[J].电子与信息学报.2020,42(6):1326-1331.

[10]LEPROUST E M, PECK B J, SPIRIN K, et al. Synthesis of high-quality libraries of long (150mer) oligonucleotides by a novel depurination controlled process[J]. Nucleic Acids Research,2010, 38(8): 2522-2540.

[11]CARUTHERS M H. The chemical synthesis of DNA/RNA:our gift to science[J]. The Journal of Biological Chemistry,2013, 288(2): 1420-1427.

[12]KOSURI S, CHURCH G M. Large-scale de novo DNA synthesis:technologies and applications[J]. Nature Methods, 2014,11(5): 499-507.

[13]LEE H H, KALHOR R, GOELA N, et al. Terminator-free template-independent enzymatic DNA synthesis for digital informationstorage[J]. Nature Communications, 2019, 10(1): 2383.

[14]SANGER F, NICKLEN S, COULSON A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences of the United States of America, 1977,74(12): 5463-5467.

[15]LOMAN N J, QUICK J, SIMPSON J T. A complete bacterial genome assembled de novo using only nanopore sequencing data[J]. Nature Methods, 2015, 12(8): 733-735.

[16]JAIN M, FIDDES I T, MIGA K H, et al. Improved data analysis for the MinION nanopore sequencer[J]. Nature Methods,2015, 12(4): 351-356.

[17]韩明哲,陈为刚,宋理富,李炳志,元英进,等.DNA信息存储:生命系统与信息系统的桥梁[J].合成生物学.2021,2(3):209-322.

[18]陈大明,张学博,刘晓,马悦,熊燕,等.从全球专利分析看DNA 合成与信息存储技术发展趋势[J].合成生物学. 2021, 2(3): 399-411.

[19]杨铁军.专利分析可视化[M].北京:知识产权出版社,第2-3页,2017, 4.

[20]谢志明,张媛,贺正楚,等. 新能源汽车产业专利趋势分析[J]. 中国软科学,2015(9):127-141.

[21]CHURCH G, GAO Y, KOSURI S. Next-generation digital information storage in DNA [J]. Science, 2012, 337(6102): 1628-1628.

[22]GOLDMAN N, BERTONE P, CHEN S, et al. Towards practical,high-capacity, low-maintenance information storage in synthesized DNA[J]. Nature, 2013, 494: 77-79.

[23]陳军,张韵君,王健.基于专利分析的中美人工智能产业发展比较研究[J].情报杂志,2019,38(1):41-47.

[24]张建升.区块链技术中专利申请状况及发展趋势分析[J].中国发明与专利,2018, 03(15):123-128.

吴琼乐(1988-),女,硕士,国家知识产权局专利局专利审查协作四川中心,专利审查员,研究方向:数据存储领域。

猜你喜欢

存储介质专利分析
HDFS数据动态分布设计与实现
档案馆移动存储介质管理方法探讨
一种使用存储介质驱动的方式
基于专利计量的广东高水平大学科研竞争力评价研究
国际云制造关键技术专利分析及启示
专利分析在产业创新中的利用
稀土发光材料专利分析综述
医院环境下移动存储介质的信息安全管理