APP下载

2019中国大数据产业发展白皮书(下)

2019-02-07

中国计算机报 2019年49期

大数据是一种技术,更是一种智能。作为技术,它是新技术体系——Sensor-IOT-Cloud-BD-AI的关键一环,提供了从数据源采集、数据清洗、数据算法、行业场景模型,以及决策支撑等全流程服务,有助于提升业务效率,辅助业务决策。作为一种智能,它提供了诸多企业应用和行业应用解决方案,帮助企业和政府提升数字化转型能力,推动数据智能的落地。

大数据产业的细分领域

网络广告

引领互联网大数据应用

互联网大数据应用占据了中国大数据市场的半壁江山,其中以网络广告的应用最为典型。网络广告行业开启了大规模、自动化地利用数据改善产品和提高收入的先河。

在相当长一段时期内,网络广告都是大数据方法在实践中唯一形成规模化营收的落地场景,时至今日它仍然是大数据应用中最为成熟,市场规模最大的行业。

网络广告经过短短十几年的发展,已经形成了以人群为投放目标,以产品为导向的技术型投放模式,不仅为广告主带来了以准确接触目标受众为方法论的全新营销管道,也为互联网免费产品和媒体提供商找到了规模化变现的手段。

网络广告的发展演进沿着两条主线前进:

(1)交易形式和定向技术的发展。从最初的固定位置的合约交易(CPT广告)发展到进行受众定向、按展示量结算的合约交易,再到竞价交易方式(包括搜索广告、上下文广告和广告网络/联盟等),并最终发展到开放的实时竞价交易(程序化交易广告)。

(2)产品展现逻辑的发展。在最初阶段,广告位作为与内容相对独立的单元来决策运营,并完全以优化收入为目标。随着搜索广告、社交网络信息流广告的发展,将内容与广告以某种方式统一决策或排序的“原生广告”渐成主流。在移动广告渗透率快速提升的大背景下,适合小屏的原生广告前景广阔。

当前,网络广告产业的發展呈现出如下4方面特色:

(1)移动化和碎片化。2018年移动广告在网络广告中的占比达75.6%,短视频、信息流成为移动广告增长的动力引擎,用户碎片化的使用习惯在移动端更为显著。

(2)信息流化。信息流广告已经成为媒体平台变现的主要模式,其高原生性和用户精准触达,平衡了商业行为和用户体验,社交类、资讯类、视频类、搜索类、浏览器类等媒体纷纷加入信息流广告队列。

(3)原生化。搜索广告和信息流广告发展迅速,基于结构化付费内容库和媒体渲染模板的植入式原生广告平台建设逐渐成为热点。

(4)融合化。揭示关联关系的大数据与揭示因果关系的小数据融合,海量线上行为数据与线下实体店数据结合,两大类数据融合,大幅提升了数字营销效率。

营销管理、数据融合、信息流、原生内容引领行业新趋势

当前,广告主方面的核心诉求仍旧是:借助网络广告的方式,提升自身的销售额。

实际操作过程中有两大痛点:一方面是全渠道营销管理能力不足。广告主无法高效整合全渠道用户触点,管理接触用户的流程和获客路径;难以开展以人为核心的工作流程管理,落实精细化管理,从而提升营销效率。另一方面是技术、创新和数据等多要素整合能力不足。比如,对内容营销、短视频营销和IP营销等热门方式的整合能力不足;市场创意流于同质化;线上线下数据整合能力不足等。

针对上述痛点和行业发展趋势,未来的机会点主要体现在以下几个方面:

(1)全渠道营销管理自助化平台建设。提供综合“SEM+EDM+社交+内容营销+独立DSP+DMP+舆情监测“等的全渠道营销解决方案,打造闭环优化网络,推进营销管理的自主化、自动化和平台化发展。

(2)推进数据融合应用,提升营销效率。强化大小数据融合,综合大数据洞察的关联关系和小数据发现的因果关系;推进线上线下数据融合,强化场景营销。

(3)植入式原生广告平台建设。该平台的运作中,由媒体方负责洞察用户意图并提供渲染模板,由广告平台来查询并筛选各行业结构化的付费内容信息,最终通过渲染得到最终曝光的广告片段。搭建这类平台,需要媒体方增加用户意图洞察和模板设计工作,需要广告平台积累海量高质量的结构化付费内容信息。这类平台的普及将避免现有展示广告产品对用户体验的打扰和伤害,而且有可能将展示广告变成“搜索广告”,为媒体创造高价值变现能力。

(4)广告形式的信息流化。作为原生广告的最主流模式,图文和短视频信息流发展迅速,高效地吸引用户浏览点击,留住用户注意力。未来短期内,社交类、资讯类、视频类、搜索类等多种媒体的信息流化将持续加强。

(5)原创内容和IP资源投入。随着内容营销、原生广告的火热,原创图文、短视频、软文、IP等方面的版权采买将快速增长,从而塑造媒体在内容资源方面的差异性,提升媒体平台的变现能力。

政府数据资产管理与应用

成为行业关注热点

我国政府大数据业务演进,大致可划分为三个阶段:

(一) 信息化建设期(2010年以前)。政府信息化建设经历了办公自动化、电子化工程(“金”字工程)、政府上网工程三个时期。1992年,国务院办公厅提出建设全国行政机关办公决策系统,政府信息化建设从此起步。1993年起,国务院启动国民经济信息化“三金工程”(金桥、金关和金卡工程),政府部门网络建设逐步启动,这是我国政府信息化建设的雏形。自1999年发起“政府上网工程”以来,我国迅速迈入网络社会,电子政务的发展优化了政府网站的内容和功能,提升了互动性,落实了网上业务办理。2001年,国家做出了“中国建设信息化要政府先行”的重要决策,2002年明确提出我国电子政务的目标以及发展战略框架。通过这一时期的建设,政府各部门落成了一批信息系统,整个体系的信息化水平显著提高。分部门而言,财政、税务、海关、公安等涉及审计和监管的部门在信息化建设方面走在前列,其他部门的信息化建设相对滞后。

(二)加速政府数据汇集整合(2011—2016年)。政府从“十二五”开始,逐步开展IT规划和数据整合工作,数据开放共享的意识持续提升。但是,各地政府数据汇集整合水平参差不齐,建设层次不高,存在跟风发展“数据仓库”和“大数据平台”等现象。2015年以来,随着《促进大数据发展行动纲要》等一批文件的下发,政府数据汇集和开放共享意识进一步提升,政府大数据产业发展环境持续优化。

(三)数据资产管理和应用(2017年以来)。这一时期,随着《政务信息资源共享管理暂行办法》《大数据产业发展规划(2016—2020年)》和《政务信息系统整合共享实施方案》等文件相继发布,相关部委和地方政府也配套出台了大量扶持政策,政府部门的“数据资产管理和应用”意识持续提高,部分政府开始自建IT队伍和大数据平台。从实操层面来看,政府大多通过引入大型厂商(如华为和浪潮等)来建设统一的底层技术和数据平台,上层应用则由众多中小企业基于底层平台搭建,以此简化技术栈,助力IT系统集成,数据汇集和标准化。此外,随着数字经济和新型智慧城市等项目的推广,政府大数据应用逐步从单纯满足管理者需求的浅层次应用,逐步向能创造实际价值的深层次业务应用拓展,在政务服务、社会治理和民生应用三大领域不断提升政府业务效率,降低运营成本,提升用户体验。

数据资源中心、数据治理、

人工智能应用等创造新机遇

从政府的角度来看,当下的痛点主要有以下几点:

1.部门间存在壁垒,数据孤岛依旧严峻。政府不同部门、不同业务线存在数据条块分割,导致跨部门数据汇集和共享困难。一方面,某些政府部门将数据视为内部资产、部门权属所在,以及业务创新的机会点,导致其共享数据的意愿不高;另一方面,以部门为中心的政务信息化发展模式,形成了诸多“数据孤岛”,比如税务、民航、通信管理等垂管部门系统相对独立,技术栈复杂,将这些数据接入统一的地方数据共享平台存在困难。此外,由于数据权属不明确,共享后可能产生的数据应用责任问题,也導致政府各部门在推进数据整合共享中趋于谨慎,壁垒重重。

2.数据标准不完善,数据互通存在阻碍。一方面,政府数据标准建设尚不完善,政府数据安全责任内容不明确,权属关系、职能责任分工模糊,数据分类分级规范尚未建立,很多政府尚未开展数据平台建设,主数据管理意识缺失;另一方面,出于对数据隐私和安全等问题的考虑,政府推动数据开放共享的过程也日趋谨慎。

3.“重建设、轻应用”的问题依旧存在。政府在推进大数据建设过程中,偏重硬件资源的投入,忽视行政机构的调整和行政流程的再造,导致设备资源冗余、效率堪忧。在软件应用方面,出于内部事务处理和行政管理需要,支撑政府决策和面向公众互动服务的信息化能力亟待提高。推广实施和后期完善应用成为初期建设完成后的薄弱环节。

4.数据创新意识淡薄。政府部门拓展数据应用的创新意识淡薄,特别是领导层对数据的认识不深刻,亟待培育数据思维和数字化管理理念。

从供应商的角度来看,难点在于:

1.大数据人才招人难和留用难。政府大数据企业有很多是从事信息化建设to B类软件企业。这一领域通常需要长时间的技术和行业经验积累,但由于薪资水平往往不敌互联网行业,人才招引难和留用难问题相对突出。

4.行业专家缺乏。技术积累和行业积累的长周期性导致行业专家资源稀缺。很多政府大数据领域的项目,需要懂得行业内在规则的专家来支撑和解读,但实际情况是应用场景数量远远多于行业专家。

针对上述痛点和难点,未来机会点在于:

1.集中化数据资源中心的建设。落地集中化的数据资源管理,加快打通部门间的数据壁垒,建设统一的数据资源中心,助力实现政府数据开放共享和高效管理。

2.强化政府数据治理。基于集中化的数据资源,保障数据的完整、准确、客观、可靠,助力政府完善数据治理体系。该领域是政府信息化建设的重点和难点所在,未来增长潜力大。诸如久其软件、软通智慧等优势企业提供了大量落地解决方案。

3.强化新技术与政府业务融合。顺应人工智能、大数据和5G等技术的发展,协助政府挖掘并优化业务与新技术的结合点,创造更多应用场景,引导政府释放一批新项目。以信访部门为例,有部分政府信访单位探索应用自然语言处理和人工智能等技术,实现了来访信件扫描文档的自动分类,归集和摘要自动生成,大幅提升了业务效率。基于监管科技的大数据应用。随着人工智能、大数据、物联网和5G等技术的发展,以及数字社会和新型智慧城市建设的持续推进,未来政府在社会治理和城市建设领域的投入将持续增加,公共安全防控、舆情监测、应急管理、社会信用数字化、环境监测、食品药品监管、交通管理等数字化项目将持续迭代,构筑起“大监管”的整体环境,创造出更为优良的城市营商环境,助力基于监管科技的政府大数据市场快速成长。这一细分领域涌现出大量优势企业,如网智天元、百分点、科技谷、智慧星光等。

信用风险、操作风险和市场风险的管控成为金融行业焦点

金融行业的核心是风险管控,无论是银行业、保险业还是证券业,风险管控都是重中之重,是金融业务顺利开展的有效保障。

2018年,中国“一委一行两会”的金融监管新格局形成,严监管将持续,加强合规和风险控制成为金融业的发展重点。金融大数据就是围绕“风险管控”这一核心环节,为其金融业务的效率提升和决策辅助提供支撑。

国内外的金融大数据应用存在差异,国外的应用集中在投资银行和政府监管领域,国内由于银行业体量大,银行信贷则成为应用主战场。此外,金融监管和信息安全在国内也受到了高度重视。

整体而言,金融风险主要涉及信用风险、市场风险和操作风险。金融大数据基于大数据平台,通过整合多维数据,构建了解决这三大类风险问题的框架。

1.信用风险领域应用,主要解决信息不对称情况下的信用评价和评级问题。在企业征信方面,当前国内有136家备案企业,主要承接银行和投资机构的委托,应用大数据技术开展企业征信情况调查,提供多维度的企业征信信息展示,辅助信贷投放决策。在这一细分领域,针对无资产、无抵押的高科技中小微企业的信贷评估渐成重点。在个人征信方面,供应商主攻金融零售行业(如信用卡、消费金融和P2P网贷等),结合多维度合规数据,开展针对放款对象的信贷风险评估。

2.市场风险领域应用,主要解决评级完成后的资产定价问题。通过结合多维度的企业行为数据,开展中小微企业资产评估和定价,保险资产评估和定价、信贷资产评估和定价,以及资本市场上市公司估值等业务。智能投顾作为金融科技热点,同样也应用大数据技术开展海量资产评估,并通过智能算法生成个性化资产组合。

3.操作风险领域应用,主要解决业务实操中由于运营不合规所导致的风险问题,监管科技是这个细分领域的主要技术,涉及保险监管、资本市场监管、银行信贷监管,地方金融监管等。金融大数据作为监管科技的核心技术,被广泛用于辅助银行打击非法集资,助力交易所洞察金融欺诈和违规等,以及支撑银保监会开展被监管主体的信用评价。

基于内生数据和场景化建模

业务决策辅助将成为新机遇

传统的金融IT集成商和金融大数据供应商在业务重点方面存在差别。以银行业为例,传统金融IT集成商主要解决银行业的信息化问题,搭建核心业务系统、信贷系统等,推动技术架构的云化和微服务化转型。这些工作多由银行IT人员参与。金融大数据供应商解决银行部门怎么放贷、贷多少等问题,与银行系统直连,服务于银行业务决策。这些工作隶属于咨询业务,多由金融科技部门承担。

当前,中国银行业积极主动实施架构转型,建立开放、弹性、高效、安全的新一代银行系统,银行业在金融科技领域的投入越来越大。六大国有大型商业银行(包含中国邮政储蓄银行)和股份制商业银行纷纷组建自己的金融科技公司,持续加大科技投入,丰富金融大数据应用。城商行和农商行近两年也陆续加快科技布局,未来发展空间大。

研究发现,以银行为代表的金融企业非常关注如何应用大数据技术提升业务效率,优化用户体验,管控风险。但是,仍有很多银行由于实力所限,需面对技术力量跟不上、多维度风控能力滞后、基础数据不完善、缺乏对数据的理解等现实问题,亟待引入第三方科技支撑力量。

针对上述需求痛点,供应商的未来机会点主要体现在以下几个方面:

(1)整合多源数据,在合规的情况下,构建内生数据资源,打造自有模型,深耕行业应用场景,塑造细分领域的差异化竞争力。

(2)以城商行和农商行为突破口,加快拓展金融大数据业务。目前,六大国有银行的大数据应用多由自身的金融科技部门承接,城商行和农商行是机会点所在,其在企业征信、个人征信、资产估值定价、打击非法集资等领域将爆发出一批需求,用以降低自身的信贷风险和市场风险。

(3)大力布局金融监管解决方案。金融行业严监管是未来发展趋势,应用科技手段夯实地方金融监管和资本市场监管应作为供应商的发展重点。

(4)金融大数据企业是金融IT市场的新生科技力量,与传统金融IT集成商既竞争又合作,应在合适的领域采取合作模式,实现双赢。

降本增效和数据变现成为

电信大数据应用热点

电信行业的信息化水平走在全行业前列。2010年以后,随着人口红利的消失和提速降费压力的升高,运营商持续压缩成本,提高收入,加速创新,在“存量用户市场”上开展竞争。在此背景下,运营商开始布局大数据平台和相关应用,其中移动和电信的大数据业务始于2010年,联通的相关业务始于2012年。运营商的大数据应用不同于传统的电信经分系统。

传统的经分系统仅仅服务于运营商的市场部门,但大数据应用服务于运营商的所有业务。当前,电信大数据领域的市场集中度较高,大型服务供应商包括思特奇、亚信科技和东方国信等。

电信行业的大数据业务演进,大致可划分为两个阶段:

(1)2010—2015年,大数据平台建设期。运营商大力布局各级大数据平台,高度关注大数据供应商的技术成熟度和产品的完备度;各电信研究院也围绕实际业务需求,开展了大量基础研究和应用开发,组织了大量PoC测试。这一时期,运营商的大数据平台建设和运营能力大幅提升。

(2)2016年及以后,数据融合应用建设期。运营商大力促进三域(B域、O域、M域)数據融合,对外推动数据变现,对内加速降本增效,业务创新压力持续增大。与此同时,运营商业务的集中化日益明显(例如中国移动原来分散在各城市的网上营业厅统一为中移动网上营业厅),由此引致的IT架构集中,催生了数据割裂和应用割裂等问题。如何统筹、融合省级大数据平台与集团平台的数据资源,兼顾数据应用的标准化和区域个性化,优化提升“两级大数据架构”成为破局关键。

BOM数据融合、两级架构平台、网络数据生态引领新机遇

电信运营商的痛点需求主要有两点:一方面控制成本投资,提升运营效率;另一方面落地数据创新,加速数据变现。

在此背景下,如何架构新一代通信网络(如5G、SDN、NFV等),搭建基于电信数据的产业生态和平台,优化两级大数据架构,推动B-O-M三域数据融合,加速数据应用创新和变现,成为运营商在存量客户竞争中胜出的关键,也是运营商的大数据应用痛点所在。

调研还发现,由于电信运营商近两年持续压缩软硬件和信息基础设施投资,大数据平台和应用建设不足,制约了大数据产品和服务的优化。

此外,运营商在实施大数据项目中思路和需求的经常性变动,也间接导致了大数据产品和服务的生命周期短,难以形成稳定收益。这些痛点在一定程度上制约了电信大数据行业的稳定发展。

针对上述需求痛点,供应商的未来机会点主要体现在以下几个方面:

(1)顺应运营商降本增效和对外变现的大趋势,积极与运营商开展框架协议式合作,围绕AI、5G、SDN等热点领域,加速产品和服务的研发创新,持续提升运营商的网络运营效率。

(2)电信运营商下一步会瞄准政企市场,加大异业合作力度,在诸如新型智慧城市、企业数字化转型、数字政府和数字社会等领域,提供通信网络建设、云服务和数据服务。由于自身研发能力和资源有限,其在细分领域必然需要大量专精的解决方案提供商。

工业领域数字化发展水平

差异大,应用场景逐渐成熟

国家高度重视工业领域的数字化转型,持续落地“两化融合”和智能制造等项目,布局推动先进制造业发展。工业大数据应用由于贴近企业痛点,日益成为推动工业转型的重要抓手,助力工业企业实现降本、提质、增效。近年来,在电力电网、轨道交通、装备制造和电子信息等应用领域相继涌现出一批优质供应商,如美林数据、酷特智能、天泽智云、明匠智能等,它们在工业数据资源管理、设备预测性维护、智能车间和工厂等领域做出了大量有益探索。2017年以来,工业互联网的蓬勃发展,工业云和工业APP等应用的日益丰富,进一步为工业大数据的应用创造了有利环境。

工业不同领域的数字化水平差异大。整体而言,离散型行业数字化水平全面领先于流程型行业。流程型企业多采用规模化生产方式,生产工艺复杂,生产过程不间断,控制生产工艺流程的自动化设备比较完善。当前,多数流程型制造业企业已实现高度自动化管控,以机械运作代替人工操作,生产车间的人员主要负责管理、监视和设备检修。现有体系的稳定可靠导致流程型行业推进数字化转型动力不足。离散型企业的生产过程涉及庞大的供应链体系,经常会面临供应链协同管理难,研发设计效率低,产品质量难以保证,以及异地多工厂协同难等问题。通过应用工业大数据和移动互联网等技术,离散型行业可以有效解决上述问题,搭建起全新的生产、服务和协作模式,实现降本、提质和增效。

工业大数据的主要应用场景涉及智能研发设计、智能生产制造、智能服务和网络协同服务四大类:智能研发设计,基于客户端的反馈数据及客户交易数据,深入挖掘客户动态需求,让客户参与到产品设计中,实现产品定制化设计模式;利用大数据开展仿真,将产品全生命周期数据进行采集、建模分析,实现对原有研发设计环节的模拟、分析、评估、验证和优化,减少工程更改量,达到前期设计风险的规避,提升产品设计迭代速度和研发效率。

智能生产制造,在生产环节,对采集数据进行清洗、挖掘等操作,利用数据关联分析和数据反馈指导生产,实现从数据到知识的转化;在制造环节,对生产工艺过程参数、资源状态、产品质检数据、产品能耗数据等实时数据进行检测和关联分析,为发现的问题提供及时的解决方案,合理制定计划排程,实现库存精准管理等。通过落地智能生产制造,一批智能产线、智能车间和智能工厂不断涌现,推动了工业的高质量发展和转型升级。

智能服务,在市场营销环节,利用数据寻找用户深层动态需求和市场动向,落地精准营销和销售预测等服务,以此来指导生产和营销工作,减少产品存货量,提升企业整体运营能力;在售后服务环节,通过整合产品运行数据,将传统故障诊断方法与数字技术相结合,开展故障预警、远程监控及运维、质量诊断等应用,推动企业从“被动服务、定期服务”向“主动服务、实时服务”转变,提供智能化增值服务,形成“制造+服务”的新模式。

网络协同服务,在企业内部,通过整合分析企业各环节数据,促进业务、决策、运营等流程的优化,提升企业管理决策的科学性和运营管理能力。在企业外部,采集挖掘供应链数据,实现供应链可视化,优化物流路径和排程调度,提升供应协同效率。通過连通不同区域的生产资源,实现制造资源、制造能力、制造过程等信息透明,促进供需对接,提升产业链上下游资源整合能力,达到资源协同。

健康医疗大数据市场处于

待爆发阶段,应用热点多

健康医疗大数据细分领域的数据量大、增长速度快,数据价值量高,应用场景多,未来发展潜力大。当前,这一细分领域处于市场待爆发阶段,应用热点频出。

区域数据中心建设:2016年以来,国家卫健委明确了江苏、福建、安徽、山东、贵州为健康医疗大数据中心国家试点省份,指导各试点立足实际,强化规划引导,以平台建设为基础,有序推动健康医疗大数据区域中心建设。

辅助诊疗:在该领域,基于肿瘤大数据的应用热度最高。受医疗数据的安全、数据合规和权属等问题影响,目前市场上较成熟的模式是建立国家级肿瘤病例库,联合健康医疗大数据企业、医疗机构、国家卫生部门等多方,协作开展重大疾病大数据课题研究。神州医疗在该细分领域具备较强的技术实力和资源。

电子病历:我国医疗信息化建设正在从医院管理信息化(HIS)向临床信息系统(CIS)和区域医疗卫生服务(GMIS)迈进。目前,以CIS为中心的医疗信息化建设是市场发展重点。2018年9月,国家卫健委发布通知,推动电子病历评级和广义电子病历建设,百亿级电子病历市场亟待爆发。

医药研发:真实世界研究(RWS)是对临床常规产生的真实世界数据进行系统性收集和分析的研究。真实世界数据涵盖电子病历数据、医保数据、智能终端数据,以及社交媒体数据等,收集并分析这些数据将有助于探究药物在尚未获批的疾病及人群中的疗效,从而为上市后药物扩大适应证提供可能。

医疗影像:医疗影像数据量大,应用场景丰富。医疗影像云和基于AI的医疗影像识别渐成热点,这两方面也是当前人工智能技术在医疗领域最成熟的场景。

基因大数据:随着基因测序技术发展、测序成本不断下降,国家支持力度不断提高,学术界在基因领域的研究日益深入,基因数据持续累积,海量生命组学大数据储存、整合与分析挖掘,以及相关共享平台的搭建,具有良好的发展前景。

健康管理:越来越多个人用户意识到健康管理的重要性,主动健康管理服务成为趋势,个性化、定制化的健康管理服务的市场需求快速升高。

医疗云:2018年以来,云服务商通过与医疗信息化企业合作,大力开拓医疗云市场,百度与东软、阿里与卫宁健康、腾讯与东华软件、华为与智业软件等合作为医疗云市场提供了较好的模式范本。

消费医疗:在to B领域,针对医疗机构提供数据服务,如精准营销和商业智能等;在to C领域,针对消费者提供数据服务,如消费者评价和药品信息追溯等。

医疗物联网:一方面是以患者服务为中心的护理和后勤等应用服务,包括体征监测、移动护理等;另一方面是以医院人、财、物为中心的保障和行政业务管理,包括人员管理、输液管理和资产管理等。