浅谈机器学习及其在智能数码产品中的应用

2018-12-22郭若宇广州外国语学校

数码世界 2018年8期

郭若宇广州外国语学校

1.前言

1997年5月3日国际象棋世界冠军卡斯帕罗夫与IBM超级电脑“深蓝”展开首次“人机大战”，以一胜二负三和的战绩败北。2016年、2017年人工智能围棋程序“AlphaGo”先后两次战胜围棋届顶尖高手韩国的李世石与中国的柯洁对战。由于计算机超强的运算能力是人类无法企及的，从这个意义上来说，“AlphaGo”的胜利是计算能力和算法的胜利。就像代表人类出战的中国围棋职业九段棋手柯洁以0：3完败于“AlphaGo”之后感慨的“人类是会犯错的，而机器不会犯错”。

随着现代科技日新月异的快速发展，智能手机、智能穿戴设备等智能数码产品已经成为我们生活中的重要组成部分，而且由于性能的不断提升使得产品的更新换代速度越来越快，性价比也越来越高，这一切都可归因于20多年来以机器学习为核心的人工智能技术的飞跃式发展。

2.机器学习的概念及分类

2.1 机器学习的概念

“AlphaGo”的出现让“人工智能（Artificial Intelligence）”和“机器学习（Machine Learning）”前所未有地为大众所熟知。在多数人看来，二者之间可以划等号，都指可以代替人类工作的先进生产力，事实并非如此。人工智能指的是以人工方式制造具有或类似“人类智能”的机器，而机器学习指的是使电脑或其它数码产品在人工编程之外自主运作的能力，它是人工智能的核心，是使计算机或其它数码产品实现“像人类一样思考、判断并解决问题”的能力的途径，其应用遍及人工智能的各个领域：数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA测序、语音和手写识别、战略游戏和机器人运用等，体现在普通人生活中的就是数码产品上层出不穷的App应用，让我们的生活越来越便捷和舒适。

2.2 机器学习的分类

由于训练方法和应用领域的不同，机器学习主要分为监督学习、半监督学习、无监督学习和强化学习等四种类型。机器学习必须是建立在海量数据的基础之上，

（1）监督学习（Supervised Learning）

监督学习又被称为“有老师的学习”，所谓的老师就是事物特征对应的标签，比如水果的颜色、形状、味道和香气等。监督学习的过程为先通过已知的训练样本（如已知输入和对应的输出）来训练，从而得到一个最优模型，再将这个模型应用在新的数据上，映射为输出结果。再经过这样的过程后，模型就有了预知能力。比如小朋友第一次看见苹果和桔子两种水果，老师告诉他（她）哪种是苹果，哪种是桔子，并且从形状、颜色、味道和香气等方面加以解释，下一次小朋友再看见这两种水果后就能进行准确的分辨，这是监督学习。当在人工智能中，监督学习主要被应用于快速高效地教受AI 现有的知识。例如多次打败围棋世界冠军的“AlphaGo”，就是利用监督学习来“记忆理解”上千万盘的人类对弈棋谱，通过人类输入的“现成的”信息来进行学习的。

（2）无监督学习（Unsupervised Learning）

无监督学习被称为“没有老师的学习”，和监督学习相比，是没有“老师指导”的训练过程，而是直接拿数据进行建模分析，意味着这些都是要通过机器自行学习后探索事物间的关系或规律。还是以第一次看见苹果和桔子两种水果的小朋友为例，这一次没人告诉他（她）哪个是苹果哪个是桔子，但小朋友根据他们的形状、颜色、味道和香气等特征的不同鉴别出这是两种不同的水果，并对特征归类，这是无监督学习。在人类探索认识世界的过程中经常会用到无监督学习，这是人类文明发展进步的重要力量。无监督学习说起来比监督学习更难一点，因为这个过程非常像老师没讲知识点就给我们一堆没有答案的习题，然后让我们自己做，看我们能不能从中学到什么。和监督学习相比，无监督学习相当于在黑暗中摸索，存在耗时长以及学习效果不佳的问题。

（3）半监督学习（Semi-Supervised Learning）

目前海量存在的网页分类、文本分类、基因序列比对、蛋白质功能预测、语音识别和计算机视觉等数据大部分属于无标签数据，只有极少一部分数据通过特殊设备或经过昂贵且用时非常长的实验过程获得标签，这种大量无标签数据和少量标签数据共存的情况催生了半监督学习，即将大量的无类标签的样例加入到有限的有类标签的样本中一起训练来进行学习，期望能对学习性能起到改进的作用。对于半监督学习，其训练数据的一部分是有标签的，另一部分没有标签，而没标签数据的数量常常极大于有标签数据数量（这也是符合现实情况的），通过一些有标签数据的局部特征，以及更多没标签数据的整体分布，就可以得到可以接受甚至是非常好的分类结果。在AI咨询公司Joostware工作Delip Rao构建了一个使用半监督学习的解决方案，每个类中只需使用30个标签，就可以达到与使用监督学习训练的模型相同的准确度，而在这个监督学习模型中，每个类中需要1360个左右的标签。因此，这个半监督学习方案使得他们的客户能够非常快地将其预测功能从20个类别扩展到110个类别。半监督学习避免了数据和资源的浪费，同时解决了监督学习的模型泛化能力不强和无监督学习的模型不精确等问题.

（4）强化学习（Reinforcement Learning）

强化学习是指机器自身收集环境中的相关信息作出判断，并综合成自己的“经验”。它有点像平时老师让我们用学到的知识去解决某些答案并不确定的复杂问题，例如我们在学习数学的过程中，老师分别讲解了三角、圆、矩形等多个单元的知识点后，将相关的知识点揉在一起出一个综合题来考察我们解决问题的能力。再以海洋馆常见的海豚跳圈表演为例，假设海豚在平时的训练中已经掌握了跳一个圈的能力（顺利完成动作会得到食物奖赏），现在训练师想让它完成更复杂的动作，比如增加呼啦圈的数量、改变呼啦圈的位置等，并且每次完成一个既定目标就可以获得相应的食物奖赏，而且奖赏的丰富程度与动作的复杂程度相匹配，这样经过多次“训练-失败-没奖赏”、“训练-成功-奖赏”的“强化学习” 之后，海豚就可以自如地进行表演了。AlphaGo 利用监督学习参照人类的走法大致学会了预测下一步，但是缺乏实战经验，于是计算机科学家让两个非监督学习下建立的AlphaGo 互相下棋并不断调整，保留胜方的模式和参数，经过3000 万盘强化训练后，AlphaGo 便通过“左右互搏”提高了“实战能力”。强化学习这一方法背后的数学原理，与监督/ 非监督学习略有差异。监督/非监督学习更多地应用了统计学，而强化学习更多地结合了离散数学、随机过程这些数学方法。

3.机器学习的基石--云数据

机器学习是基于海量的有标签或无标签的数据的，不管是什么领域，只要呈现充足的数据并经过适当的训练就可以自动识别里面的规律，进行分类、预测等。比如我们在网络购物时就会发现，购物网站会根据我们之前的购物行为大致判断出我们的购物喜好，从而自动推荐一些我们喜欢的商品供我们参考，由此可见，随着我们购物次数的增加，在网上积累的相关数据就越多，个人的购物特征就会越来越清晰。与此同时，对大量消费者的购物特征数据加以集中和强化学习，就又可以增强机器判断的本领，比如性别、年龄、收入水平和家庭结构等对购物行为的影响，进而给购物网站的经营者带来更多更有用的信息，提高网站的盈利能力。这就是机器学习的本质。

机器学习的发展与云计算的普及几乎同步，其原因在于云应用程序、平台和基础设施的无缝集成将信息孤岛打破，把各个组织及其网络的数据都吸引进来，为机器学习所用。机器学习所基于的算法需要尽可能多的、来自不同领域的数据。聚集的数据量越多，它就会变得越聪明，其决策潜能也就越大。机器学习的基础是数据的掌握和应用。如果拥有更多的数据并且有更强的数据处理和分析的能力，机器学习的效果就更好，甚至可以超出人类的水平，甲骨文公司提出自治的云平台的概念，这个概念就像无人驾驶汽车一样，将一些局部的应用结合成为一个整体，成为一个基于机器学习的无人干预的云平台。

4.机器学习在智能数码产品中的应用

4.1 机器学习在智能手机中的应用技术

Strategy Analytics近期发布的研究报告指出，全球今年销售的智能手机每三台就有一台使用基于人工智能（AI）的虚拟助手，而且基于设备的机器学习功能会大大提高智能手机AI的运行速度。机器学习技术已经被应用到智能手机的各类应用中。最为著名的是智能手机上的“Siri”和Cortana（微软小娜）等虚拟手机助手，可以帮助你管理日程，设置闹钟、打电话、发信息、打开应用、搜索、导航、翻译，并回答你的任何问题。还能根据你的喜好，主动推送专属于你的定制信息。此外还有许多新颖的智能App被不断研发出来，如饮食助手APP“Bitesnap”，可以通过拍照识别饭菜并计算它的热量营养,协助用户进行热量摄入控制，更有效地执行用户的膳食计划。当你碰到喜欢的东西，但不知道产品的商业信息时，一款名为“拍立淘”的软件可以大显身手，通过这个应用对感兴趣的物品进行拍照，我们很快便会在阿里系的购物网站上获得该物品的信息，目前拍立淘的适用商品基本覆盖了消费者的所有需求，包括男女装、鞋包、配饰到瓶饮、日用品、化妆品等等。讯飞输入法APP是一款可以识别方言的语音输入法，不仅支持粤语、英语、普通话识别，还支持客家话、四川话、河南话、东北话、天津话、湖南(长沙)话、山东（济南）话、湖北（武汉）话、安徽（合肥）话、江西（南昌）话、闽南语、陕西（西安）话、江苏（南京）话、山西（太原）话、上海话等方言识别，具有强大的语音识别效果，语音识别率超过95%。形色APP是一款识别花卉、分享附近花卉的APP应用。可以一秒就能识别植物，支持识别4千种植物，准确率高达82%，可以在1～5秒内给出花名，App内部也有识花大师帮忙鉴定植物，地图上更有特色植物景点攻略。综上，上述智能App的开发和应用就是源于大数据的机器学习的结果。2018年3月6日下午，芯片厂商ARM在北京举办发布会上公布了4款新GPU，分别为Mali-G52、Mali-G32、Mali-D51和Mali-V52，在最重要的机器学习能力上，Mali-G52是上一代产品的3.6倍，这意味着绝大多数智能设备在未来都能拥有机器学习能力。

4.2 机器学习在智能穿戴设备中的应用技术

现代社会文明的快速发展，使得人们追求“健康生活”的愿望日益强烈，人们比以往更加关注自己的身体健康，在这种背景之下，以实时监测血液、心脏及运动能耗等生理指标的智能穿戴产品应运而生，如智能手环、智能手表、智能眼镜等，我们的体力活动、位置以及身体生理数据等每一点变化都成为了可被记录和分析的数据。基于加速度探测技术的智能可穿戴设备，通过加速度传感器探测人体身体活动的加速度，再依靠一系列算法估算人体体力活动的能量消耗，为我们的健康饮食和运动方式提供大量的数字化信息。2017年11月美国斯坦福医院就宣布和苹果合作，通过iWatch对心率的监测探索是否能对房颤等心脏病进行预警。苹果公司通过软件采集人体生理数据，基于机器学习算法对光电反射传感器采集的心率大数据，针对于该用户进行自适应的个性化心律曲线分析，并针对该用户建立相匹配的心律状况评价函数，实时分析出用户心律状况，区分心脏节律与其他杂音，从而发现心律异常等问题并将信息发送到苹果手机上并进行心律异常状况预测和预警。微软公司也在2017年Build大会上则展示了一款可以识别帕金森患者颤抖频率的手环，并通过同样频率的颤抖帮助帕金森患者写字。通过不断地进行多种形式的机器学习，智能穿戴设备有望给我们的生活带来不断的惊喜。以睡眠为例，手环对体征的监测完全可以被融入到物联网的大话题下，手环把监测到的数据和历史数据进行对比和分析，得出“用户最近的睡眠质量差”的判断，可以直接推荐用户购买褪黑素等保健产品以及针对性的生活方式方面的个性化建议。比如智能球拍在进行大量的“机器学习”锻炼后，就可以记录用户手臂的运动轨迹并进行分析，通过震动的方式矫正用户运动姿势。