机器学习算法产生的、能用来识别模式的数据都可以称为"大数据"
广泛匹配
广泛匹配(General Matching)是人工智能领域的一个重要术语。它表示两个或多个数据源之间存在大量的相似性或相关性,即多个输入变量可以用于描述同一组输出结果;或者说一个模型能够同时解释来自不同数据的多种不同的特征信息,并且这种能力随着样本数量的增加而增强。
广义来说:任何通过机器学习算法产生的、能用来识别模式的数据都可以称为"大数据"。因此,我们通常所说的大数据是指包含大量非结构化信息的数据库中的海量记录和存储在云服务器中并经过处理后可供分析使用的各种类型的大规模数据集。例如,社交媒体网站上的所有用户评论以及网络搜索的结果等等都是典型的例子。(注1)
由于这些数据具有高度的不确定性和复杂性,使得传统的方法无法有效地对其进行分析和理解。为了解决这一问题,深度学习应运而生。所谓深度神经网络技术就是基于机器学习的原理对大规模的海量历史数据分析进行建模的过程。
目前,大多数的计算机视觉研究都集中在图像分类上,但事实上,对于人类而言,"人脸识别技术"并不是一项新技术了——早在19世纪中期就由法国生物学家Louis Bernard Lorentz提出过相关概念。19世纪末20世纪初的时候,人们就已经开始尝试用人工方法来区分照片中人脸的性别或者年龄等信息了。但是直到上世纪80年代初期才出现了真正意义上的面部识别系统—美国科学家H.Mccarthy于1983年研制出世界上第一具商用型的人脸自动识别装置。此后,该领域的研发工作得到了迅速的发展与完善,并在1990年代初达到了顶峰时期,当时全世界范围内有近100家公司在从事这项技术的应用开发和研究工作。
如今看来,当时的这套系统虽然已经非常实用且有效,但它还是存在着一定的缺陷。首先是由于人眼的分辨率有限导致其难以准确判断被摄物体的形状大小及距离等参数值。另外一方面是因为人的大脑需要不断的学习才能掌握一套完整的知识体系从而做出正确的反应。然而,当使用现有的硬件设备去模拟人类的认知过程时却会出现很多的问题。比如,如果将一张图片直接投影到屏幕上的话就会因为光线不足而导致画面质量不佳等问题出现。此外还可能出现诸如噪声干扰等情况的出现,进而影响到识别的效果和质量。所以,想要实现真正的实时动态人像识别就需要借助一些新的技术和手段来实现。于是乎,以卷积层为基本单元的人工智能技术在这种情况下便逐渐浮出了水面。
简单来讲,所谓的卷积计算就是在给定的训练条件下,利用一系列隐含状态的连续采样点作为初始像素来进行运算的一种计算方法,最终目的是得到一幅带有若干个隐藏状态点的灰度图象。
具体地讲就是通过不断地重复某个操作步骤来达到某种目的的方式叫做卷积计算法。根据这个定义可以看出,其实卷积计算的实质就是一种迭代式学习方法。也就是说它的核心思想是通过多次的操作达到相同的目的。那么为什么说它是迭代式的?这是因为每次操作之前都会先进行一次预判,然后按照预先设定好的规则依次执行各个操作以达到预期的目标。
当然,这里说的仅仅是简单的数学公式而已,实际上在实际运用过程中还会涉及到更多的因素影响最终的结论判定。比如说环境的光线条件是否良好,周围是否有噪音污染等因素的影响。
不过不管怎么说,从理论上来看只要有了合适的场景就可以完成一次有效的识别任务!下面让我们一起来欣赏一下几张比较经典的案例吧~