一文详解计算机视觉与深度学习的应用
全球汽车快讯 据外媒报道,当人们看风景或看图像时,他(她)们能够理解看到的内容——风景或照片内的目标。若该行为正在进行中,那么会发生什么呢?而一台计算机则仅能处理用于描述各像素颜色值的数字数据。对于某个人而言,从凌乱的桌面上识别出一块披萨,可谓毫不费力
全球汽车快讯 据外媒报道,当人们看风景或看图像时,他(她)们能够理解看到的内容——风景或照片内的目标。
若该行为正在进行中,那么会发生什么呢?而一台计算机则仅能处理用于描述各像素颜色值的数字数据。
对于某个人而言,从凌乱的桌面上识别出一块披萨,可谓毫不费力。但直到如今,计算机却无法执行这类任务。
计算机视觉(简称:CV)可帮助一台计算机从视觉输入中选出重要的信息,然后基于该信息进行精准的预测并提出建议。
计算机视觉的工作原理是?
在计算机视觉诞生之前,为创建一个程序来识别特殊的图像,某人需要耗费数小时的时间,来手动完成这类繁琐的工作。
首先,需要核对一个相似图像的数据库。然后,不得不人工分析、测量这类图像,当研究人员或许能识别存疑的目标时,标注相关的数据(如:颜色、测量值及形状)。当时,或许只有软件能被用于预测工作。
而计算机视觉则采用深度学习这类机器学习方法,自动完成上述的所有流程。
深度学习采用了多层神经元网络,其含有数百个潜在的层级。若遇到图像,则通常采用一个卷积神经元网络(convolutional neural network,CNN)。
详细解释深度学习和神经元网络的工作原理已远超本文的内容范畴。从本质上讲,就是向神经元网络送入大量的数据。然后,神经元网络会反复分析数据,直到能做出精准的预测为止。
以用于某个计算机视觉的卷积神经元网络为例,神经元网络将通过多个步骤来取得数据。首先,神经元网络将图像拆解为多个部分(单个像素或预先标注过的像素组)。
然后,对不同部分的图像(如:硬边缘或特定目标)进行预测。神经元网络还会反复检查其预测结果的准确性,每次都会对算法进行微调,直至其变得极为精准。
如今,计算机的功能变得极为强大,相较于人脑,前者对图像的分析速度更快。当其学会识别特定模式后,情况就更是如此了。为此,深度学习算法或将远超人类的能力,这一点不难看出。
计算机视觉的类型有哪些呢?
计算机视觉涉及对图像的分析与理解、对图像相关预测或决策的输出。为实现这类目标,计算机视觉有各类不同的任务,如下:
图像分类:识别图像的类型。例如,分辨是人脸、景色还是目标。这类任务常被用于迅速识别图像并予以分类。该技术的一项用途是自动识别并屏蔽社交媒体上的“不健康”内容。
目标识别:类似于图像分类,目标识别可识别某个场景内的特定目标——如:从凌乱的桌面上识别出一块披萨。
边缘检测:计算机视觉技术的常见用法,通常是目标检测的第一步,该技术可识别图像内的硬边缘。
目标标识:这指的是对某个目标物或图像中的个别例子进行识别,例如:标注某个特定的人、指纹或车辆。
目标检测:目标检测指的是识别某张图片内的特定特征进行标识,例如:X光片中的骨折。
目标分割:指的是识别图像中的哪个像素属于存疑的目标。
目标追踪:在一段视频序列中,在识别某个目标后,可轻松在整段视频中追溯到该目标。
图像复原:在精准标识图像中的目标物与背景后,可移除图像中的模糊、噪点及其他图像伪影。
计算机视觉的应用示例
人工智能技术已被用于多个行业,并产生了惊人的影响。计算机视觉技术也同样如此。以下是计算机视觉在当下的几个应用示例。
面部识别
面部识别是当今计算机视觉的主要应用方式之一。当对已知面部图像数据库进行照片比对时,计算机视觉算法可精准地识别个人。
社交媒体分析图像并自动为经过一轮图像筛选后的用户贴标
笔记本电脑、电话和安全设备可对人们的身份加以识别,并给予合规人员使用权限。
执法人员在闭路电池系统内使用面部识别来确定嫌疑人的身份。
医药
目前,计算机视觉被用于医疗保健行业,旨在为患者提供更快捷、更精准的诊断,其诊断结果甚至远胜于医学专家。
该技术的诸多应用还涉及:对X光、计算机断层扫描或核磁共振影像进行分析并用于筛查神经系统病症、肿瘤、骨裂或骨折等特定疾病。
自动驾驶汽车
自动驾驶汽车需要对车辆周边环境进行了解,以便确保驾驶安全性。这意味着需要识别道路、车道、交通信号灯、其他车辆、行人等。
上述所有任务均能利用计算机视觉系统进行实时探查,从而规避碰撞事故并确保驾驶安全性。
计算机视觉充满挑战性
当前计算机视觉的应用已开始向我们涉及的各行各业渗透。从能够探查故障设备或破损设备到精准地诊断出癌症,计算机视觉有能力提升各系统的能力并挽救生命。
但是,该技术也绝非没有挑战。计算机视觉仍远不及人眼视觉。我们人类进化了数千年,从而使我们能够识别并了解几乎实时发生在我们身边的所有事情。然而,我们仍不清楚人脑是如何执行这类任务的。
深度学习是在正确道路/方向上迈出的一大步,但仍需要海量的工作量来创建一个系统,以确保该系统能执行人类轻松搞定的任务,例如:识别道路上的某辆汽车。然而,研发一台可理解视觉世界所有复杂性的计算机却完全是另外一码事了。
在人工智能应用和人类生物学方面还需要进行更多的研究,我们希望能在不久的将来看到计算机视觉技术的可应用领域呈现爆发式增长。(本文为编译作品,所用英文原文和图片选自makeuseof)