三分钟搞懂深度学习：物体的识别和检测，以“找椅子”为例-选购指南-厨具导购-中华厨房电器用具批发网

本文将介绍定义问题的方式，以及我解决问题的方式。

为什么选择“椅子问题”？

问题简单化：在清晰的图像中进行“椅子识别”

进一步的挑战：找到椅子的位置

一个先进的“对象识别”技术——yolo概述

将yolo应用于“椅子识别”

面临的挑战以及未来将采取的步骤

为什么选择“椅子问题”？

首先我将阐述我为什么想要在一张照片中“数椅子”。

在analytics vidhya的办公室里，通常会有10到15个人。但到了夏天，实习生们就会“涌入”我们的办公室。所以，如果我们要在夏天开全员大会，我们就必须要从其他房间里拉出所有空的椅子。

我是一个特别懒的人，所以我想，有没有一种算法能够直接告诉我们哪间房间有空闲的椅子。这样一来，我们就不用挨个房间找椅子了，省时又省力。

这看上去是个再简单不过的问题，但我可以用它来尝试我获得的新技能。深度学习能够解决这个问题吗？老实说，我也不确定深度学习究竟能不能用来解决这一问题，但是试一下总没有坏处，不是吗？

问题中需完成的任务

既然你已经了解了我们需要解决的问题，那么接下来我会向你介绍我解决问题的过程。我会把这个问题分解为四个不同的任务——

假如我们有一个房间的视频资源，那么在视频中有没有出现一把椅子？

如果视频中出现了椅子，那么这把椅子在房间的什么位置呢？

这把椅子是否被占用了？如果有未被占用的椅子，那么未被占用的椅子数量是多少呢？

我们应该从哪间房间里搬空椅子？

我决定先解决一个相对简单的问题，然后再尝试解决更复杂的问题。循序渐进，一步步达到我的目标。这也是我将这个问题分解为四个不同的任务的原因。在本文，我将详细介绍前两个任务的完成过程；在后续文章中，我会继续介绍后两个任务的完成过程。

问题简单化：在清晰的图像中进行“椅子识别”

解决“椅子问题”的第一步，也是最简单的一步，就是判断图片中的房间内是否有椅子。现在，我将这个问题进一步简化——我将网络对视频资源的需求忽略，给网络输入了我拍摄的几张照片。

假设我给你两张照片，你能告诉我哪一张照片中有椅子吗？

答案是第一张，而你究竟是怎么知道的呢？

因为你见过椅子很多很多次了，所以对你来说判断图片里有没有椅子并不难。换言之，你对于现实中的椅子长什么样已经有了了解。同样的，我们可以训练一个神经网络，让网络帮我们完成这个识别的工作。

顺便提一下，我们之所以使用神经网络而不用其他的算法，是因为神经网络是在图像处理问题方面最强大、最先进的技术。

所以，我将一个经过imagenet数据集预训练的神经网络应用到这些图像上。

但是当我让模型识别图像中的对象时，出现了一个问题——它不能准确地分别图像中的对象。例如，下图是模型针对图像的输出结果。

[[（'n03179701', 'desk', 0.56483036），（'n03337140', 'file', 0.14689149），（'n04550184', 'wardrobe', 0.03918023）]]

它将图片中的“椅子”错误地判断成了“书桌”。这样的结果实在令人很失望，因为书桌和椅子的相似度不高，按理来说是非常容易区分的。

解决“椅子还是书桌”的问题

正如我在之前的文章中提到的，每当我在建立神经网络时遇到问题，我就会逐步解决这个问题。我会将每个步骤列成一个清单：

第一步：检查网络架构

第二步：检查神经网络的超参数

第三步：检查网络的复杂性

第四步：检查输入数据的结构

第五步：检查数据的分布

在一番检查评估之后，我发现模型的图像输入是不正确的，因为我没有正确地处理图像的纵横比例。所以，为了解决这个问题，我添加了一个自定义代码，该自定义代码之前在github上的一个keras问题中出现过。更新的图像如下图：

[[（'n02791124', 'barber_chair', 0.77817303），（'n03179701', 'desk', 0.090379775），（'n03337140', 'file', 0.033129346）]]

处理完这个问题以后，模型就能开始正常地工作，输出正确的结果了。

进一步的挑战：找到椅子的位置

现在，我们已经判断出了图像中有一把椅子，那么接下来我们就要识别这把椅子在什么位置。除了这把椅子，我们还要识别出图像中的人。我们需要通过识别这个人来判断这把椅子是否被占用了。这两个任务（任务二和任务三）将有助于我们解决和处理更大的任务，判断作这把椅子是否被占用了。

与前面的任务一样，我们将使用一个预训练的网络，这个网络将给我们提供一个可接受的分数。目前，yolo网络是“对象检测”的最佳模型，它能够实时地展示相当不错的性能。在本文，我对yolo网络做了简单的介绍。下面，我们来看看如何利用yolo解决这个问题。

使用yolo进行“椅子检测”

在系统中设置yolo网络，我们可以按照以下简单的步骤：

第一步：

git clone https://github.com/pjreddie/darknet

cd darknet

make

第二步：

wget https://pjreddie.com/media/files/yolo.weights

用yolo来解决我们的问题，你需要输入以下指令，并且提供你自己图像的位置

./darknet detect cfg/yolo.cfg yolo.weights //data/image.jpg

在我们的图像上应用了yolo之后，我发现其结果非常不错。下面是一些例子：

面临的挑战以及未来将采取的步骤

虽然开端进展得非常顺利，但是仍然有问题会阻碍这个项目的发展。以下是其中一些问题：

问题一：这个yolo模型还是会出现一些错误，它并不是一个100%正确的模型。比如，在下面的这张图片中，一个垃圾桶竟然被错误地识别成了一个人！

问题二：如果在一张图像中，一把椅子挡住了另外一把椅子，算法还能识别出这把被挡住的椅子吗？这是个值得思考的问题。

除了这些可能出现的问题之外，还有一些更加实际的细节需要考虑，比如说，算法推荐一个解决方案需要多长时间？算法需要运行什么类型的硬件？等等。这些都是在把算法作为商品出售之前需要考虑和解决的问题。

同样，像之前所说的，在这篇文章中只讨论前面两个任务，还没有涉及到后面两个任务。那么，接下来的任务就是计算出房间内的椅子数量，然后建立起一个“端到端”的产品。

尾注

本文内容涵盖了图像中的“物体检测和识别”，其中的物体就是“椅子”。针对物体识别，我们用了一个简单的预训练的模型来识别图像中的物体。另一方面，针对物体检测，我们使用了yolo网络——一项非常先进的对象实时检测技术。

转载：中国机器人网（原始来源：评论：0）

以上是网络信息转载，信息真实性自行斟酌。

• 银都冰箱银都二门平台冷冻柜	• hecmac制冰机hic-36-acb海克冰块机海克冰块机
• 伸缩保温灯单头挂式保温灯自助餐升降食物保温灯产品	• 银都冰箱银都二门平台冷藏柜直冷1.8米长700宽操作台铜
• 杰冠燃气烧烤炉烧烤炉 gb-580燃气无烟烧烤炉图片及产	• 伸缩保温灯单头挂式保温灯自助餐升降食物保温灯产品
• 感恩有你！火星人“收官之战”完美收官！(千科集成灶	• 爱尔卡集成厨电：听说有99%的父母都忽略了厨房教育(集
• 火星一号集成灶感恩节分享(火星人集成灶广告词)	• 普森集成灶终端服务督察千里行(集成灶十大品牌排名有

三分钟搞懂深度学习：物体的识别和检测，以“找椅子”为例

手机浏览本文

微信公众号