使用 Fast ai 进行图像分类

资讯 2年前

1.19K

介绍从头开始训练深度学习模型可能是一项乏味的任务。你必须找到正确的训练权重，获得最佳学习率，找到最佳超参数以及最适合你的数据和模型的架构。再加上没有足够的质量数据来训练，以及它需要的计算强度会对我们的资源造成严重损失，这些因素在第一轮就把你击倒

介绍

从头开始训练深度学习模型可能是一项乏味的任务。你必须找到正确的训练权重，获得最佳学习率，找到最佳超参数以及最适合你的数据和模型的架构。再加上没有足够的质量数据来训练，以及它需要的计算强度会对我们的资源造成严重损失，这些因素在第一轮就把你击倒。但不要害怕，因为 Fast．ai 等深度学习库会充当我们强有力的助手，让你立即重返赛场。

1. Fast．ai概述

2. 我们为什么要使用 Fast．ai？

· 图像数据包

· LR 查找

· fit＿one＿cycle

3. 案例研究：紧急与非紧急车辆分类

Fast．ai概述

Fast．ai 是建立在 PyTorch 之上的流行深度学习框架。它旨在通过几行代码快速轻松地构建最先进的模型。它极大地简化了深度学习模型的训练过程，而不会影响训练模型的速度、灵活性和性能。Fast．ai 也支持计算机视觉和 NLP 中最先进的技术和模型。

我们为什么要使用 Fast．ai？

除了 Fast．ai 模型的高生产力和易用性之外，它还确保了我们能够自定义高级 API 而无需干预较低级的 API。Fast．ai 还包含一些非常酷的功能，使其成为初学者最喜欢的深度学习库之一。

图像数据包

图像数据包有助于汇集我们的训练、验证和测试数据，并通过执行所有必需的转换和标准化图像数据来处理数据。

LR 查找

学习率会影响我们的模型学习和适应问题的速度。低学习率会减慢训练过程的收敛速度，而高学习率会导致性能出现令人不快的分歧。

因此，良好的学习率对于模型的令人满意的性能至关重要，而找到最佳学习率就像大海捞针一样。Fast．ai 的“lr＿find（）”是我们的骑士，它将我们从寻找合适学习率的痛苦中解救出来。

recorder．plot（）

lr＿find（）的工作原理是最初使用非常低的学习率来训练小批量数据并计算损失。然后它以比前一个稍高的学习率训练下一个小批量。这个过程一直持续到我们到达一个合适的学习率。我们可以使用 recorder．plot（）来获取学习率与 Loss 的图，这简化了选择良好的学习率的任务。选择学习率的依据是哪个学习率为我们的损失提供了最陡的斜率，而不是哪个学习率的损失最低。

fit＿one＿cycle

fit＿one＿cycle 方法实现了循环学习率的概念。在这种方法中，我们使用在最小和最大界限值之间波动的学习率，而不是使用固定或指数下降的学习率。

循环学习率。训练神经网络的循环学习率－ https：／／arxiv．org／pdf／1506．01186．pdf

CLR 中的每个循环由 2 个步骤组成，其中学习率从最小值增加到最大值，下一步反之亦然。假设最佳学习率位于所选的最小值和最大值之间。这里，步长表示用于增加或减少每一步的学习率的迭代次数。

我们使用循环学习率，通过循环数来拟合我们的模型。学习率在训练期间的每个循环中在所选的最小学习率到最大学习率之间振荡。CLR 的使用消除了我们的训练模型陷入鞍点的可能性。

fit＿one＿cycle 方法还实现了学习率 Annealing 的概念，我们在最后几次迭代中使用减少的 LR。最后一次迭代的学习率通常取为所选最小学习率的百分之一。这可以防止在我们接近它时超出最优值。

案例研究：紧急与非紧急车辆分类

让我们尝试使用 Fast．ai 在 Imagenets 数据集中使用预训练的 Resnet50 模型解决紧急与非紧急车辆分类问题。

导入模块

from fastai．vision import ＊

from fastai．vision．models import resnet50

使用 ImageDataBunch 进行数据增强

tfms ＝ get＿transforms（do＿flip＝True， flip＿vert＝True， max＿rotate＝50， max＿lighting＝0．1， max＿warp＝0 ）

data ＝ ImageDataBunch．from＿df（＇／content／drive／MyDrive／CV＿Vehicle＿classification／train＿data／images＇， train， ds＿tfms＝tfms， label＿delim＝ None， valid＿pct＝0．2， fn＿col＝0， label＿col＝1 ， size＝299，bs＝64）．normalize（imagenet＿stats）

模型训练

t＿cnn1 ＝ cnn＿learner（data， resnet50， pretrained＝True， metrics＝［accuracy］）

t＿cnn1．fit＿one＿cycle（5）

最初，让我们使用fit＿one＿cycle 训练我们的模型 5 个时期。这是为了了解模型的工作原理。