深度学习入门教程：分类猫和狗|image|入门教程|应用程序

本文将一步步建立和训练一个深度学习模型，以达到分类猫和狗的目的。阅读者只要有一些高中数学基础和python编程经验就足够了！

1.安装程序

为了简单起见，我们将在云GPU(什么是GPU)上运行模型。可以通过以下链接了解GPU在深度学习中的重要性：https://towardsdatascience.com/what-is-a-gpu-and-do-you-need-one-in-deep-learning-718b9597aa0d 。

有很多服务提供免费和付费的云GPU实例。我们将使用Gradient，它提供免费的GPU和CPU实例层。我们也将使用fast.ai的vision库来创建模型。

首先点击这里创建一个Gradient帐户:https://console.paperspace.com/signup?gradient=true ；
登录你的帐户并选择“Gradient”；
单击“Notebook”；
为实例命名(可选)；
选择Paperspace + Fast.AI基本容器；

选择任意一个免费的GPU实例；

单击“Create Notebook”；

你的Notebook 将从挂起→设置→运行！

单击“OPEN V1(CLASSIC)”按钮；

对于这个模型，我们将从Bing和DuckDuckGo上获取图像，它们将作为数据集。我们将安装Joe Dockrill编写的jmd_imagescraper库，这将为我们完成任务。

单击 New →Terminal。

键入并单击enter：

!pipinstall-qjmd_imagescraper

有关库的更多信息，请访问其官方页面：https://joedockrill.github.io/blog/2020/09/18/jmd-imagescraper-library/

这把我们带到了设置的最后。关闭终端，再次打开Notebook。编码时间到了！

Jupyter Notebook

Jupyter Notebook是一个web应用程序，允许你创建包含实时代码、公式和文本的文档。你可以做任何事情，从编写代码到发布，以及使用Voilá构建独立的web应用程序！我们将在Gradient提供的Jupyter Notebook上编写和执行代码。

Jupyter Notebook由许多单元组成，可以通过确定执行单元格的顺序来控制工作流。

单击New→Python3打开一个新的Notebook。

你可以编写文本(在标记单元格中)或编写python代码(在代码单元格中)并按如下方式执行：

使用Run和add cells选项分别执行代码和添加更多单元格。

2.代码

可以把每个代码块复制到不同的单元上，然后运行它们。

我们先导入fast.ai的vision库和jmd_imagescraper。

!pipinstall-Uqqfastbookimportfastbook#导入fast.ai库fromfastbookimport*#别担心，它被设计成与import*一起工作fastbook.setup_book()fromfastai.vision.widgetsimport*#导入图片爬取器,website:https://joedockrill.github.io/blog/2020/09/18/jmd-imagescraper-library/fromjmd_imagescraper.coreimport*frompathlibimportPathfromjmd_imagescraper.imagecleanerimport*

因为我们的目标是对猫和狗的图像进行分类，所以可以建立一个名为“animals”的文件夹，我们可以下载并保存图像。

最后一行将path变量设置为当前工作目录中的“animals”文件夹。

animals=['cat','dog']path=Path().cwd()/"animals"#指定当前工作目录的路径

从jmd_imagescraper库调用duckduckgo_search()函数，该函数接受以下内容作为输入：

下载目录(上面指定的路径变量)；
文件夹名称(cat)；
搜索DuckDuckGo(“猫”)的关键字；
要下载的图像数(100)。

duckduckgo_search(path,"cat","cats",max_results=100)#下载100张“猫”图片并保存到path/cat中

等到它搜索图像，下载并直接保存到“animals”中名为“cat”的文件夹中。结果应该如下所示：

现在让我们对狗的图像做同样的处理。

duckduckgo_search(path,"dog","dogs",max_results=100)#下载100张“狗”图片并保存到path/dog中

通常会有一些不相关的图像，这会妨碍训练，所以我们删除个别文件。Jupyter提供了一个删除无关图像的交互式GUI。

display_image_cleaner(path)

在文件夹之间切换并删除不相关的图像。我发现一些像这样的图片偷偷地进入了猫和狗的系列。

fns=get_image_files(path)fns

查找失败的下载并从文件夹中取消链接。

failed=verify_images(fns)#寻找非图像文件failed

failed.map(Path.unlink);#从文件夹中取消失败文件的链接

现在让我们创建一个Datablock对象，它将图像发送到DataLoaders类。DataLoaders类将给定的数据转换为学习者可以解释的信息。

直觉上，学习者是一个观察所有给定图像并找到模式的人。如果遇到复杂的关键字，不要担心，一旦你运行模型，一切都会变得有意义。

animals=DataBlock(blocks=(ImageBlock,CategoryBlock),get_items=get_image_files,splitter=RandomSplitter(valid_pct=0.2,seed=42),#将数据集拆分为训练集和验证集get_y=parent_label,item_tfms=RandomResizedCrop(224,min_scale=0.5),batch_tfms=aug_transforms())

需要注意的是在第4行中，我们保留了20%的数据，以便在每个称为epoch训练结束时检查模型。

创建一个名为dls的DataLoaders对象。

dls=animals.dataloaders(path)

看看dls对象中单个批处理中的几个图像。

dls.valid.show_batch(max_n=4,nrows=1)