Javatpoint标志
Javatpoint标志

PyTorch图像识别MNIST数据集

在本主题中,我们将讨论一种新的数据集类型,我们将在图像识别.这个数据集被称为MNIST数据集.MNIST数据集可以在网上找到,它本质上只是一个各种手写数字的数据库。MNIST数据集拥有大量数据,通常用于演示深度神经网络的真正力量。

假设我们有下图:

PyTorch图像识别MNIST数据集

当我们看到图像时,我们的大脑和眼睛一起工作,将这张图像识别为第8张。我们的大脑是一个非常强大的工具,它能够非常快速地将这张图像分类为8。一个数字有很多形状,我们的大脑可以很容易地识别这些形状并确定它是什么数字,但这个任务对计算机来说并不是那么简单。只有一种方法可以做到这一点,那就是使用深度神经网络,它可以让我们训练计算机有效地对手写数字进行分类。

到目前为止,我们只处理了包含简单数据点的数据笛卡尔坐标系.从开始到现在,我们一直在处理二进制类数据集。现在,我们将使用多类数据集,当我们使用多类数据集时,我们将使用Softmax输出层的激活函数而不是sigmoid函数。sigmoid激活函数对于分类二进制数据集非常有用,它在排列0到1之间的概率值时非常有效。sigmoid函数对于多类数据集是无效的,为此,我们使用Softmax激活函数,能够处理它。

MNIST数据集是一个多类数据集,由10个类别组成,我们可以将数字从0到9进行分类。我们之前使用的数据集和MNIST数据集之间的主要区别是MNIST数据输入神经网络的方法。

在感知器模型和线性回归模型中,每个数据点都由简单的X和Y坐标定义。这意味着输入层需要两个节点来输入单个数据点。

在MNIST数据集中,单个数据点以图像的形式出现。这些包含在MNIST数据集中的图像通常为28*28像素,其中横轴为28像素,纵轴为28像素。这意味着来自MNIST数据库的一张图像总共有784个像素,必须进行分析。我们的神经网络的输入层有784个节点来分析这些图像中的一张。

PyTorch图像识别MNIST数据集

由于额外的输入节点和增加的类别,数字可以分类为0到9。很明显,我们的数据集比我们之前分析的任何数据集都要复杂。为了对该数据集进行分类,需要一个深度神经网络和一些隐藏层的有效性。

在我们的深度神经网络中,输入层有784个节点,一些隐藏层前馈输入值,最后在输出层中有10个节点对应每个手写数字。这些值通过网络输入,输出层中输出最高激活值的节点识别字母或数字。







Youtube 观看视频请加入我们的Youtube频道:现在加入

反馈


帮助他人,请分享

脸谱网 推特 pinterest

学习最新教程


准备


热门的技术


B.Tech / MCA






Baidu
map