当前位置：首页 > news >正文

搭建AlexNet神经网络，并搭建自己的图像分类训练和测试的模板，模板通用！！！均有详细注释。

news 2024/10/23 0:08:30

本文任务：

1、构建AlexNet神经网络。

2、搭建图像分类训练和测试的通用模板。

3、训练出自己的模型。

4、验证模型效果。

论文地址：原文地址http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

一、AlexNet神经网络介绍

1、网络结构

2、网络参数

3、Dropout操作

4、图像增强方法

5、LRN正则化（局部归一化）

6、总结

二、代码实现AlexNet神经网络

1、构建AlexNet神经网络

2、搭建图像分类训练的通用模板

3、搭建图像分类测试的通用模板

4、训练出自己的模型

5、验证模型效果

三、调试好的源码

一、AlexNet神经网络介绍

1、网络结构

由八层组成：五个卷积层、两个全连接隐藏层、一个全连接层。

AlexNet使用ReLU而不是sigmoid作为其激活函数。

2、网络参数

3、Dropout操作

作用：为了防止神经网络过拟合，提高了模型准确度

4、图像增强方法

水平翻转：增加数据集，防止过拟合。

随机裁剪：大量增加数据集的量，防止过拟合，使网络更加健壮。

PCA图像增强：增加数据集。

5、LRN正则化（局部归一化）

6、总结

二、代码实现AlexNet神经网络

我的项目目录结构：

其中，fashion_data文件夹是我们的数据集，这个数据集是PyTorch中自带的数据集，大家直接运行我下面的model_train.py就可以自动下载，或者大家也可以自行下载，model文件夹是我用来存放训练好的模型的，这个大家可以自行设置存放路径。

以下代码均有详细注释，所以不在这里讲解。

1、构建AlexNet神经网络

model.py

import torch
import torch.nn as nn
from torchsummary import summary
import torch.nn.functional as Fclass AlexNet(nn.Module):def __init__(self, num_classes=1000):super(AlexNet, self).__init__()self.model = nn.Sequential(nn.Conv2d(1, 96, kernel_size=11, stride=4), # 卷积操作nn.ReLU(), # 激活函数nn.MaxPool2d(kernel_size=3, stride=2), # 最大池化nn.Conv2d(96, 256, kernel_size=5, padding=2, stride=1),nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),nn.Conv2d(256, 384, kernel_size=3, padding=1, stride=1),nn.ReLU(),nn.Conv2d(384, 384, kernel_size=3, padding=1, stride=1),nn.ReLU(),nn.Conv2d(384, 256, kernel_size=3, padding=1, stride=1),nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),nn.Flatten(), # 平展操作nn.Linear(9216, 4096), # 线性nn.ReLU(),nn.Dropout(0.5), # 防止过拟合nn.Linear(4096, 4096),nn.ReLU(),nn.Dropout(0.5),nn.Linear(4096, 10))def forward(self, x):x = self.model(x)return xif __name__ == '__main__':device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')model = AlexNet()print(model)

2、搭建图像分类训练的通用模板

model_train.py

import copy
import timeimport torch
from torch.utils.data import DataLoader
from torchvision import transforms
from torchvision.datasets import FashionMNIST
import numpy as np
import matplotlib.pyplot as plt
from model import AlexNet
import torch.utils.data as Data
import torch.nn as nn
import pandas as pd# 加载数据集
def train_val_data_process():train_data = FashionMNIST(root='./fashion_data',train=True,download=True,transform=transforms.Compose([transforms.Resize(size=227), transforms.ToTensor()]))# 划分数据集train_data, val_data = Data.random_split(train_data, [round(0.8 * len(train_data)), round(0.2 * len(train_data))])train_loader = Data.DataLoader(dataset=train_data, batch_size=128, shuffle=True, num_workers=0)val_loader = Data.DataLoader(dataset=val_data, batch_size=128, shuffle=True, num_workers=0)return train_loader, val_loader# 训练过程
def train_model_process(model, train_loader, val_loader, epochs):device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 定义优化器,使用Adam优化器，学习率为0.001optimizer = torch.optim.Adam(model.parameters(), lr=0.001)# 交叉熵损失函数loss_fn = nn.CrossEntropyLoss()# 将模型放入到训练设备当中model = model.to(device)# 复制当前模型的参数best_model_wts = copy.deepcopy(model.state_dict())# 初始化参数# 初始化精度best_acc = 0.0# 保存训练集loss值的列表train_loss_all = []# 保存验证集loss值的列表val_loss_all = []# 保存训练集精度的列表train_acc_all = []# 保存验证集精度的列表val_acc_all = []# 保存当前时间since = time.time()for epoch in range(epochs):print('Epoch {}/{}'.format(epoch + 1, epochs))print('-' * 10)# 初始化参数# 训练集train_loss = 0.0train_acc = 0.0# 验证集val_loss = 0.0val_acc = 0.0# 训练集的样本数量train_num = 0# 验证集的样本数量val_num = 0# 对每一个batch进行训练for step, (images, labels) in enumerate(train_loader):# 将特征和标签放到gpu中images, labels = images.to(device), labels.to(device)# 设置模型为训练模式model.train()# 将数据放入到模型当中,向前传播过程，输入为一个batch，输出为一个batch中对应的预测outputs = model(images)# 查找每一行中最大值对应的行标pre_labels = torch.argmax(outputs, dim=1)# 计算损失loss = loss_fn(outputs, labels)# 将梯度清0optimizer.zero_grad()# 反向传播计算loss.backward()# 根据网络反向传播的梯度信息来更新网络的参数，以起到降低loss函数计算值的作用optimizer.step()# 对损失函数进行累加train_loss += loss.item() * images.size(0)# 计算准确的数量train_acc += torch.sum(pre_labels == labels.data)# 当前用于训练的样本数量train_num += images.size(0)# 验证开始with torch.no_grad():for step, (images, labels) in enumerate(val_loader):# 将特征和标签放到gpu中images, labels = images.to(device), labels.to(device)# 设置模型为验证模式model.eval()# 前向传播outputs = model(images)# 查找每一行中最大值对应的行标pre_labels = torch.argmax(outputs, dim=1)# 计算损失loss = loss_fn(outputs, labels)# 对损失函数进行累加val_loss += loss.item() * images.size(0)# 计算准确的数量val_acc += torch.sum(pre_labels == labels.data)# 当前用于验证的样本数量val_num += images.size(0)# 计算每一次迭代的loss值和准确率train_loss_all.append(train_loss / train_num)train_acc_all.append(train_acc.double().item() / train_num)val_loss_all.append(val_loss / val_num)val_acc_all.append(val_acc.double().item() / val_num)# 打印出每轮的训练损失值和训练准确率print('{} Train Loss: {:.4f} Train Acc: {:.4f}'.format(epoch + 1, train_loss_all[-1], train_acc_all[-1]))# 打印出每轮的验证损失值和验证准确率print('{} Val Loss: {:.4f} Val Acc: {:.4f}'.format(epoch + 1, val_loss_all[-1], val_acc_all[-1]))# 寻找最高准确度的权重if val_acc_all[-1] > best_acc:best_acc = val_acc_all[-1]# 保存当前的最优参数best_model_wts = copy.deepcopy(model.state_dict())# 计算该轮次训练所花费的时间time_used = time.time() - sinceprint('训练和验证花费的时间：{:.0f}m{:.0f}s'.format(time_used // 60, time_used % 60))# 选择最优模型# 加载最优的模型参数torch.save(best_model_wts, './model/AlexNet_model.pth')# 训练过程的数据train_process = pd.DataFrame(data={'epoch': range(epochs),'train_loss_all': train_loss_all,'train_acc_all': train_acc_all,'val_loss_all': val_loss_all,'val_acc_all': val_acc_all})return train_process# 画图
def matplot_acc_loss(train_process):plt.figure(figsize=(12, 4))plt.subplot(1, 2, 1) # 一行两列的第一张图# loss图plt.plot(train_process['epoch'], train_process['train_loss_all'], 'ro-', label='train loss')plt.plot(train_process['epoch'], train_process['val_loss_all'], 'bs-', label='val loss')plt.legend()plt.xlabel('Epoch')plt.ylabel('Loss')plt.subplot(1, 2, 2) # 一行两列的第二张图plt.plot(train_process['epoch'], train_process['train_acc_all'], 'ro-', label='train acc')plt.plot(train_process['epoch'], train_process['val_acc_all'], 'bs-',label='val acc')plt.legend()plt.xlabel('Epoch')plt.ylabel('Accuracy')plt.show()if __name__ == '__main__':# 将模型实例化leNet = AlexNet()train_loader, val_loader = train_val_data_process()train_process = train_model_process(leNet, train_loader, val_loader, 20)matplot_acc_loss(train_process)

3、搭建图像分类测试的通用模板

model_test.py

import torch
from torchvision import transforms
import torchvision
import torch.utils.data as Data
from torchvision.datasets import FashionMNIST
from model import AlexNet# 加载测试集
def test_val_data_process():test_data = FashionMNIST(root='./fashion_data',train=False,download=True,transform=transforms.Compose([transforms.Resize(size=227), transforms.ToTensor()]))test_loader = Data.DataLoader(dataset=test_data, batch_size=1, shuffle=True, num_workers=0)return test_loader# 开始测试模型
def test_model_process(model, test_loader):# 设置测试环境device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 将模型放入到gpu中model = model.to(device)# 初始化参数# 模型的测试精度test_accuracy = 0.0# 用来记录测试次数test_num = 0# 只进行前向传播，不计算梯度，从而节省内存，加快运算速度with torch.no_grad():for images, labels in test_loader:# 加载数据集到gpu中images, labels = images.to(device), labels.to(device)# 设置模型为评估模式model.eval()# 进行前向传播output = model(images)# 查找最大值对应的行标pred_lab = output.argmax(dim=1, keepdim=True)# 计算测试正确的数据个数test_accuracy += torch.sum(pred_lab == labels.data)# 计算测试样本总数test_num += images.size(0)# 计算准确率test_acc = test_accuracy.double() / test_numprint("测试的准确率为：",test_acc)return test_accif __name__ == '__main__':model = AlexNet()model.load_state_dict(torch.load('./model/AlexNet_model.pth'))test_loader = test_val_data_process()test_acc = test_model_process(model, test_loader)