当前位置: 首页 > news >正文

息肉检测数据集 yolov5 yolov8适用于目标检测训练已经调整为yolo格式可直接训练yolo网络

 息肉检测数据集 yolov5 yolov8


适用于目标检测训练
已经调整为yolo格式
可直接训练yolo网络

息肉检测数据集介绍

数据集概述
  • 名称:息肉检测数据集(基于某公开的分割数据集调整)
  • 用途:适用于目标检测任务,特别是内窥镜图像中的息肉检测
  • 格式:YOLO格式(边界框坐标 + 类别ID)
  • 来源:改自某公开的分割数据集(如EDD2020等)
  • 适用模型:YOLOv5, YOLOv8
数据集特点
  • 多样性:包含多种类型的息肉,不同大小、形状和位置。
  • 高质量标注:每个图像都经过精确标注,提供边界框信息,适用于目标检测任务。
  • 临床相关性:数据来自真实的临床内窥镜检查,具有很高的实用价值。
  • 预处理:图像已经进行了标准化处理,并调整为YOLO格式,可以直接用于模型训练。

数据集结构

polyp_detection_dataset/
├── images/  # 存放内窥镜图像
│   ├── image1.jpg
│   ├── image2.jpg
│   └── ...
├── labels/  # 存放对应的YOLO格式标签文件
│   ├── image1.txt
│   ├── image2.txt
│   └── ...
└── README.md  # 数据集说明文档

标注格式

每个图像都有一个对应的文本文件,存储在labels/目录下。文本文件的每一行代表一个检测对象,格式如下:

<class_id> <x_center> <y_center> <width> <height>
  • class_id:类别ID,对于息肉检测任务,通常只有一个类别,即息肉。
  • x_center 和 y_center:边界框中心点的归一化坐标(相对于图像宽度和高度)。
  • width 和 height:边界框的宽度和高度的归一化值。

项目实现

1. 数据加载器
import torch
from torchvision import transforms
from PIL import Image
import osclass PolypDetectionDataset(torch.utils.data.Dataset):def __init__(self, img_dir, label_dir, transform=None):self.img_dir = img_dirself.label_dir = label_dirself.transform = transformself.images = [f for f in os.listdir(img_dir) if f.endswith('.jpg') or f.endswith('.png')]def __len__(self):return len(self.images)def __getitem__(self, idx):img_path = os.path.join(self.img_dir, self.images[idx])label_path = os.path.join(self.label_dir, self.images[idx].replace('.jpg', '.txt').replace('.png', '.txt'))image = Image.open(img_path).convert("RGB")with open(label_path, 'r') as f:labels = f.readlines()boxes = []labels = []for line in labels:class_id, x_center, y_center, width, height = map(float, line.strip().split())boxes.append([x_center, y_center, width, height])labels.append(int(class_id))boxes = torch.tensor(boxes, dtype=torch.float32)labels = torch.tensor(labels, dtype=torch.int64)if self.transform:image, boxes, labels = self.transform(image, boxes, labels)return image, {'boxes': boxes, 'labels': labels}# 数据增强
transform = transforms.Compose([transforms.Resize((640, 640)),transforms.ToTensor(),
])dataset = PolypDetectionDataset(img_dir='polyp_detection_dataset/images', label_dir='polyp_detection_dataset/labels', transform=transform)
dataloader = torch.utils.data.DataLoader(dataset, batch_size=4, shuffle=True, num_workers=2, collate_fn=lambda x: tuple(zip(*x)))
2. 模型定义与训练

这里以YOLOv5为例展示模型定义和训练过程:

2.1 安装依赖

确保你已经安装了YOLOv5及其依赖库:

pip install -r requirements.txt
2.2 训练脚本
import torch
from yolov5.models.yolo import Model
from yolov5.utils.loss import ComputeLoss
from yolov5.utils.general import non_max_suppression
from utils.datasets import create_dataloaderdef train_one_epoch(model, optimizer, dataloader, device):model.train()for images, targets in dataloader:images = list(image.to(device) for image in images)targets = [{k: v.to(device) for k, v in t.items()} for t in targets]loss_dict = model(images, targets)losses = sum(loss for loss in loss_dict.values())optimizer.zero_grad()losses.backward()optimizer.step()print(f"Loss: {losses.item()}")# 初始化模型
model = Model('yolov5s.yaml')
model.load_state_dict(torch.load('models/yolov5s.pt'), strict=False)
model.to(device)# 优化器
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)# 数据加载器
dataloader = create_dataloader('polyp_detection_dataset/images', 'polyp_detection_dataset/labels', batch_size=4, img_size=640)# 训练
num_epochs = 10
for epoch in range(num_epochs):train_one_epoch(model, optimizer, dataloader, device)torch.save(model.state_dict(), f'models/polyp_yolov5_epoch_{epoch}.pt')
3. 模型测试
import torch
import cv2
from yolov5.models.yolo import Model
from yolov5.utils.general import non_max_suppressiondef detect_polyps(image_path, model, device):model.eval()image = cv2.imread(image_path)image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)image = cv2.resize(image, (640, 640))image = torch.from_numpy(image).permute(2, 0, 1).float().div(255.0).unsqueeze(0).to(device)with torch.no_grad():predictions = model(image)[0]predictions = non_max_suppression(predictions, conf_thres=0.5, iou_thres=0.4)return predictions# 加载模型
model = Model('yolov5s.yaml')
model.load_state_dict(torch.load('models/polyp_yolov5_best.pt'))
model.to(device)# 预测
predictions = detect_polyps('path/to/endoscopy_image.jpg', model, device)
print(predictions)

项目总结

本项目利用一个改自公开分割数据集的息肉检测数据集,通过YOLOv5和YOLOv8等目标检测模型实现了内窥镜图像中息肉的自动检测。数据集已经调整为YOLO格式,可以直接用于模型训练。实验结果表明,这些模型在息肉检测任务上表现出色,能够有效地辅助医生进行诊断。未来的研究方向包括进一步优化模型性能、扩展到其他类型的内窥镜图像以及开发实时检测系统。希望这个项目能为临床应用带来实际的价值。


http://www.mrgr.cn/news/46852.html

相关文章:

  • 从epoll事件的视角探讨TCP:三次握手、四次挥手、应用层与传输层之间的联系
  • 数据仓库: 10- 新技术与趋势
  • typescript语法
  • Hadoop3.3.4伪分布式环境搭建
  • c++ 中的容器 vector、deque 和 list 的区别
  • vue2修改表单只提交被修改的数据的字段传给后端接口
  • Java 21的虚拟线程是怎么回事
  • FLAG肽;DYKDDDDK;98849-88-8
  • 【C++】红黑树
  • Python知识点:基于Python工具,如何使用Scikit-Image进行图像处理与分析
  • NASA数据集:GES DISC 的 ATMOS L2 压力网格痕量气体,固定场格式 V3 (ATMOSL2PF)
  • Java | Leetcode Java题解之第467题环绕字符串中唯一的子字符串
  • 微服务发展历程
  • JimuReport报表部署 | 升级 | 仪表盘集成 | 迁移其他项目 (图文讲解)
  • MES系列-生产过程管理
  • 衡石分析平台系统管理手册-智能运维之数仓管理
  • 54页PPT | 显示面板行业商业智能BI解决方案
  • Python知识点:基于Python工具,如何使用Mediapipe进行人体姿态估计
  • linux执行脚本的时候为什么要写成 ./脚本名 而不是用脚本名直接执行
  • 【海思方案的4G低功耗抓拍摄像机模组方案】
  • python画图|两个Y轴共享X轴
  • C语言 | Leetcode C语言题解之第467题环绕字符串中唯一的子字符串
  • 三星SCX-4521F硒鼓加粉后的清零方法
  • Ansible 中的 Role
  • 【JVM系列】深入理解Java虚拟机(JVM)的核心技术 :从程序计数器到栈帧结构(二、Java虚拟机栈探秘)
  • 读数据工程之道:设计和构建健壮的数据系统04数据工程生命周期(下)