松材线虫目标检测数据集,12522张图-纯手工标注
松材线虫目标检测数据集,12522张图像,专家纯手工标注。
松材线虫目标检测数据集
数据集描述
该数据集是一个专门用于松材线虫(Bursaphelenchus xylophilus)检测的数据集,旨在帮助研究人员和开发者训练和评估基于深度学习的目标检测模型。松材线虫是一种严重危害松树的害虫,能够导致松树枯萎病,对森林生态系统造成重大影响。该数据集包含了大量的高分辨率图像,并且所有标注都是通过纯手工完成,确保了高质量的标注信息。
数据规模
- 总样本数量:12,522张图像
- 数据量:具体大小未提供
- 标注格式:默认VOC格式XML标注或YOLO格式
- 目标类别:
- 松材线虫
图像特性
- 高分辨率影像:图像为高分辨率,确保细节清晰。
- 多样化场景:覆盖了不同类型的松树、不同的光照条件以及各种背景环境下的松材线虫情况。
- 高质量手工标注:每张图像都有详细的边界框标注,支持直接用于训练目标检测模型。
- 真实拍摄:所有图像均为实际拍摄的真实场景,增强了模型在实际应用中的鲁棒性。
应用场景
- 林业监测:通过自动检测松材线虫,辅助林业部门及时发现和处理受感染的树木,防止病害扩散。
- 智能农业:集成到智能农业系统中,实时监测林木健康状况,提高林业管理效率。
- 科研分析:用于研究目标检测算法在特定生物识别任务中的应用,特别是在复杂自然环境下的表现。
- 环境保护:通过早期检测和预警,减少松材线虫对森林生态系统的破坏,保护生态环境。
数据集结构
典型的数据集目录结构如下
1pine_wilt_nematode_dataset/
2├── images/
3│ ├── img_00001.jpg
4│ ├── img_00002.jpg
5│ └── ...
6├── annotations/
7│ ├── img_00001.xml
8│ ├── img_00002.xml
9│ └── ...
10└── README.md # 数据集说明文件
示例代码
以下是一个使用Python和相关库(如OpenCV、PIL等)来加载和展示数据集的简单示例代码:
1import os
2import cv2
3import numpy as np
4from PIL import Image
5import xml.etree.ElementTree as ET
6
7# 数据集路径
8dataset_path = 'path/to/pine_wilt_nematode_dataset/'
9
10# 加载图像和边界框标注
11def load_image_and_boxes(image_path, annotation_path):
12 # 读取图像
13 image = Image.open(image_path).convert('RGB')
14
15 # 解析VOC标注文件
16 tree = ET.parse(annotation_path)
17 root = tree.getroot()
18 boxes = []
19 for obj in root.findall('object'):
20 class_name = obj.find('name').text
21 bbox = obj.find('bndbox')
22 xmin = int(bbox.find('xmin').text)
23 ymin = int(bbox.find('ymin').text)
24 xmax = int(bbox.find('xmax').text)
25 ymax = int(bbox.find('ymax').text)
26 boxes.append([class_name, xmin, ymin, xmax, ymax])
27 return image, boxes
28
29# 展示图像和边界框
30def show_image_with_boxes(image, boxes):
31 img = np.array(image)
32 for box in boxes:
33 class_name, xmin, ymin, xmax, ymax = box
34 cv2.rectangle(img, (xmin, ymin), (xmax, ymax), (0, 255, 0), 2)
35 label = f'{class_name}'
36 cv2.putText(img, label, (xmin, ymin - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
37
38 cv2.imshow('Image with Boxes', img)
39 cv2.waitKey(0)
40 cv2.destroyAllWindows()
41
42# 主函数
43if __name__ == "__main__":
44 images_dir = os.path.join(dataset_path, 'images')
45 annotations_dir = os.path.join(dataset_path, 'annotations')
46
47 # 获取图像列表
48 image_files = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
49
50 # 随机选择一张图像
51 selected_image = np.random.choice(image_files)
52 image_path = os.path.join(images_dir, selected_image)
53 annotation_path = os.path.join(annotations_dir, selected_image.replace('.jpg', '.xml'))
54
55 # 加载图像和边界框
56 image, boxes = load_image_and_boxes(image_path, annotation_path)
57
58 # 展示带有边界框的图像
59 show_image_with_boxes(image, boxes)
这段代码展示了如何加载图像和其对应的边界框标注文件,并在图像上绘制边界框。您可以根据实际需求进一步扩展和修改这段代码,以适应您的具体应用场景。
示例代码:使用预训练模型进行推理
以下是使用预训练模型进行推理的示例代码。这里我们假设您使用的是基于YOLOv5的模型,但您可以根据需要选择其他支持目标检测的模型。
1import torch
2import cv2
3import numpy as np
4from PIL import Image
5import yolov5 # 请确保已安装yolov5库
6
7# 数据集路径
8dataset_path = 'path/to/pine_wilt_nematode_dataset/'
9
10# 加载预训练模型
11model = yolov5.load('path/to/pretrained/yolov5_weights.pt') # 替换成实际的预训练模型路径
12model.eval()
13
14# 主函数
15if __name__ == "__main__":
16 images_dir = os.path.join(dataset_path, 'images')
17
18 # 获取图像列表
19 image_files = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
20
21 # 随机选择一张图像
22 selected_image = np.random.choice(image_files)
23 image_path = os.path.join(images_dir, selected_image)
24
25 # 读取并预处理图像
26 image = Image.open(image_path).convert('RGB')
27
28 # 使用预训练模型进行推理
29 results = model(image)
30
31 # 处理预测结果
32 boxes = results.xyxy[0].cpu().numpy()
33
34 # 在图像上绘制边界框
35 img = np.array(image)
36 for box in boxes:
37 xmin, ymin, xmax, ymax, conf, class_id = box
38 class_name = results.names[int(class_id)]
39 label = f'{class_name} {conf:.2f}'
40 cv2.rectangle(img, (int(xmin), int(ymin)), (int(xmax), int(ymax)), (0, 255, 0), 2)
41 cv2.putText(img, label, (int(xmin), int(ymin) - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
42
43 # 显示结果
44 cv2.imshow('Image with Boxes', img)
45 cv2.waitKey(0)
46 cv2.destroyAllWindows()
这段代码展示了如何使用预训练的YOLOv5模型进行推理,并显示和保存推理结果。您可以根据实际需求进一步扩展和修改这段代码,以适应您的具体应用场景。如果您需要使用其他模型进行更高级的功能,如模型微调或增量训练,可以参考相应模型的官方文档来进行相应的配置和操作。