当前位置: 首页 > news >正文

建筑裂缝检测图像ai模型训练数据集

共52w例图像的建筑裂缝检测图像ai模型训练数据集


20 地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下 SOC 设施(公路/铁路隧道、地铁、水隧道);韩国40 个市、县、区 SOC 设施的数据,并考虑多样性分布;10种裂纹/缺陷(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)。数据集使用拍摄设备直接采集,主要记录灾害安全环境525000例格式为jpg;标签数据以折线和多边形记录525000例,格式为json;图片说明10000例。

项目背景:

建筑裂缝检测是基础设施维护和安全管理中的重要环节。裂缝不仅影响建筑物的美观,更重要的是会威胁到结构的安全性和使用寿命。传统的人工检查方法不仅效率低下,还可能因为人为因素而遗漏重要细节。随着计算机视觉技术的进步,利用AI模型进行自动裂缝检测已成为一种趋势。本数据集旨在为建筑裂缝检测提供高质量的标注数据,支持自动化检测系统的开发与应用。

数据集概述:

  • 名称:建筑裂缝检测图像AI模型训练数据集
  • 规模:共计525,000张图像
  • 设施类型:涵盖地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下SOC设施(公路/铁路隧道、地铁、水隧道)
  • 地域分布:来自韩国40个市、县、区的SOC设施数据
  • 缺陷类型:包含10种裂纹/缺陷类型(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)
  • 数据格式:图像格式为.jpg,标签数据以折线和多边形记录,格式为.json
  • 图片说明:包含10,000例图像说明

数据集特点:
  1. 全面性:涵盖多种设施类型和地域,确保数据集的多样性和实用性。
  2. 高质量标注:每张图像都已详细标注,确保数据的准确性和可靠性。
  3. 适用范围广:适用于多种深度学习框架,方便科研人员和开发者直接使用。
  4. 标准格式:采用广泛使用的.jpg图像格式和.json标签格式,方便导入不同的检测框架。
数据集内容:

  • 裂纹(Crack):标注了建筑表面的裂纹。
  • 网状裂纹(Hairline Cracks):标注了建筑表面的细小裂纹网络。
  • 分层(Delamination):标注了建筑表面的分层缺陷。
  • 剥落(Spalling):标注了建筑表面的剥落区域。
  • 泛白(Efflorescence):标注了建筑表面的泛白现象。
  • 漏水(Leakage):标注了建筑表面的漏水点。
  • 钢筋外露(Exposed Rebar):标注了建筑表面的钢筋外露情况。
  • 材料分离(Material Separation):标注了建筑表面的材料分离情况。
  • 提升(Heave):标注了建筑表面的提升缺陷。
  • 损坏(Damage):标注了建筑表面的损坏情况。
数据集用途:
  1. 缺陷检测:可用于训练和评估深度学习模型,特别是在建筑裂缝检测方面。
  2. 质量控制:帮助实现建筑设施的安全管理,减少人工检测的工作量。
  3. 科研与教育:为建筑裂缝检测领域的研究和教学提供丰富的数据支持。
使用场景:
  1. 自动化检测:在基础设施巡检中,利用该数据集训练的模型可以自动识别建筑裂缝。
  2. 质量控制:在质量控制系统中,利用该数据集可以提高检测的准确性和速度。
  3. 生产管理:在建设和维护管理工作中,利用该数据集可以提高工作效率和安全性。
技术指标:
  • 数据量:共计525,000张图像,覆盖多种建筑裂缝类型。
  • 数据划分:考虑到地域和设施类型的多样性分布。
  • 标注格式:标签数据以折线和多边形记录,格式为.json,方便导入不同的检测框架。
  • 标注精度:所有图像均已详细标注,确保数据的准确性和可靠性。
注意事项:
  • 数据隐私:在使用过程中,请确保遵守相关法律法规,保护个人隐私。
  • 数据预处理:在使用前,建议进行一定的数据预处理,如图像归一化等。
获取方式:
  • 下载链接:请访问项目主页获取数据集下载链接。
  • 许可证:请仔细阅读数据集的使用许可协议。
关键代码示例:

以下是关键代码的示例,包括数据加载、模型训练、检测和结果展示。

数据加载:
1import os
2import cv2
3import numpy as np
4import json
5
6# 数据集路径
7DATASET_PATH = 'path/to/dataset'
8IMAGES_DIR = os.path.join(DATASET_PATH, 'images')
9LABELS_DIR = os.path.join(DATASET_PATH, 'labels')
10
11# 加载数据集
12def load_dataset(directory):
13    images = []
14    labels = []
15
16    for img_file in os.listdir(IMAGES_DIR):
17        if img_file.endswith('.jpg'):
18            img_path = os.path.join(IMAGES_DIR, img_file)
19            label_path = os.path.join(LABELS_DIR, img_file.replace('.jpg', '.json'))
20            
21            image = cv2.imread(img_path)
22            with open(label_path, 'r') as f:
23                label = json.load(f)
24            
25            images.append(image)
26            labels.append(label)
27
28    return images, labels
29
30train_images, train_labels = load_dataset(os.path.join(DATASET_PATH, 'train'))
31val_images, val_labels = load_dataset(os.path.join(DATASET_PATH, 'val'))
32test_images, test_labels = load_dataset(os.path.join(DATASET_PATH, 'test'))
模型训练:
1# 初始化YOLOv8模型
2model = YOLO('yolov8n.pt')
3
4# 定义训练参数
5EPOCHS = 100
6BATCH_SIZE = 16
7
8# 训练模型
9results = model.train(data='crack_detection.yaml', epochs=EPOCHS, batch=BATCH_SIZE)
模型检测:
1# 加载训练好的模型
2model = YOLO('best.pt')
3
4# 检测图像
5def detect_cracks(image):
6    results = model.predict(image)
7    for result in results:
8        boxes = result.boxes
9        for box in boxes:
10            x1, y1, x2, y2 = box.xyxy[0]
11            conf = box.conf
12            class_id = box.cls
13            
14            # 显示结果
15            cv2.rectangle(image, (int(x1), int(y1)), (int(x2), int(y2)), (0, 255, 0), 2)
16            cv2.putText(image, f'Class: {class_id}, Conf: {conf:.2f}', (int(x1), int(y1)-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
17    
18    return image
19
20# 测试图像
21test_image = cv2.imread('path/to/test_image.jpg')
22result_image = detect_cracks(test_image)
23cv2.imshow('Detected Cracks', result_image)
24cv2.waitKey(0)
25cv2.destroyAllWindows()
配置文件 crack_detection.yaml
1train: path/to/train/images
2val: path/to/val/images
3test: path/to/test/images
4
5nc: 10  # Number of classes
6names: ['Crack', 'Hairline Cracks', 'Delamination', 'Spalling', 'Efflorescence', 'Leakage', 'Exposed Rebar', 'Material Separation', 'Heave', 'Damage']  # Class names
7
8# Training parameters
9batch_size: 16
10epochs: 100
11img_size: [640, 640]  # Image size
使用指南:
  1. 数据准备:确保数据集路径正确,并且数据集已准备好。
  2. 模型训练:运行训练脚本,等待训练完成。
  3. 模型检测:使用训练好的模型进行检测,并查看检测结果。
结语:

本数据集提供了一个高质量的建筑裂缝检测图像数据集,支持自动化检测、质量控制等多个应用场景。通过利用该数据集训练的模型,可以提高裂缝检测的效率和准确性。


http://www.mrgr.cn/news/27920.html

相关文章:

  • 【jvm】一个空Object对象的占多大空间
  • WEB服务器实现(药品商超)
  • Zabbix Server More than 75% used in the configuration cache
  • hive alter table add columns 是否使用 cascade 的方案
  • Flutter开发之flutter_local_notifications
  • Hadoop + Hive + Apache Ranger 源码编译记录
  • 利用Python在Win10环境下实现拨号上网
  • PHP环境搭建
  • 解码 OpenAI 的 o1 系列大型语言模型
  • Linux查看自己公网IP
  • java 网络编程URL与URLConnection的使用
  • AIGC实战——多模态模型Flamingo
  • 使用EXPORT_SYMBOL
  • Python编程 - 异常处理与文件读写
  • 拒绝低效!开发者必备AI工具助你事半功倍!
  • Sitecore 定时任务使用介绍
  • python多线程程序设计 之一
  • 【Python爬虫系列】_022.异步文件操作aiofiles
  • Python快速入门 —— 第二节:函数与控制语句
  • comfyui中,sam detector与yoloworld图像分割算法测试以及影响
  • 智能摄像头MP4格式化恢复方法
  • Python快速入门 —— 第七节:其他概念
  • 企业社会信任数据,信任指数(2004-2022年)
  • <<编码>> 第 12 章 二进制加法器--全加器 示例电路
  • 图论篇--代码随想录算法训练营第六十一天打卡| Floyd 算法,A*算法
  • 【Linux 20】进程控制