当前位置: 首页 > news >正文

Kaggle 数据集dogs-vs-cats的错误

        如果你想用kaggle数据集dogs-vs-cats做深度学习数据,可能会遇到数据bug,大概类似于下面的错误:

UnidentifiedImageError: cannot identify image file

 其原因不是你的程序有问题,而是数据集本身还有bug:

  • cats/666.jpg
  • dogs/11702.jpg

 预览一下这两个数据,大概率无法显示。删掉这两个数据可能你的模型就可以跑起来了。

你也可以用下面这段代码去检测你问价夹下的所有图像数据:

import os
from PIL import Image
folder_path = 'data\img'
extensions = []
for fldr in os.listdir(folder_path):sub_folder_path = os.path.join(folder_path, fldr)for filee in os.listdir(sub_folder_path):file_path = os.path.join(sub_folder_path, filee)print('** Path: {}  **'.format(file_path), end="\r", flush=True)im = Image.open(file_path)rgb_im = im.convert('RGB')if filee.split('.')[1] not in extensions:extensions.append(filee.split('.')[1])

如果遇到错误图像,则会暂停运行并显示错误的文件名


http://www.mrgr.cn/news/59054.html

相关文章:

  • C++基础:变量的合法性和三数字比较
  • 87.【C语言】数据结构之链表的头插和尾插
  • Zypher Network Layer3 主网上线,“宝藏方舟”活动是亮点
  • 论文笔记:通用世界模型WorldDreamer
  • 深度学习——线性神经网络(五、图像分类数据集——Fashion-MNIST数据集)
  • LCD手机屏幕高精度贴合
  • 真的有免费的MC/Terraria/...服务器?简幻欢让你实现开服梦!
  • Mysql使用pt工具在大表添加索引
  • JAVA入门知识点小结-day4
  • 【jvm】所有的线程都共享堆吗
  • 使用pytest单元测试框架执行单元测试
  • 计算机网络:网络层 —— IPv4 地址与 MAC 地址 | ARP 协议
  • PSI-BLAST生成的PSSM文件转换为pssm_dict字典
  • leetcode hot100【LeetCode 128. 最长连续序列】java实现
  • 首发CSP-J2题解
  • 【已解决】编译Linux内核报错multiple definition of yylloc
  • 大模型训练、微调数据集
  • linux网络编程6——基于UDP的可靠传输协议KCP/QUIC
  • Minio文件服务器:安装
  • [LeetCode] 77. 组合
  • shodan1,shodan简介和kali下的使用
  • 【Linux】线程池详解及其基本架构与单例模式实现
  • [LeetCode] 494. 目标和
  • 【动态规划】【简单多状态dp问题】买卖股票相关问题(冷冻期、手续费、限制次数)
  • 基于SSM农业信息管理系统的设计
  • python曲线拟合通用代码