当前位置: 首页 > news >正文

Dataset用load_dataset读图片和对应的caption的一个坑

代码:

data_files = {}
if args.train_data_dir is not None:data_files["train"] = os.path.join(args.train_data_dir, "**")dataset = load_dataset("imagefolder",data_files=data_files,cache_dir=args.cache_dir,)

数据:

想要读进图片和以及对应的caption, 结果只是读出来了和label(这里只有一个文件夹,所以label全是0)。   于是一直找错,查看huggingface官网:https://huggingface.co/docs/datasets/v2.4.0/en/image_load#imagefolder

自己代码和他写的一摸一样,为什么会把caption读不进去呢?    

终于。。。。。。

发现了我的 datasets的版本是2.1.0。     发现我浏览的huaggingface官网的版本是2.4.0。   好的,立马换了版本,over,成功读如图片和caption!!!!


http://www.mrgr.cn/news/79089.html

相关文章:

  • cmd命令行无法进入D:盘怎么办
  • 可爱狗狗的404动画页面HTML源码
  • Daemon进程创建过程
  • 使用脚本执行地理处理工具
  • Redis实战(黑马点评)——关于缓存(缓存更新策略、缓存穿透、缓存雪崩、缓存击穿、Redis工具)
  • pytest执行报错:found no collectors
  • Jupyter Notebook认识、安装和启动以及使用
  • 【大数据技术基础】 课程 第1章 大数据技术概述 大数据基础编程、实验和案例教程(第2版)
  • SpringBoot如何使用EasyExcel实现表格导出(简洁快速入门版本)
  • MotorCAD:定子绕组中的趋肤效应和邻近效应损耗
  • linux常用指令 | 适合初学者
  • 力扣第89题 格雷编码
  • 【AI工具】强大的AI编辑器Cursor详细使用教程
  • Spring 容器 详解
  • 【5G】技术组件 Technology Components
  • 电子应用设计方案-38:智能语音系统方案设计
  • 游戏引擎学习第33天
  • 力扣第90题:带重复元素的子集
  • 【ArcGIS微课1000例】0134:ArcGIS Earth实现二维建筑物的三维完美显示
  • 探索 Webpack:前端工程化的核心驱动力与应用场景全解析
  • Android EventBus最全面试题及参考答案
  • Git 详解
  • Cpp面试文章汇总(整理中。。。)
  • C# 解决【托管调试助手 “ContextSwitchDeadlock“:……】问题
  • nerdctl:与 Docker 兼容的 containerd CLI
  • 【算法】——前缀和(矩阵区域和详解,文末附)