当前位置: 首页 > news >正文

使用OCR识别手写文本

本文实现了基于微调TrOCR模型进行手写文本识别。

在这里插入图片描述

GNHK手写笔记数据集

GNHK(GoodNotes Handwriting Kollection)手写笔记数据集由GoodNotes提供,包含来自世界各地学生的数百份英文手写笔记。

下载数据集

访问GNHK数据集官方网站(https://www.goodnotes.com/gnhk),滚动到底部,同意使用条款和条件;点击第二个链接下载数据集。

在这里插入图片描述

下载后会得到两个文件:train_data.zip 和 test_data.zip。解压这两个文件后,数据集的目录结构如下:

├── test_data
│   └── test
│       ├── eng_AF_00

http://www.mrgr.cn/news/63639.html

相关文章:

  • HTML鼠标移动的波浪线动画——页面将会初始化一个Canvas元素,并使用JavaScript代码在Canvas上绘制响应鼠标移动的波浪线动画
  • 开源数据库 - mysql - MYSQL8.4版本删除功能
  • 计算机四级嵌入式·操作系统知识点总结(一)
  • C# 编程基础:深入解析构造函数与析构函数
  • 必应Bing国内搜索广告代理商,必应广告如何开户投放?
  • InstructIR: High-Quality Image Restoration Following Human Instructions 论文阅读笔记
  • dc源码铺子应用部署教程
  • CSS3简介(一)
  • 关于SDF系列文章,写在前
  • Raspberry Pi OS 树莓派的新版本
  • [论文阅读]LOGAN: Membership Inference Attacks Against Generative Models
  • ssm+vue657基于spring和vue开发的web新闻流媒体平台
  • Go语言的使用
  • Python实现SPFA算法
  • Oracle视频基础1.3.6练习
  • 龙迅#LT6211适用于HDMI转4PORT LVDS,分辨率高达4K60HZ,可提供技术支持!
  • CATIA许可证管理工具
  • (python)如何进行加密
  • 求逻辑地址的页号和物理地址
  • [Approaching any Machine Learning] Supervised vs unsupervised learning - Note
  • 【Kaggle | Pandas】练习5:数据类型和缺失值
  • Virtuoso使用layout绘制版图、使用Calibre验证DRC、LVS、PEX抽取RC
  • 2024/11/1 数据结构大题打卡
  • Kafka日志记录
  • 深入解析C/C++中的__attribute__((packed)):内存对齐与紧打包技术
  • opencv学习笔记(6):图像预处理(直方图、图像去噪)