当前位置: 首页 > news >正文

CTC loss 博客转载

论文地址:

https://www.cs.toronto.edu/~graves/icml_2006.pdf

为了对应这个图,我们假设一种符合的模型情况:

英文OCR,37个类别(26个小写字母+10个汉字+空格),最大输出长度8个字符

模型预测结果是8*37的大小,换句话说就是,预测出来了8个字符,每个字符的37个类别的概率。

这时候我们就可以填表了,表中每个圆圈都是概率值,第一行第一列的数值就是,字符1是类别空格的概率,第二行第一列的数值就是,字符1是类别a的概率。

合法路径不唯一;优化目标是最大化“所有合法路径概率的和”。

(一个合法路径就是一种预测结果为正确的情况,每一个合法路径上的概率相乘就是这个路径的概率。)

采用递归的方式计算这个概率和,递归表格中每个元素该怎么求,后续补充

优秀博客:

CTC Loss 数学原理讲解:Connectionist Temporal Classification-CSDN博客


http://www.mrgr.cn/news/33196.html

相关文章:

  • JVM 中的完整 GC 流程
  • Springboot如何打包部署服务器
  • 【GPT使用技巧】用AI出一门课
  • Elman 神经网络算法详解
  • 【element-tiptap】Tiptap编辑器介绍
  • 高中数学:概率-相关运算性质
  • Linux基础命令以及常识
  • 【C++】STL----deque
  • 扎克伯格的未来愿景 用智能眼镜引领数字社交互动新时代
  • python使用笔记
  • 数据库(选择题)
  • AI Prompt写作指南:打造高效Prompt的四大核心元素
  • 正则表达式入门教程
  • C++入门基础知识79(实例)——实例 4【求商及余数】
  • 3DMAX乐高积木插件LegoBlocks使用方法
  • Webui 显卡有显存,会报错:CUDA out of memory
  • OpenAI 的新 o1 模型可以「慢慢想」答案
  • 数据库设计时,什么时候使用自增id,什么时候不使用自增id,谈谈你的理解? --------面试题分享
  • 0基础学习HTML(十一)列表
  • 0基础学习HTML(十)表格
  • 对软件进行调试
  • 4、FPGA特征简介
  • Linux下编程实现网络传送文件
  • Java | Leetcode Java题解之第424题替换后的最长重复字符
  • Golang | Leetcode Golang题解之第424题替换后的最长重复字符
  • 【全网最全】2024年华为杯研赛B题成品论文获取入口(后续会更新)