当前位置: 首页 > news >正文

zipformer语音识别的部署

1、简介

Chinese-English ASR model using k2-zipformer-streaming.

The model used in this example comes from the following open source projects:  

https://huggingface.co/csukuangfj/k2fsa-zipformer-bilingual-zh-en-t

经测试在电脑端可以正常跑

开发板3588上跑缺失一个安装包报错

Traceback (most recent call last):
  File "/home/orangepi/work_11.15/rknn_model_zoo/examples/zipformer/python/zipformer.py", line 4, in <module>
    import kaldifeat

解决方法:安装kaldifeat模块包(这里没有解决)

官网没有找到在开发板3588上可以运行的安装包;有操作成功的可以在评论区给一个链接,感谢!

2.、支持平台

RK3566, RK3568, RK3588, RK3562, RK3576

3.、下载模型(在3588上)

cd model


 

./download_model.sh

4、模型转换

cd python

python convert.py ../model/encoder-epoch-99-avg-1.onnx rk3588



# output model will be saved as ../model/encoder-epoch-99-avg-1.rknn3

python convert.py ../model/decoder-epoch-99-avg-1.onnx rk3588


# output model will be saved as ../model/decoder-epoch-99-avg-1.rknn

python convert.py ../model/joiner-epoch-99-avg-1.onnx rk3588


# output model will be saved as ../model/joiner-epoch-99-avg-1.rknn

5、运行

From pre-compiled wheels (Recommended) — kaldifeat 1.25.5 documentation

https://csukuangfj.github.io/kaldifeat/cpu.html

# Install kaldifeat
# Refer to https://csukuangfj.github.io/kaldifeat/installation/from_wheels.html for installation.
# This python demo is tested under version: kaldifeat-1.25.4.dev20240223

开发板3588上跑

cd python

python zipformer.py --encoder_model_path encoder-epoch-99-avg-1.rknn --decoder_model_path decoder-epoch-99-avg-1.rknn --joiner_model_path joiner-epoch-99-avg-1.rknn --target 3588

电脑端跑

python zipformer.py --encoder_model_path encoder-epoch-99-avg-1.onnx --decoder_model_path decoder-epoch-99-avg-1.onnx --joiner_model_path joiner-epoch-99-avg-1.onnx 

成功运行输出:

ONNX转换为RKNN模型需要使用官方rknn_model_zoo工具:rknn_model_zoo-2.2.0


http://www.mrgr.cn/news/93132.html

相关文章:

  • GPU/CUDA 发展编年史:从 3D 渲染到 AI 大模型时代
  • Kubernetes教程(三)Docker容器命令
  • 自学嵌入式第27天------TCP和UDP,URL爬虫
  • LeetCode 链表章节
  • Open3D 教程学习指南 (持续整理)
  • 基于 BERT 的抽取式摘要
  • DeepSeek-R1国产化系统gpu驱动+cuda+ollama+webui可视化离线私有化部署
  • BUU44 [BJDCTF2020]ZJCTF,不过如此1 [php://filter][正则表达式get输入数据][捕获组反向引用][php中单双引号]
  • 【c语言指针精选题】
  • stable-diffusion-webui 加载模型文件
  • 计算机网络——子网掩码
  • 解锁MacOS开发:环境配置与应用开发全攻略
  • 【文献阅读】The Efficiency Spectrum of Large Language Models: An Algorithmic Survey
  • 专业 英语
  • Android14 串口控制是能wifi adb实现简介
  • 日常开发记录-radio组件
  • Python----数据分析(Matplotlib二:绘图一:折线图,条形图,直方图)
  • DeepSeek 系列模型:论文精读《A Survey of DeepSeek Models》
  • v-code-diff 配置
  • 【第13节】C++设计模式(行为模式)-Template(模板)模式