当前位置: 首页 > news >正文

AI 编译器学习笔记之十六 -- TVM

1、使用tvm::Dump调试打印,比如 tvm::Dump(sch->stages)

     使用std::cout<<init_state.ToStr();将state友好的显示出来   

2、每个 te.Stage 在转换为 TIR 时会生成一个对应的 tir.Block(一一对应)

  • te.Stage 是 TVM 的 Tensor Expression 层(高层次算子描述)中的调度单元,用于表示计算图中的某个操作及其优化策略(如循环展开、并行化)。

  • tir.Block 是 TVM 的 TensorIR 层(低层级中间表示)中的基本调度单元,直接对应硬件执行逻辑(如循环嵌套、内存访问)

3、 operetion对->运算符重载了,会返回opearionNode的指针

因此没有成员变量的opearion类的op可以直接访问op->name,因为重载后 op->name实际上指向了OperationNode.name,而OperationNode是具有name成员变量的, 详见 include/tvm/te/operation.h

4、tik算子也会经过ascend_tvm::LowerSchedule调度(driver_api.cc),在ansor调度之后


http://www.mrgr.cn/news/93411.html

相关文章:

  • 基于PyMuPDF与百度翻译的PDF翻译处理系统开发:中文乱码解决方案与自动化排版实践
  • qt作业day5
  • 计算机网络笔记(一)——1.1计算机网络在信息时代中的作用
  • Android项目优化同步速度
  • 【办公类-99-03】养老护理初级考题抽取(2套大题抽1+7小套题抽2——共有42种可能)
  • TDengine SQL查询语法
  • MuBlE:为机器人操作任务规划提供了逼真的视觉观察和精确的物理建模
  • 2021年高教社杯全国大学生数学建模A题——基于几何模型的“FAST”主动反射面的形状调节
  • HuggingFace 模型转换为 GGUF/GGML
  • 【人工智能学习之局部极小值与鞍点】
  • 深度学习 PyTorch 中 18 种数据增强策略与实现
  • 全新方案80M/S,告别限速!
  • 自定义录制,解锁全部功能!
  • Java面经
  • K8s 1.27.1 实战系列(一)介绍及准备工作
  • Linux 基础入门操作-实验二 cmake使用介绍下
  • 零售交易流程相关知识(top-down拆解)
  • 尚硅谷爬虫note15
  • 使用QT + 文件IO + 鼠标拖拽事件 + 线程 ,实现大文件的传输
  • 运动控制卡--固高实用