
文章目录
- 1 缩写 & 引用
- 2 abstract & introduction
- 3 VTA硬件架构
-
- 3.1 VTA指令集
- 3.2 任务间流水线并行
- 4 VTA runtime system
- 5 TVM support for VTA
-
- 5.1 显式存储管理
- 5.2 张量化
- 5.3 显式存储延时hiding
- 1 缩写
- 2 abstract & introduction & overall
- 3 optimizing computational graphs
-
- 3.1 operator fusion
- 3.2 数据layout转换
- 4 张量操作
-
- 4.1 张量表达式和调度空间
- 4.2 nested parallelism with cooperation
- 4.3 张量化
- 4.4 外存储延时隐藏
- 5 自动优化
-
- 5.1 schedule space specification
- 5.2 基于机器学习的cost model
- 5.3 调度探索
- 5.4 分布式设备池和远程过程调用
- 6 评估
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/68710.html