【寒武纪(9)】MLU架构

【寒武纪(9)】MLU架构个 MLU 设备由 Memory 系统 MTP Multi Tensor Processor 系统 Media 系统等构成 MTP 系统是寒武纪 MLU 架构的核 文章目录 TP1 架构 TP2 架构 TP3 1 向不同 MLU 架构的 Cambricon BANG 编程**实践 1 1 Device 级异构调优指南 1 2

大家好,我是讯享网,很高兴认识大家。


讯享网

文章目录

    • TP1 架构
    • TP2 架构
    • TP3
  • 1⾯向不同 MLU 架构的 Cambricon BANG 编程**实践
    • 1.1 Device 级异构调优指南
    • 1.2 Cluster 级并⾏调优指南
    • 1.3 Core 级并⾏调优指南
  • 2 MTP 编程调优
    • 2.1 并发性
      • 2.1.1 TP Core 内多指令流⽔线并发
      • 2.1.2 MTP Cluster 的多 Task 并发
      • 2.1.3 Host 和 Device 的并发
    • 2.2 同步
      • 2.2.1 TP Core 内多指令流⽔线同步
      • 2.2.2 MTP Cluster 的同步
      • 2.2.3 Host 和 Device 的同步
  • 3访问存系统
    • 3.1 MLU 架构的存储层级和 Cambricon BANG 的地址空间
      • 3.1.1 Global 地址空间
      • 3.1.2 Shared 地址空间
      • 3.1.3 Local 地址空间
      • 3.1.4 Stack 地址空间
      • 3.1.5 NRAM 地址空间
      • 3.1.6 WRAM 地址空间
    • 3.2 存储系统的吞吐和延迟
  • 参考
小讯
上一篇 2025-02-16 20:34
下一篇 2025-02-28 21:56

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/116980.html