NVDLA学习笔记(2)

NVDLA学习笔记(2)NVDLA 学习笔记 2 作者 夏风喃喃 参考 http nvdla org index html 文章目录 NVDLA 学习笔记 2 硬件手册 硬件架构规范 一 绪论 二 功能描述 2 1 卷积操作 2 1 1 直接卷积模式 Direct

大家好,我是讯享网,很高兴认识大家。

NVDLA学习笔记(2)

作者:夏风喃喃
参考:http://nvdla.org/index.html

讯享网


讯享网

文章目录

  • NVDLA学习笔记(2)
    • 硬件手册:硬件架构规范
      • 一. 绪论
      • 二. 功能描述
        • 2.1 卷积操作
          • 2.1.1 直接卷积模式(Direct Convolution Mode)
          • 2.1.2 图像输入卷积模式(Image-Input Convolution Mode)
          • 2.1.3 Winograd 卷积模式(Winograd Convolution Mode)
          • 2.1.4 批卷积模式(Batching Convolution Mode)
          • 2.1.5 卷积缓冲器(Convolution Buffer)
        • 2.2 单数据点操作(Single Data Point Operations)
          • 2.2.1 线性函数(Linear Functions)
          • 2.2.2 非线性函数(Non-Linear Functions)
        • 2.3 平面数据操作(Planar Data Operations)
        • 2.4 多平面操作(Multi-Plane Operations)
        • 2.5 数据存储和整形操作(Data Memory and Reshape Operations)
          • 2.5.1 桥 DMA (Bridge DMA)
          • 2.5.2 数据整形引擎(Data Reshape Engine)
      • 三. 硬件参数
        • 3.1 功能选择
          • 3.1.1 数据类型(Data Type)
          • 3.1.2 Winograd
          • 3.1.3 批量(Batching)
          • 3.1.4 稀疏压缩(Sparse Compression)
          • 3.1.5 第二内存总线(Second Memory Bus)
          • 3.1.6 图像输入(Image Input)
          • 3.1.7 单数据点支持(Single Data Point Support)
          • 3.1.8 桥 DMA 支持(Bridge DMA Support)
          • 3.1.9 数据整形引擎支持(Data Reshape Engine Support)
        • 3.2 设计规模
          • 3.2.1 原子-C(Atomic–C)
          • 3.2.2 原子-K(Atomic–K)
          • 3.2.3 单数据点吞吐量(Single Data Point Throughput)
          • 3.2.4 平面数据处理器吞吐量(Planar Data Processor Throughput)
          • 3.2.5 跨通道数据处理器吞吐量(Cross-Channel Data Processor Throughput)
          • 3.2.6 卷积缓冲器块(Convolution Buffer Banks)
          • 3.2.7 卷积缓冲器块尺寸(Convolution Buffer Bank Size)
          • 3.2.8 卷积分批(Convolution Batching)
        • 3.3 数据类型和精度(Data Types and Precision)
          • 3.3.1 精密缩放转换器(Precision Scaling Convertor)
          • 3.3.2 精密移位器(Precision Shifter)
          • 3.3.3 查找表(Look Up Table)\
        • 3.4 小 NVDLA 实现示例(Small NVDLA Implementation Example)
        • 3.5 大 NVDLA 实现示例(Large NVDLA Implementation Example)
      • 四. 外部接口、
        • 4.1 配置空间总线(Configuration space bus)
          • 4.1.1 时钟和复位(Clock and reset)
          • 4.1.2 请求通道(Request channel)
          • 4.1.3 读数据通道(Read data channel)
          • 4.1.4 写响应通道(Write response channel)
          • 4.1.5 接口时序(Interface timing)
        • 4.2 主机中断(Host interrupt)
        • 4.3 系统互联:DBBIF(System interconnect: DBBIF)
          • 4.3.1 时钟和复位(Clock and reset)
          • 4.3.2 AW(写请求)通道
          • 4.3.3 AR(读请求)通道
          • 4.3.4 W(写数据)通道
          • 4.3.5 B(写响应)通道
          • 4.3.6 R(读数据)通道
        • 4.4 片上 SRAM 接口——SEAMIF(On-Chip SRAM Interface - SRAMIF)
      • 五. 寄存器接口(Register Interface)
        • 5.1 乒乓同步机制(Ping-pong Synchronization Mechanism)
          • 5.1.1 实现(Implementation)
          • 5.1.2 编程序列(Programming sequence)
        • 5.2 地址空间布局(Address space layout)
          • 5.2.1 GLB
          • 5.2.2 MCIF
          • 5.2.3 SRAMIF
          • 5.2.4 BDMA
          • 5.2.5 CDMA
          • 5.2.6 CSC
          • 5.2.7 CMAC_A
          • 5.2.8 CMAC_B
          • 5.2.9 CACC
          • 5.2.10 SDP_RDMA
          • 5.2.11 SDP
          • 5.2.12 PDP_RDMA
          • 5.2.13 PDP
          • 5.2.14 CDP_RDMA
          • 5.2.15 CDP
          • 5.2.16 RUBIK
小讯
上一篇 2025-04-07 14:09
下一篇 2025-04-03 14:37

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/125254.html