本文为达坦科技DatenLord新系列文章【开源周报】的第14篇。
设立这一系列的初衷,是为了更透明地分享达坦科技开源项目的成长轨迹。在这里,我们不仅会同步项目近期的核心开发进展与技术突破,更将通过路线图为您揭示未来的演进方向。
📍 项目地址与参与
GitHub 仓库:https://github.com/open-rdma/open-rdma-driver
我们诚挚邀请所有对高性能网络、Rust系统编程或RDMA技术感兴趣的朋友点击链接关注、支持我们的项目。开源的力量源于社区。您的每一次关注、讨论或代码贡献,都是项目前进的重要动力。期待与您携手,共建更完善的高性能基础设施生态。
核心目标:围绕新 partition 硬件继续推进 perftest 功能联调、性能瓶颈分析与仿真验证
1. perftest-hw-parition 分支:硬件性能分析脚本补充 (commit: 4bdb203)
目标:针对真实硬件 loopback 测试补充专门的性能分析入口,便于定位当前吞吐瓶颈
变更内容:
- 新增 tests/perftest/scripts/loopback_hardware_perf.sh,用于硬件模式下的性能采样与瓶颈分析
- 调整 loopback_hardware.sh,与新的性能测试脚本配合使用
- 更新 dtld-ibverbs/Cargo.toml,补充性能分析相关依赖
结果:
- 形成了独立的硬件性能测试脚本,后续可以更稳定地复现和分析瓶颈
- 为下一阶段性能优化提供了统一测试入口
统计:本次提交以硬件性能分析脚本补充为主,只做了少量配套适配,整体涉及 3 个文件,代码变化为 +97/-1 行
2. perftest-hw-parition 分支:批量调度与硬件联调优化 (commit: 16c7e1a, 9997ca7, 75494ad)
目标:提升发送路径调度能力,配合日志与脚本优化,持续定位新 partition 硬件上的性能与稳定性问题
变更内容:
- 在 rust-driver/src/workers/rdma.rs 与 rust-driver/src/workers/spawner.rs 中新增 batch round robin 机制,改善批量请求调度方式
- 调整 ctx.rs、send/worker.rs 等路径,打通批量调度相关上下文
- 更新 ring buffer、hardware CSR、loopback_pertest.c 与测试脚本,补充更细粒度日志并优化硬件 loopback 运行方式
- 临时关闭 retransmission worker 的部分逻辑,避免其在当前阶段干扰性能定位
结果:
- 完成了围绕新硬件的发送路径调度改造,为提升吞吐打下基础
- 当前分支工作已从“能跑通”进一步推进到“可分析、可优化”的阶段
- 在硬件测试过程中,PCIe 控制器仍会偶发崩溃,已经成为当前稳定性排查中的重要问题
统计:这一组提交主要完成批量调度、日志增强和脚本联调,并穿插了临时稳定性处理,本周累计涉及 17 个文件,总代码变化为 +329/-90 行
3. perftest-sim 分支:仿真链路调试与测试适配 (commit: baef84e)
目标:在仿真环境中继续对齐 perftest 流程,支持针对 partition 硬件相关问题进行联调和复现
变更内容:
- 更新 rdma_common.c 与 loopback_pertest.c,同步驱动侧与测试侧行为
- 修改 loopback_sim.sh 和 test_common.sh,改善仿真测试脚本使用体验
结果:
- 仿真分支继续向硬件现状靠拢,为问题复现和行为比对提供了支撑
- 软件路径与测试路径的联动更加完整,便于后续在 sim 环境下提前暴露问题
统计:本次仿真侧改动主要覆盖驱动路径、测试程序和公共脚本联动,共涉及 13 个文件,累计代码变化为 +280/-121 行
4. cocotb-pcie 测试准备取得初步进展
目标:为后续把 cocotb-pcie 接入当前仿真调试流程做前期验证,提升 PCIe 行为模拟能力
进展内容:
- 初步完成对 cocotb-pcie 的测试与可用性验证
- 确认其具备接入现有仿真体系的潜力,可用于补足当前仿真环境对 PCIe 行为模拟不够充分的问题
结果:
- 为后续将 cocotb-pcie 接入当前 sim 调试流程打下基础
- 预期可更好模拟 PCIe 侧交互过程,辅助复现硬件测试中出现的异常问题
统计:当前阶段以功能验证和接入方案预研为主,暂未形成大规模主线代码改动,重点在于验证可行性并明确后续集成路径
5. 分支与仓库检查结论
perftest 分支:
- 本周(2026-04-02 至 2026-04-09)没有独立提交,主要更新集中在 perftest-hw-parition 与 perftest-sim
open-rdma-rtl 硬件仓库:
- 本周未发现新的提交
- 当前阶段硬件侧工作主要体现为围绕新 partition 硬件的软件适配、调试参数收缩与性能分析准备
02、下周规划
1. 硬件性能瓶颈定位
- 基于 loopback_hardware_perf.sh 持续采样,进一步确认吞吐瓶颈位于调度、报文发送还是完成回收路径
- 结合 batch round robin 改造结果,评估其对带宽与时延的实际收益
2. 仿真与硬件行为对齐
- 将硬件上暴露的问题继续下沉到 perftest-sim 分支复现
- 补充必要日志与断言,缩短 sim/hw 对比分析周期
- 推进将 cocotb-pcie 接入当前仿真调试流程,更真实地模拟 PCIe 侧行为
3. PCIe 稳定性问题排查
- 针对硬件测试中 PCIe 控制器偶发崩溃问题,继续补充定位信息并分析触发条件
- 结合硬件实测与后续 cocotb-pcie 仿真接入结果,逐步缩小问题范围

达坦科技始终致力于打造高性能AI+Cloud基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供AI推理引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。
公众号:达坦科技DatenLord
DatenLord官网:https://datenlord.github.io/zh-cn/
知乎账号:https://www.zhihu.com/org/da-tan-ke-ji
B站:https://space.bilibili.com/
邮箱:
如果您有兴趣加入达坦科技Rust前沿技术交流群、硬件敏捷开发和验证方法学讨论群或AI Infra 交流群,请添加小助手微信:DatenLord_Tech
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/261036.html