2026年开源周报第十四期

开源周报第十四期本文为达坦科技 DatenLord 新系列文章 开源周报 的第 14 篇 设立这一系列的初衷 是为了更透明地分享达坦科技开源项目的成长轨迹 在这里 我们不仅会同步项目近期的核心开发进展与技术突破 更将通过路线图为您揭示未来的演进方向 项目地址与参与 GitHub 仓库 https github com open rdma open rdma driver 我们诚挚邀请所有对高性能网络

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



本文为达坦科技DatenLord新系列文章【开源周报】的第14篇。

设立这一系列的初衷,是为了更透明地分享达坦科技开源项目的成长轨迹。在这里,我们不仅会同步项目近期的核心开发进展与技术突破,更将通过路线图为您揭示未来的演进方向。

📍 项目地址与参与

GitHub 仓库:https://github.com/open-rdma/open-rdma-driver

我们诚挚邀请所有对高性能网络、Rust系统编程或RDMA技术感兴趣的朋友点击链接关注、支持我们的项目。开源的力量源于社区。您的每一次关注、讨论或代码贡献,都是项目前进的重要动力。期待与您携手,共建更完善的高性能基础设施生态。

核心目标:围绕新 partition 硬件继续推进 perftest 功能联调、性能瓶颈分析与仿真验证

1. perftest-hw-parition 分支:硬件性能分析脚本补充 (commit: 4bdb203)

​目标:​针对真实硬件 loopback 测试补充专门的性能分析入口,便于定位当前吞吐瓶颈

变更内容:

  • 新增 tests/perftest/scripts/loopback_hardware_perf.sh,用于硬件模式下的性能采样与瓶颈分析
  • 调整 loopback_hardware.sh,与新的性能测试脚本配合使用
  • 更新 dtld-ibverbs/Cargo.toml,补充性能分析相关依赖

结果:

  • 形成了独立的硬件性能测试脚本,后续可以更稳定地复现和分析瓶颈
  • 为下一阶段性能优化提供了统一测试入口

​统计:​本次提交以硬件性能分析脚本补充为主,只做了少量配套适配,整体涉及 3 个文件,代码变化为 +97/-1 行

2. perftest-hw-parition 分支:批量调度与硬件联调优化 (commit: 16c7e1a, 9997ca7, 75494ad)

​目标:​提升发送路径调度能力,配合日志与脚本优化,持续定位新 partition 硬件上的性能与稳定性问题

变更内容:

  • 在 rust-driver/src/workers/rdma.rs 与 rust-driver/src/workers/spawner.rs 中新增 batch round robin 机制,改善批量请求调度方式
  • 调整 ctx.rs、send/worker.rs 等路径,打通批量调度相关上下文
  • 更新 ring buffer、hardware CSR、loopback_pertest.c 与测试脚本,补充更细粒度日志并优化硬件 loopback 运行方式
  • 临时关闭 retransmission worker 的部分逻辑,避免其在当前阶段干扰性能定位

结果:

  • 完成了围绕新硬件的发送路径调度改造,为提升吞吐打下基础
  • 当前分支工作已从“能跑通”进一步推进到“可分析、可优化”的阶段
  • 在硬件测试过程中,PCIe 控制器仍会偶发崩溃,已经成为当前稳定性排查中的重要问题

​统计:​这一组提交主要完成批量调度、日志增强和脚本联调,并穿插了临时稳定性处理,本周累计涉及 17 个文件,总代码变化为 +329/-90 行

3. perftest-sim 分支:仿真链路调试与测试适配 (commit: baef84e)

​目标:​在仿真环境中继续对齐 perftest 流程,支持针对 partition 硬件相关问题进行联调和复现

变更内容:

  • 更新 rdma_common.c 与 loopback_pertest.c,同步驱动侧与测试侧行为
  • 修改 loopback_sim.sh 和 test_common.sh,改善仿真测试脚本使用体验

结果:

  • 仿真分支继续向硬件现状靠拢,为问题复现和行为比对提供了支撑
  • 软件路径与测试路径的联动更加完整,便于后续在 sim 环境下提前暴露问题

​统计:​本次仿真侧改动主要覆盖驱动路径、测试程序和公共脚本联动,共涉及 13 个文件,累计代码变化为 +280/-121 行

4. cocotb-pcie 测试准备取得初步进展

​目标:​为后续把 cocotb-pcie 接入当前仿真调试流程做前期验证,提升 PCIe 行为模拟能力

进展内容:

  • 初步完成对 cocotb-pcie 的测试与可用性验证
  • 确认其具备接入现有仿真体系的潜力,可用于补足当前仿真环境对 PCIe 行为模拟不够充分的问题

结果:

  • 为后续将 cocotb-pcie 接入当前 sim 调试流程打下基础
  • 预期可更好模拟 PCIe 侧交互过程,辅助复现硬件测试中出现的异常问题

​统计:​当前阶段以功能验证和接入方案预研为主,暂未形成大规模主线代码改动,重点在于验证可行性并明确后续集成路径

5. 分支与仓库检查结论

perftest 分支:

  • 本周(2026-04-02 至 2026-04-09)没有独立提交,主要更新集中在 perftest-hw-parition 与 perftest-sim

open-rdma-rtl 硬件仓库:

  • 本周未发现新的提交
  • 当前阶段硬件侧工作主要体现为围绕新 partition 硬件的软件适配、调试参数收缩与性能分析准备

02、下周规划

1. 硬件性能瓶颈定位

  • 基于 loopback_hardware_perf.sh 持续采样,进一步确认吞吐瓶颈位于调度、报文发送还是完成回收路径
  • 结合 batch round robin 改造结果,评估其对带宽与时延的实际收益

2. 仿真与硬件行为对齐

  • 将硬件上暴露的问题继续下沉到 perftest-sim 分支复现
  • 补充必要日志与断言,缩短 sim/hw 对比分析周期
  • 推进将 cocotb-pcie 接入当前仿真调试流程,更真实地模拟 PCIe 侧行为

3. PCIe 稳定性问题排查

  • 针对硬件测试中 PCIe 控制器偶发崩溃问题,继续补充定位信息并分析触发条件
  • 结合硬件实测与后续 cocotb-pcie 仿真接入结果,逐步缩小问题范围

达坦科技始终致力于打造高性能​AI+Cloud基础设施平台​,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供​AI推理引擎和高性能网络​,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。

公众号​:达坦科技DatenLord

DatenLord官网​:https://datenlord.github.io/zh-cn/

​知乎账号:​https://www.zhihu.com/org/da-tan-ke-ji

B站​:https://space.bilibili.com/

​邮箱:​

如果您有兴趣加入达坦科技Rust前沿技术交流群、硬件敏捷开发和验证方法学讨论群或AI Infra ​交流群,请添加小助手微信:DatenLord_Tech

小讯
上一篇 2026-04-14 13:33
下一篇 2026-04-14 13:31

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/261036.html