当 AI 从对话助手进化为自主行动的智能体(Agentic AI),安全已成为其落地的核心 “生命线”。1月27日,在新加坡举办的第 40 届 AAAI 人工智能大会(AAAI 2026)上,腾讯云安全联合新加坡科技研究局(A*STAR)等全球顶尖力量,重磅落地 “Trustworthy Agentic AI Workshop” 暨腾讯云安全技术沙龙(新加坡站),以 “学术前沿 + 产业实战” 双轮驱动,为 AI 安全发展注入中国力量。
本次研讨会旨在突破传统AI安全讨论的范畴,系统性地将议题聚焦于自主AI系统大规模落地前的三大核心支柱:对齐性、鲁棒性与可验证性。与会专家一致认为,未来的自主AI不仅需要完成复杂任务,更必须在动态、开放的未知环境中保持行为与人类意图的高度一致,抵御恶意攻击与数据扰动,并使其决策过程透明、可审计、可问责。
前沿洞察
产学研共绘可信赖AI蓝图
为期一天的研讨会日程紧凑、内容深刻。六场重量级主题演讲从多维度揭示了领域的最新进展与深层思考。演讲主题覆盖了从多模态图形用户界面智能体的高级推理,到前沿大语言模型中暴露的新型安全漏洞;从构建医疗保健领域的自主数据知识生态,到探索符号化程序与提示工程的性能边界预测。这些分享不仅勾勒出技术演进的宏伟蓝图,也尖锐地指出了当前面临的现实风险。
其中,来自腾讯云的资深安全专家赵开发发表了题为《Architecting Trustworthy Agents: A Multi-Layered Defense from Alignment to Isolation(构建可信赖智能体的多层防御架构)》的主题演讲,分享了在复杂云环境与业务场景中,如何通过架构性设计将安全能力嵌入自主AI系统的生命周期,为产业界提供了宝贵的工程实践视角。
直面挑战
以长期深耕回应安全痛点
随着 AI 智能体具备自主规划、工具调用、跨场景协作等能力,新的安全风险也随之涌现:恶意指令诱导模型 “越狱”、敏感数据泄露、工具滥用引发非授权操作等问题,成为制约 AI 智能体规模化落地的关键瓶颈。据行业调研显示,超过 60% 的企业在 AI 智能体部署中遭遇过安全风险,而缺乏成熟的防护体系和实战经验,是当前行业普遍面临的困境。
面对这一挑战,腾讯云安全并未止步于理论探索,而是以 “实战驱动创新” 为核心,长期投入 AI 智能体安全技术研发。通过分析海量攻防场景、模拟千万级恶意指令攻击、沉淀应用案例,在会议现场,腾讯云资深安全专家赵开发 从技术落地角度拆解 AI 智能体的可信防护路径,内容聚焦实战、干货满满,引发在场嘉宾的热烈讨论:
➢ 三层对齐防护体系:通过 “预设规则红线 + 语义拦截 + 自我反思” 的多层架构,让 AI 智能体始终遵循伦理规范与安全要求,有效抵御恶意指令诱导;
➢ 主动安全审计机制:创新提出 “Sentinel Agent” 架构,以攻击者视角提前排查风险,实现 “风险阻断于执行之前”,解决传统防护 “事后补救” 的被动困境;
➢ 全场景隐私守护:基于 “规则 + AI” 的双引擎数据分级防护方案,对生物信息、金融数据等敏感信息实现实时脱敏、加密存储,从源头防范数据泄露;
➢ 可信执行环境构建:基于机密计算技术,通过腾讯云的“隐私云计算(PCC)”和 “隐私保护推理(HAI-AICC)”技术方案,实现AI 智能体、LLM推理链路的安全隔离,提供无状态、端到端加密、可追溯、无残留的AI全链路安全保障;
➢ 持续进化闭环:搭建全栈监控平台与智能标注系统,通过 “轨迹追踪 -评估分析 - 迭代优化” 的循环,让防护能力随 AI 技术发展持续升级。
这一方案填补 AI 智能体安全实战防护的行业空白,首创多层对齐防护与 Sentinel Agent 主动审计架构,将防护从事后补救前移至事前预判,构建全链路可信防护体系,经千万级恶意指令验证,防护能力达行业领先,为 AI 智能体规模化安全落地提供实战范式。
此外,来自南洋理工大学 Stefano V. Albrecht 教授分享多智能体系统的对齐与验证技术,清华大学黄民烈教授剖析前沿大模型的安全隐患,英伟达专家带来 AI 智能体部署的实战经验。腾讯云安全的分享与这些前沿观点相互碰撞,其扎根产业的实战视角,为全球同行提供了可落地的参考样本。
持续攻坚
以技术创新护航 AI 可信发展
作为云与 AI 安全领域的实践者,腾讯云安全始终坚信 “安全是 AI 发展的基石”。此次亮相 AAAI 2026,既是技术成果的一次国际展示,更是与全球同行交流学习的重要契机。从发起国内首个以AI智能体自主落地的“腾讯云黑客松・智能渗透挑战赛”,汇聚全球 2000 + 白帽专家共建 AI 安全攻防样本库,到成为 Gartner 认可的 AI 安全评估服务商,腾讯云安全正以开放协作的态度,致力于推动 AI 安全技术的迭代与落地。
共识与展望
呼吁全球协作,共担治理责任
未来,腾讯云安全将继续聚焦 AI 智能体安全领域的技术深耕,一方面持续打磨贴合产业需求的实战型方案,另一方面积极参与全球 AI 安全标准共建,与国内外伙伴携手,让 AI 技术在安全可控的前提下释放更大价值。构建可信赖的自主AI绝非单一组织或国家所能完成,它迫切需要全球范围内的开放协作、知识共享与标准共建。
本次AAAI专题研讨会的成功举办,不仅为全球AI研究人员与工程师提供了一个高层次的思想碰撞平台,更清晰地指明了下一阶段人工智能发展的关键方向——唯有将“可信赖”置于与“高性能”同等重要的战略高度,自主AI才能真正赋能人类,开启智能社会发展的新纪元。
END
更多精彩内容点击下方扫码关注哦~
关注云鼎实验室,获取更多安全情报
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/252483.html