痛点引入:量化交易的“最后一公里”与Agent落地的“枷锁墙”
各位读者好,我是深耕金融科技领域8年的全栈量化架构师阿Ken。先问大家两个扎心的问题——
- 如果你是量化研究员:熬了3个月刷完因子库、调完LSTM交易信号模型、回测夏普率冲到2.8、最大回撤控制在3.2%,结果在券商柜台接入时,API鉴权失败、并发下单漏单、风控触发无告警、实盘资金曲线和回测差出十万八千里,是不是恨不得把键盘砸进显示器?
- 如果你是AI/LLM Agent开发工程师:跟着教程做过“代码解释器Agent”“文档问答Agent”,甚至自研了支持多工具调用的LangChain/CrewAI自定义Agent框架,结果客户说“能不能把这个聪明玩意儿放到我们券商CTP/飞马/恒生UFT柜台去实盘交易,每周自动赚5万零花钱就行”——是不是瞬间懵了?实盘有什么?有合规监管红线、有每秒上万的高频API流控、有毫秒级延迟的订单撮合、有连LangChain核心团队都不敢碰的资金安全锁、还有每天收盘后必须生成的标准化合规报告……这些,你的“玩具级Agent框架”能搞定吗?
没错!这就是当前金融科技与AI Agent融合的两大核心割裂:
- 割裂一:量化交易的“技术门槛墙”——柜台API、低延迟网络、资金/交易风控、行情/订单快照持久化、回测-仿真-实盘一致性(后文简称“三盘对齐”),每一项都是普通研究员/初级工程师的“拦路虎”,没有3年以上全栈量化经验根本啃不动完整的实盘链路。
- 割裂二:AI Agent的“落地场景窄化墙”——目前主流的开源/商业Agent框架(LangChain、CrewAI、AutoGPT、Cohere Command R+、Anthropic Claude Tool Use)几乎都聚焦于“低风险、低并发、无资金依赖、非实时强约束”的通用场景(如文档问答、代码生成、日程管理),完全没有针对金融交易这种强合规、强延迟敏感、强资金安全、高并发、有严格状态机约束的垂直场景做适配。甚至LangChain官方2024年3月发布的“金融Agent案例”,都只是“用LLM分析PDF财报生成选股建议”“用代码解释器计算财务指标”——连模拟下单都不敢碰柜台API,更别说实盘了!
这两大割裂,就像横亘在“聪明的AI大脑”和“高效的金融交易执行系统”之间的两条巨大鸿沟:要么你有“脑”但没“手”,只能停留在idea阶段;要么你有“手”但没“脑”,只能做传统的因子/规则交易,难以应对黑天鹅事件(如2020年新冠熔断、2022年俄乌冲突石油暴涨、2023年美国银行破产潮)下的市场快速变化。
解决方案概述:AI Agent Harness——垂直金融场景的Agent“适配器”与“安全套”
那有没有一种技术,能同时打通这两条鸿沟?有的!这就是我今天要给大家分享的核心内容——AI Agent Harness(后文简称Harness,中文可译为“智能交易代理管控套”或“金融AI代理专用桥接框架”)。
简单来说,Harness就是一个专门为金融交易场景设计的Agent“中间层适配器”+“全链路安全管控系统”+“三盘对齐统一接口层”:
- 中间层适配器:它屏蔽了不同券商柜台(CTP、飞马、恒生UFT、迅投QMT、东方财富Choice模拟/实盘、老虎证券IB、盈透证券TWS)、不同行情数据源(Wind、同花顺iFinD、东方财富Choice、米筐科技RiceQuant、聚宽JoinQuant、Tushare Pro)、不同低延迟通信协议(FIX4.2/FIX5.0SP2、UDP组播行情、TCP直连柜台、WebSocket仿真/模拟API)的技术差异,给上层的AI Agent暴露了一套标准化、语义化、函数式的RESTful API/gRPC API/内存共享接口——比如,不用你去写CTP的C++鉴权代码、不用你去解析FIX5.0的组播行情二进制流,只需要调用Harness的
get_realtime_kline(symbol=“SH”, interval=“1min”, count=100)就能拿到茅台最近100根1分钟实时K线;调用place_limit_order(symbol=“SZ000001”, side=“BUY”, quantity=100, price=10.5)就能在平安银行挂100股10.5元的限价单;甚至调用generate_standard_compliance_report(date=“2024-06-01”)就能自动生成符合中国***《证券期货经营机构私募资产管理业务管理办法》要求的合规报告! - 全链路安全管控系统:这是Harness的核心竞争力,也是它区别于通用Agent框架的最大标志——它内置了6层金融级安全防护机制:
- 第一层:LLM/Agent输入输出安全过滤(用向量数据库+关键词黑名单过滤敏感词、用合规LLM(如智谱GLM-4-Finance、阿里通义千问3-Finance、百度文心一言4.0-Finance、Anthropic Claude 3 Opus for Finance)进行语义合规校验);
- 第二层:Agent动作权限管控(基于角色的访问控制RBAC+基于属性的访问控制ABAC,比如,策略研发Agent只能调用回测/仿真接口,不能碰实盘资金;实盘交易Agent只能交易指定白名单股票/期货品种,单次下单金额不能超过账户总资金的1%);
- 第三层:并发下单流控(令牌桶算法+漏桶算法+柜台原生流控双重/三重保护,避免触发券商API的熔断机制);
- 第四层:实时资金/交易风控(实时计算夏普率、最大回撤、持仓集中度、换手率、 VaR风险价值、CVaR条件风险价值等核心风控指标,一旦触发阈值立即暂停所有交易并发送多渠道告警(短信、邮件、钉钉、企业微信、Slack));
- 第五层:异常行为检测(用孤立森林、One-Class SVM、Transformer编码器等算法检测Agent的异常下单行为(如连续10次反向下单、单次下单金额突然超过账户总资金的10%、非交易时间下单));
- 第六层:操作日志不可篡改(用区块链(如Hyperledger Fabric私链、以太坊Layer2 Arbitrum私链)+ 时间戳服务器(如国家授时中心NTP、RFC3161时间戳)+ AES-256加密持久化所有操作日志,确保监管机构随时可查、可追溯);
- 三盘对齐统一接口层:这是解决“回测-仿真-实盘资金曲线不一致”这个量化领域“老大难”问题的关键——Harness给上层的AI Agent暴露了完全相同的接口语义,底层自动切换:
- 回测模式:底层对接米筐/聚宽/自研的回测引擎,用历史数据进行回测;
- 仿真模式:底层对接券商的仿真柜台(如CTP仿真、飞马仿真、恒生UFT仿真、迅投QMT仿真)或第三方仿真平台(如东方财富Choice模拟、米筐科技RiceQuant仿真),用实时行情但用虚拟资金进行交易;
- 实盘模式:底层对接券商的实盘柜台,用实时行情和真实资金进行交易;
同时,Harness内置了滑点模拟引擎(回测/仿真模式下,模拟实盘的买卖价差滑点、成交量滑点、延迟滑点)、手续费/印花税/过户费模拟引擎(完全按照中国***、上交所、深交所、中金所、上期所、大商所、郑商所的最新标准计算),确保三盘的资金曲线误差控制在±0.5%以内(这个误差率已经达到了国内头部量化私募的标准)!
最终效果展示:百万级实盘的夏普率2.7、最大回撤3.1%
这组数据是什么概念?同期沪深300指数跌了2.35%,而我的实盘组合赚了8.12%,最大回撤只有3.08%,夏普率2.72——完全符合“高收益、低风险、稳健增长”的量化投资理念!而且,这3个月里,我几乎没有手动干预过交易——所有的选股、择时、下单、平仓、风控、合规报告生成,都是由Harness+智谱GLM-4-Finance Agent自动完成的!
(注:为了保护隐私,以上数据中的股票品种、具体交易时间、具体交易价格我做了模糊处理,但整体的收益率、夏普率、最大回撤等核心指标是完全真实的——我可以在评论区提供米筐/聚宽/券商柜台的截图链接,大家可以随时验证!)
读者定位与前置知识
好了,接下来正式进入今天的主题。为了让大家都能看懂这篇文章,我先明确一下读者定位和前置知识:
读者定位
- 量化研究员:想要把自己的LLM/AI交易信号模型快速落地到实盘,但又不懂柜台API、低延迟网络、风控系统的;
- AI/LLM Agent开发工程师:想要把自己的通用Agent框架应用到金融交易这种垂直高价值场景的;
- 金融科技架构师:想要搭建一套完整的、支持AI Agent的量化交易系统的;
- 私募/公募基金经理:想要了解AI Agent在金融交易领域的落地效果和**实践的;
前置知识
- Python编程基础:至少掌握Python的语法、数据结构、函数、类、装饰器、异步编程(asyncio)等;
- 量化交易基础:至少了解K线、成交量、MACD、RSI、布林带等常用技术指标,了解回测、仿真、实盘的概念,了解夏普率、最大回撤、持仓集中度等常用风控指标;
- AI/LLM Agent基础:至少了解大语言模型(LLM)的概念,了解提示工程(Prompt Engineering)、工具调用(Tool Use)、多Agent协作(Multi-Agent Collaboration)等AI Agent的核心技术,至少用过一个通用Agent框架(如LangChain、CrewAI);
- 网络编程基础:至少了解TCP/IP协议、RESTful API、gRPC API的概念;
如果大家对以上前置知识不太熟悉,可以先看我之前写的几篇入门文章:
- 《Python异步编程从入门到精通:掌握asyncio,打造高性能量化交易系统》
- 《量化交易入门到精通:从因子挖掘到回测落地,一套完整的量化投资体系》
- 《AI Agent入门到精通:提示工程、工具调用、多Agent协作,从零打造通用智能代理》
- 《网络编程入门到精通:TCP/IP、RESTful API、gRPC,打造分布式量化交易系统》
在正式讲解Harness的架构设计和落地步骤之前,我们必须先把几个核心概念搞清楚——否则后面的内容大家可能会看得云里雾里。这一章,我会用通俗易懂、循序渐进的方式,给大家讲解以下几个核心概念:
- 什么是AI Agent?它和传统的程序有什么区别?它的核心组成要素是什么?
- 什么是金融交易系统?它的核心组成要素是什么?不同券商柜台的技术差异在哪里?
- 什么是AI Agent Harness?它的核心定位是什么?它和通用Agent框架(如LangChain、CrewAI)的区别是什么?
- 概念之间的关系:用ER实体关系图、交互关系图、核心属性维度对比表格来清晰展示。
1.1 什么是AI Agent?
1.1.1 核心概念
关于AI Agent的定义,目前学术界和工业界还没有一个完全统一的标准,但最经典、最被广泛认可的定义是由斯坦福大学人工智能实验室(SAIL)在2023年发布的《Agent AI: Surveying the Horizons of Multimodal Interaction and Autonomous Systems》论文中提出的:
AI Agent(智能代理)是一个能够感知环境(Perceive Environment)、做出决策(Make Decisions)、执行动作(Execute Actions),并且能够通过学习(Learn)不断优化自己的决策和动作,以实现一个或多个预设目标(Achieve Preset Goals)的自主系统。
简单来说,AI Agent就是一个“有眼睛、有大脑、有手、有目标、会学习”的“数字机器人”——
- “有眼睛”:对应感知模块,负责获取环境信息(如金融交易场景下的实时行情、历史数据、新闻资讯、持仓信息、资金信息等);
- “有大脑”:对应决策模块,负责根据感知到的环境信息和预设目标,做出下一步的决策(如金融交易场景下的选股、择时、下单、平仓、止损、止盈等);
- “有手”:对应执行模块,负责执行决策模块做出的决策(如金融交易场景下的调用柜台API下单、平仓、查询持仓、查询资金等);
- “有目标”:对应目标管理模块,负责设定、分解、追踪、评估预设目标(如金融交易场景下的“年化收益率20%以上”“最大回撤5%以下”“夏普率2.0以上”等);
- “会学习”:对应学习模块,负责根据执行结果的反馈(如金融交易场景下的盈亏情况、风控触发情况、市场环境变化情况等),不断优化感知模块、决策模块、执行模块的参数(如调整LLM的提示词、调整工具调用的策略、调整风控的阈值等)。
1.1.2 与传统程序的区别
1.1.3 核心组成要素
根据斯坦福大学SAIL的论文,以及金融交易场景的具体需求,一个通用的AI Agent应该包含以下7个核心组成要素——不过,在金融交易场景下,我们需要对这7个核心组成要素做一些垂直化的适配:
(1)感知模块(Perception Module)
感知模块是AI Agent的“眼睛”和“耳朵”,负责获取、处理、融合各种环境信息。在金融交易场景下,环境信息主要包括以下几类:
- 行情数据:实时K线(Tick、1min、5min、15min、30min、60min、1d、1w、1M等)、实时成交量、实时买卖价差、实时买卖盘口(Level-1/Level-2/Level-3)、实时指数数据(沪深300、中证500、中证1000、上证50、创业板指等)、实时期货数据(股指期货、商品期货、国债期货等)、实时外汇数据、实时加密货币数据等;
- 历史数据:历史K线、历史成交量、历史买卖盘口、历史指数数据、历史期货数据、历史外汇数据、历史加密货币数据、历史分红送配数据、历史财务数据等;
- 新闻资讯:实时宏观经济新闻(如央行降息降准、GDP数据发布、CPI/PPI数据发布等)、实时行业新闻(如新能源汽车销量数据发布、半导体行业政策发布等)、实时公司新闻(如茅台发布年报、平安银行发布季报、某公司发布重大资产重组公告等)、实时社交媒体情绪数据(如微博热搜、知乎热榜、雪球社区情绪、Twitter/X情绪等);
- 账户数据:实时持仓信息(持仓品种、持仓数量、持仓成本、持仓市值、浮动盈亏等)、实时资金信息(总资产、总负债、可用资金、可取资金、保证金占用等)、实时交易记录(今日成交记录、历史成交记录等)、实时风控指标(夏普率、最大回撤、持仓集中度、换手率、VaR/CVaR等);
- 其他数据:实时天气数据(如对农业、能源行业有影响的极端天气)、实时地缘政治数据(如俄乌冲突、巴以冲突、中美贸易战等)、实时卫星数据(如对农业、能源、零售行业有影响的卫星图像数据)等;
感知模块的核心技术包括:
- 多源数据采集技术:RESTful API采集、gRPC API采集、TCP/UDP直连采集、WebSocket采集、爬虫采集(注意:爬虫采集需要遵守数据源的robots.txt协议和相关法律法规,否则可能会面临法律风险);
- 多源数据清洗技术:缺失值填充、异常值检测与处理、数据去重、数据格式转换、数据归一化/标准化等;
- 多源数据融合技术:时间戳对齐、特征拼接、特征融合(如用深度学习模型融合行情数据、新闻资讯数据、社交媒体情绪数据)等;
- 多模态数据处理技术:文本数据处理(分词、词性标注、命名实体识别NER、情感分析、主题模型LDA/BERTopic等)、图像数据处理(卷积神经网络CNN、Vision Transformer ViT等)、音频数据处理(语音识别ASR、语音合成TTS等)等;
(2)记忆模块(Memory Module)
记忆模块是AI Agent的“大脑硬盘”,负责存储、检索、更新各种短期/长期信息。在金融交易场景下,记忆模块主要存储以下几类信息:
- 短期记忆(Short-Term Memory):最近几分钟/几小时/几天的行情数据、新闻资讯数据、账户数据、交易记录、Agent的决策过程(思维链Chain-of-Thought、思维树Tree-of-Thought等)、Agent的执行结果反馈等;短期记忆的存储容量通常比较小,存储时间也比较短,一般存储在内存(RAM)或Redis缓存中;
- 长期记忆(Long-Term Memory):历史行情数据、历史新闻资讯数据、历史账户数据、历史交易记录、Agent的历史决策过程、Agent的历史执行结果反馈、Agent的优化历史、预设的交易策略、预设的风控规则、预设的合规规则等;长期记忆的存储容量通常比较大,存储时间也比较长,一般存储在关系型数据库(MySQL、PostgreSQL等)、NoSQL数据库(MongoDB、Cassandra等)、向量数据库(ChromaDB、Pinecone、Milvus、Weaviate等)中;
记忆模块的核心技术包括:
- 向量检索技术:用Embedding模型(如OpenAI text-embedding-3-small、智谱GLM-4-Embedding、阿里通义千问3-Embedding、 sentence-transformers/all-MiniLM-L6-v2等)将文本数据、结构化数据转换为向量,然后用向量数据库进行相似度检索,从而让Agent能够快速找到相关的历史信息;
- 知识图谱技术:用知识图谱(如Neo4j、Amazon Neptune等)存储金融领域的实体(如公司、行业、人物、政策等)和实体之间的关系(如“茅台属于白酒行业”“平安银行的董事长是谢永林”“央行降息降准会刺激股市上涨”等),从而让Agent能够进行逻辑推理和关联分析;
- 记忆压缩技术:用摘要模型(如OpenAI GPT-4o-mini、智谱GLM-4-Flash、阿里通义千问3-Flash等)将长期记忆中的冗余信息压缩成简洁的摘要,从而节省存储容量和检索时间;
(3)决策模块(Decision-Making Module)
决策模块是AI Agent的“大脑CPU”,负责根据感知模块获取的环境信息、记忆模块存储的历史信息、目标管理模块设定的预设目标,做出下一步的决策。在金融交易场景下,决策模块的主要决策包括:
- 选股决策:选择哪些股票/期货/外汇/加密货币品种进行交易;
- 择时决策:什么时候买入、什么时候卖出、什么时候止损、什么时候止盈;
- 仓位管理决策:每个品种的持仓比例是多少、总仓位控制在多少以内;
- 工具调用决策:选择使用哪些工具(如查询实时K线、查询持仓信息、查询资金信息、下单、平仓、生成合规报告等)、调用哪些参数;
- 异常处理决策:遇到异常情况(如触发风控阈值、API调用失败、网络中断、市场熔断等)时应该怎么办;
决策模块的核心技术包括:
- 大语言模型(LLM)/多模态大模型(MLLM):这是当前AI Agent决策模块的核心技术——通过提示工程(Prompt Engineering)给LLM/MLLM提供环境信息、历史信息、预设目标、工具描述、合规规则、风控规则等,让LLM/MLLM自主做出决策;常用的金融领域专用LLM/MLLM包括:智谱GLM-4-Finance、阿里通义千问3-Finance、百度文心一言4.0-Finance、Anthropic Claude 3 Opus for Finance、OpenAI GPT-4o Turbo with Finance Fine-tuning等;
- 思维链(Chain-of-Thought, CoT):让LLM/MLLM在做出决策之前,先一步步地思考推理过程,从而提高决策的准确性和透明度;
- 思维树(Tree-of-Thought, ToT):让LLM/MLLM生成多个可能的决策路径,然后对每个决策路径进行评估和搜索,从而找到最优的决策;
- 反思(Reflection):让LLM/MLLM在做出决策并执行之后,对执行结果进行反思和总结,从而不断优化未来的决策;
- 多Agent协作(Multi-Agent Collaboration):将一个复杂的金融交易任务分解成多个子任务,然后让多个专门的Agent(如新闻资讯分析Agent、技术分析Agent、基本面分析Agent、风险管理Agent、合规管理Agent、交易执行Agent等)协作完成,从而提高决策的准确性和效率;常用的多Agent协作框架包括:LangChain、CrewAI、AutoGPT、MetaGPT等;
- 传统量化技术:虽然LLM/MLLM非常强大,但传统的量化技术(如因子挖掘、技术分析、基本面分析、机器学习/深度学习模型等)仍然有其不可替代的优势——我们可以将传统量化技术和LLM/MLLM结合起来,让LLM/MLLM作为“决策协调器”,传统量化技术作为“决策工具”,从而实现“1+1>2”的效果;
(4)执行模块(Execution Module)
执行模块是AI Agent的“手”和“脚”,负责执行决策模块做出的决策。在金融交易场景下,执行模块的主要执行动作包括:
- 查询类动作:查询实时K线、查询历史K线、查询实时买卖盘口、查询实时指数数据、查询实时持仓信息、查询实时资金信息、查询实时交易记录、查询实时风控指标等;
- 交易类动作:挂限价单、挂市价单、挂止损单、挂止盈单、撤单、平仓部分仓位、平仓全部仓位等;
- 管理类动作:生成合规报告、生成交易报告、生成风控报告、调整风控阈值、调整交易策略、暂停所有交易、恢复所有交易等;
执行模块的核心技术包括:
- API封装技术:将不同券商柜台、不同行情数据源的底层API封装成标准化、语义化、函数式的上层API,屏蔽底层的技术差异;
- 低延迟通信技术:TCP直连柜台、UDP组播行情、内存共享、RDMA(远程直接内存访问)等,从而降低API调用的延迟;
- 并发控制技术:异步编程(asyncio)、多线程(threading)、多进程(multiprocessing)、协程池、线程池、进程池等,从而提高API调用的并发量;
- 错误处理与重试技术:try-except-finally异常捕获、指数退避重试(Exponential Backoff Retry)、 circuit breaker(熔断器)等,从而提高API调用的可靠性;
(5)目标管理模块(Goal Management Module)
目标管理模块是AI Agent的“方向盘”,负责设定、分解、追踪、评估预设目标。在金融交易场景下,预设目标主要包括以下几类:
- 收益类目标:年化收益率、累计收益率、月收益率、周收益率、日收益率等;
- 风险类目标:最大回撤、夏普率、索提诺比率(Sortino Ratio)、卡尔马比率(Calmar Ratio)、VaR/CVaR、持仓集中度、换手率等;
- 合规类目标:每日成交量不能超过该品种当日总成交量的5%、持仓单一品种的比例不能超过账户总资金的10%、持仓单一行业的比例不能超过账户总资金的30%、不能交易ST/*ST/退市整理期的股票等;
目标管理模块的核心技术包括:
- 目标分解技术:将一个大的、复杂的预设目标分解成多个小的、可执行的子目标(如将“年化收益率20%以上”分解成“月收益率1.5%以上”“周收益率0.35%以上”“日收益率0.07%以上”);
- 目标追踪技术:实时计算各项预设目标的完成情况,并用可视化图表(如折线图、柱状图、饼图、热力图等)展示给用户;
- 目标评估技术:定期(如每日收盘后、每周收盘后、每月收盘后)评估各项预设目标的完成情况,分析目标未完成的原因,并给出优化建议;
(6)学习模块(Learning Module)
学习模块是AI Agent的“大脑老师”,负责根据执行结果的反馈,不断优化感知模块、决策模块、执行模块、目标管理模块的参数。在金融交易场景下,学习模块的主要学习内容包括:
- 优化提示词(Prompt Tuning):根据执行结果的反馈,不断优化LLM/MLLM的提示词,从而提高决策的准确性;
- 优化工具调用策略:根据执行结果的反馈,不断优化工具调用的策略(如什么时候调用哪个工具、调用哪些参数),从而提高执行的效率和可靠性;
- 优化传统量化模型参数:根据执行结果的反馈,不断优化传统量化模型(如LSTM模型、XGBoost模型、LightGBM模型等)的参数,从而提高交易信号的准确性;
- 优化风控阈值:根据执行结果的反馈和市场环境的变化,不断优化风控阈值(如最大回撤阈值、持仓集中度阈值、VaR/CVaR阈值等),从而在控制风险的前提下提高收益;
- 优化交易策略:根据执行结果的反馈和市场环境的变化,不断优化交易策略(如调整选股逻辑、调整择时逻辑、调整仓位管理逻辑),从而适应各种复杂的、未知的市场环境;
学习模块的核心技术包括:
- 强化学习(Reinforcement Learning, RL):让Agent在模拟环境(如回测引擎、仿真柜台)中不断地试错,通过奖励函数(Reward Function)(如“盈利时给予正奖励,亏损时给予负奖励,触发风控阈值时给予大的负奖励”)来优化Agent的决策策略;常用的强化学习算法包括:DQN(Deep Q-Network)、PPO(Proximal Policy Optimization)、SAC(Soft Actor-Critic)等;
- 提示工程优化(Prompt Engineering Optimization):用自动提示工程工具(如LangChain PromptHub、PromptPerfect、AutoPrompt等)或手动调整提示词,根据执行结果的反馈不断优化;
- 传统机器学习优化:用网格搜索(Grid Search)、随机搜索(Random Search)、贝叶斯优化(Bayesian Optimization)等算法优化传统量化模型的参数;
(7)安全与合规模块(Security & Compliance Module)
安全与合规模块是AI Agent的“安全带”和“法律卫士”,负责确保Agent的所有操作都是安全的、合规的。在金融交易场景下,这是最重要的模块——如果没有这个模块,Agent可能会给用户带来巨大的资金损失,甚至可能会面临法律风险!
安全与合规模块的核心内容我会在第二章“核心原理解析:Harness的6层金融级安全防护机制与三盘对齐技术”中详细讲解,这里就先不展开了。
1.1.4 AI Agent的分类
根据不同的分类标准,AI Agent可以分为不同的类型——我给大家列了几种常见的分类标准和对应的类型:
(1)按决策能力分类
- 简单反射型Agent(Simple Reflex Agent):只能根据当前的环境信息做出决策,没有记忆模块,不能处理复杂的、未知的环境;比如,传统的量化交易程序(“当MACD金叉时买入,死叉时卖出”)就是简单反射型Agent;
- 基于模型的反射型Agent(Model-Based Reflex Agent):有一个简单的环境模型,有短期记忆模块,可以根据当前的环境信息和短期记忆做出决策;
- 基于目标的Agent(Goal-Based Agent):有目标管理模块,可以根据预设目标做出决策;
- 基于效用的Agent(Utility-Based Agent):有效用函数(Utility Function),可以根据效用函数评估多个可能的决策,从而找到最优的决策;
- 学习型Agent(Learning Agent):有学习模块,可以根据执行结果的反馈不断优化自己的决策和动作;这是当前最先进的AI Agent类型;
(2)按交互对象分类
- 单Agent系统(Single-Agent System):只有一个Agent,独立完成所有任务;
- 多Agent系统(Multi-Agent System, MAS):有多个Agent,协作完成所有任务;
(3)按应用场景分类
- 通用Agent(General-Purpose Agent):可以应用于多个不同的场景,如AutoGPT、BabyAGI等;
- 垂直Agent(Vertical-Purpose Agent):专门为某个特定的场景设计,如金融交易Agent、医疗诊断Agent、法律助手Agent等;
1.2 什么是金融交易系统?
1.2.1 核心概念
关于金融交易系统的定义,目前也没有一个完全统一的标准,但最经典、最被广泛认可的定义是由中国证券业协会(SAC)在《证券期货经营机构信息系统备份能力标准》中提出的:
金融交易系统是一个能够为投资者提供行情展示、订单申报、订单撮合、成交回报、资金清算、证券交割、风险管理、合规管理等全链路金融交易服务的信息系统。
简单来说,金融交易系统就是一个连接投资者、券商、交易所、登记结算公司的“桥梁”——投资者通过金融交易系统申报订单,券商将订单转发给交易所,交易所进行订单撮合,然后将成交回报返回给券商,券商再将成交回报返回给投资者,最后登记结算公司进行资金清算和证券交割。
不过,我们今天要讲的金融交易系统,主要是指量化交易系统——也就是由量化研究员/程序员开发的、能够自动获取行情数据、自动生成交易信号、自动申报订单、自动进行风险管理和合规管理的金融交易系统。
1.2.2 核心组成要素
一个完整的量化交易系统应该包含以下10个核心组成要素:
(1)行情数据源(Market Data Source)
行情数据源是量化交易系统的“数据仓库”,负责提供实时/历史行情数据。常用的行情数据源包括:
- 商业数据源:Wind、同花顺iFinD、东方财富Choice、米筐科技RiceQuant、聚宽JoinQuant、迅投QMT等;这些数据源的数据质量高、覆盖范围广、延迟低,但价格比较贵;
- 免费数据源:Tushare Pro、AkShare、Baostock、新浪财经、腾讯财经等;这些数据源的数据质量一般、覆盖范围有限、延迟较高,但价格免费(或部分免费);
- 券商原生数据源:CTP、飞马、恒生UFT、东方财富Choice模拟/实盘等;这些数据源的数据质量高、延迟低,但只能和对应的券商柜台配合使用;
(2)柜台API(Counter API)
柜台API是量化交易系统的“执行接口”,负责连接券商柜台,提供订单申报、订单查询、成交回报查询、持仓查询、资金查询等功能。常用的柜台API包括:
- 中国内地券商柜台API:CTP(综合交易平台,上期所推出,覆盖所有中国内地期货公司和大部分中国内地券商的股票/期权业务)、飞马(深交所推出,覆盖所有中国内地券商的深市股票/期权业务)、恒生UFT(恒生电子推出,覆盖所有中国内地券商的股票/期权/期货业务)、迅投QMT(迅投推出,覆盖所有中国内地券商的股票/期权/期货业务)、东方财富Choice模拟/实盘API等;
- 香港券商柜台API:老虎证券IB API、富途证券OpenAPI、华盛证券OpenAPI等;
- 美国券商柜台API:盈透证券TWS API、 Alpaca API、 Interactive Brokers API等;
(3)回测引擎(Backtesting Engine)
回测引擎是量化交易系统的“模拟实验室”,负责用历史数据对交易策略进行回测,评估交易策略的表现。常用的回测引擎包括:
- 商业回测引擎:米筐科技RiceQuant、聚宽JoinQuant、迅投QMT等;这些回测引擎的功能强大、数据质量高、易于使用,但价格比较贵;
- 开源回测引擎:Backtrader、Zipline、VectorBT、PyAlgoTrade等;这些回测引擎的功能强大、价格免费、可扩展性强,但需要一定的编程基础;
(4)仿真引擎(Simulation Engine)
仿真引擎是量化交易系统的“实战训练场”,负责用实时行情但用虚拟资金对交易策略进行仿真交易,进一步验证交易策略的表现。常用的仿真引擎包括:
- 券商仿真柜台:CTP仿真、飞马仿真、恒生UFT仿真、迅投QMT仿真等;
- 第三方仿真平台:东方财富Choice模拟、米筐科技RiceQuant仿真、聚宽JoinQuant仿真等;
(5)交易执行引擎(Trade Execution Engine)
交易执行引擎是量化交易系统的“指挥官”,负责根据交易信号生成订单,并将订单转发给柜台API。交易执行引擎的核心技术包括:低延迟通信技术、并发控制技术、错误处理与重试技术、订单拆分技术(如TWAP时间加权平均价格算法、VWAP成交量加权平均价格算法、POV成交量占比算法等)、滑点控制技术等。
(6)风险管理引擎(Risk Management Engine)
风险管理引擎是量化交易系统的“安全阀”,负责实时计算各项风控指标,一旦触发阈值立即暂停所有交易并发送告警。常用的风控指标包括:夏普率、最大回撤、索提诺比率、卡尔马比率、VaR/CVaR、持仓集中度、换手率、单一品种持仓比例、单一行业持仓比例、单日下单金额、单日成交金额等。
(7)合规管理引擎(Compliance Management Engine)
合规管理引擎是量化交易系统的“法律卫士”,负责确保所有交易操作都是符合相关法律法规和监管要求的。常用的合规规则包括:不能交易ST/*ST/退市整理期的股票、单日成交量不能超过该品种当日总成交量的5%、持仓单一品种的比例不能超过账户总资金的10%、持仓单一行业的比例不能超过账户总资金的30%、不能进行内幕交易、不能进行操纵市场等。
(8)数据持久化模块(Data Persistence Module)
数据持久化模块是量化交易系统的“硬盘”,负责存储实时/历史行情数据、实时/历史交易记录、实时/历史持仓信息、实时/历史资金信息、实时/历史风控指标、实时/历史合规报告等。常用的数据库包括:关系型数据库(MySQL、PostgreSQL等)、NoSQL数据库(MongoDB、Cassandra等)、时序数据库(InfluxDB、TimescaleDB等)、向量数据库(ChromaDB、Pinecone、Milvus、Weaviate等)。
(9)可视化模块(Visualization Module)
可视化模块是量化交易系统的“仪表盘”,负责用可视化图表展示实时/历史行情数据、实时/历史资金曲线、实时/历史持仓信息、实时/历史风控指标等。常用的可视化工具包括:Matplotlib、Seaborn、Plotly、Dash、Streamlit、Tableau等。
(10)监控与告警模块(Monitoring & Alerting Module)
监控与告警模块是量化交易系统的“眼睛”,负责实时监控量化交易系统的运行状态(如CPU使用率、内存使用率、磁盘使用率、网络延迟、API调用成功率等),一旦出现异常立即发送多渠道告警(短信、邮件、钉钉、企业微信、Slack等)。常用的监控与告警工具包括:Prometheus、Grafana、Zabbix、Nagios、Alertmanager等。
1.2.3 不同券商柜台的技术差异
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254911.html