数据中台设计方案是什么（数据中台设计方案是什么）

大家好，我是讯享网，很高兴认识大家。

中台为什么要AI？

中台的作用是将重复的服务共享，快速构建满足个性化要求的业务，让业务好用！

重复共享性，正是AI技术落地所急需要解决的问题，只有通过共享、复用，才能实现降低成本、快速应用。

因此，建设AI中台就是围绕这个目的和初衷，将可重复使用的AI模型、服务沉淀共享，快速组合、组装、产出满足个性化智能业务要求，AI 中台是用来构建大规模智能服务的基础设施，是一套完整的人工智能模型全生命周期管理平台和服务体系。

它提供模型设计训练、模型/算法库、复用标注管理、模型监控服务等能力支持。

AI中台什么样？

AI中台需要实用、易用、好用，能让业务开发人员、项目实施人员能快速的构建满足当前业务需要的智能化应用。

AI中台应满足以下几个特点：

1.拥有众多的AI模型和服务

为了满足快速组装成满足个性化智能业务要求的产品，AI中台首先要是一个大型“AI模型和服务”市场，里面有随时可供选用的模型和服务，包括：

l基础的通用组件，如：语音识别、语音合成、人脸识别；

l符合行业、领域特性要求的通用组件，如：某行业的NLP服务、某行业的知识图谱、某领域的图片识别服务；

l某类型客户群体的通用组件，如：企业用户的智能对话服务、个人消费用户的推荐服务

当市场中缺乏必须的模型和服务时，要具备快速开发供他人使用的能力。

2.AI模型和服务之间能互通、能拼装

确保AI中台中的所有模型和服务都能组合使用，AI中台应为所有AI模型、服务互通、互助、并行应用提供基础支撑。

l所有的通用组件、行业组件、领域组件、特定组件以微服务方式满足统一的被调取规范；

l所有组件依赖的环境、资源不相冲突，能在同一个控制台注册、运行，有统一的基础支撑平台。如：智能对话服务作为核心服务，无缝对接标准的语音服务、某行业的知识图谱、某特定用户群体的推荐服务、特定开发的智能处理服务等。

l所需要的数据资源能一次抽取整理，在不同模型、服务间共用，避免人力、物力资源浪费，及数据的冲突。如：抽取的用户所在城市的信息，既可以满足智能对话中对话模型的使用，也可以满足知识图谱模型的使用，还可以满足智能推荐模型的使用。

3. 方便对接业务系统、数据中台、开发工具

AI中台不是孤立的平台，是信息化建设中的一部分，应能与基础平台、业务系统很好的融合。

只有做好与原业务系统的对接，才能使AI能力助力业务智能化。

lAI中台应对接底层基础运行平台，利用基础运行平台的运行和管理能力，实现业务共同部署、运行，解决重复投入、应用冲突问题。

lAI中台使业务智能化，原有业务逻辑继续由业务系统管理，AI中台作为智能化应用增强服务，与业务系统对接实现快速智能化。

如：单据的流转、控制等业务逻辑继续由业务系统负责管理，AI中台提供智能化组件帮助，实现智能提单、审单、监控。

lAI中台和数据中台、业务中台同属中台服务，应能利用数据中台能力，与数据中心对接，获取数据。能与业务中台对接，能互相调取、支撑、融合。

lAI中台应能对接业务开发平台，在业务开发过程中，无缝接入AI模型和服务，与业务系统形成一体化，将AI能力运用到日常业务中。

如：系统建模过程中加入AI的组件和服务，系统构建完成后自动拥有AI智能业务能力。

4. 简单好用、适应性强

AI中台需要简单好用，易于理解，降低开发、实施人员、运维人员的学习成本。同时，要有灵活的适应性，能适应多样复杂业务应用环境的要求。

l业务、研发人员通过简单代码、习惯方式、熟悉的方法、惯用思路、简便操作进行接入、调试服务。能快速、简单实施部署，能和其他部署的业务系统不冲突，节约设备资源。

l面对客户提出的业务智能化场景要求，能快速理解转换为AI应用思路，快速找到合适的模型实现。面对实施环境的多样性，能快速满足和交付。

如：方便不同数据库的使用，方便不同数据源的接入，方便内外网的应用，方便不同系统的使用，方便PC、移动、智能硬件设备、VR/AR设备等不同终端的同时使用等。

l面对客户个性化要求，能快速调整模型适应。如不能通过已有的模型来满足时，能进行二次开发，在原有模型基础上再开发或开发新的模型。新研发出的模型又能共享作为他人的使用，或者他人开发的基础。

AI中台产品特点

AI中台产品具有一些共同的特点：

l强调数据安全，隔离

l云、端、边都方便部署

l对主流开源深度学习框架的支持和优化

阿里的飞天AI平台

从架构上来看，飞天平台从底层框架到解决方案层主要有三层：

1.云边端一体的高性能训练和推理引擎框架，包括 Alink、MNN、XDL、SQLFLOW、PAI TensorFlow、PAI Blade、Elastic DL等；

2.PAI机器学习平台：包括轻量级 AI 开发平台、AI大数据系统协同开发平台、AI 推理服务平台；

3.解决方案层：面向智能语音、视觉图像、自然语言处理、自动驾驶等领域

百度EasyDL平台

EasyDL是百度大脑推出的定制化AI训练及服务平台，支持面向各行各业有定制AI需求的企业用户及开发者使用。支持从数据管理与数据标注、模型训练、模型部署一站式AI开发流程，通过原始图片、文本、音频、视频类数据经过EasyDL加工、学习、部署可发布为公有云API、设备端SDK、本地化部署及软硬一体产品。

Amazon SageMaker

Amazon SageMaker 是一项完全托管的服务，可以帮助开发人员和数据科学家快速构建、训练和部署机器学习 (ML) 模型。SageMaker 完全消除了机器学习过程中每个步骤的繁重工作，让开发高质量模型变得更加轻松。

联想LeapAI平台

联想企业级人工智能平台LeapAI是一站式的私有化企业级统一AI平台，全面内置主流AI技术，通过端到端的数据、算法、算力管理，自动化模型训练与交互式使用体验，降低企业AI应用门槛，实现AI在企业全价值链的快速落地。

AI中台灵魂3问

一问：AI中台的目标究竟是什么？

AI中台解决的痛点问题，是企业智能应用研发过程中存在的响应缓慢、效率低下问题，包括但不限于：

1)“烟囱式”开发，项目成本高、不易集成，过程重复，缺乏能力沉淀；

讯享网

2)研发环节繁多，缺少优化、协同、自动化辅助，业务响应缓慢；

3)模型研发缺乏标准指导，服务接口混乱，难以维护管理；

4)缺少统一的数据访问渠道，数据获取难、标准不一致，重复的数据预处理与特征工程；

5)缺少统一的模型运行、监控平台，以及更新、维护机制；

6)基础资源分散管理，未得到充分利用，造成浪费。

现在的许多算法研发团队更像是算法外包团队，根据不同业务部门的需求各自构建阵地，逐步攻克目标，过程重复、效率有限。

AI中台是努力提供一个强大的AI能力支持中心，根据业务需要快速提供火力支援，迅速达成目的。

所以， AI中台应具备的能力包括：

1)多层次可复用：对于算法、模型的标准化研发指导，以及可复用服务封装能力；

2)服务统一化：统一的服务接口规范，支持服务的动态编排组合；

3)流程角色优化：研发流程拆分优化，清晰的研发角色定义，支持任务并行与角色协作，构建AI产品研发流水线；

4)自动化迭代：具备研发环节内部、环节之间的自动化迭代、流转功能；

5)对接数据平台：数据中台或其他基础数据服务对接，迅速接入标准化数据，乃至预处理数据；

6)运行监控：提供统一的模型运行环境和监控能力，以及模型更新机制；

7)资源管控：统一资源管理，包括计算资源、存储资源等，支持资源弹性调度。

由此，尝试给出AI中台的产品目标定义：

AI中台是一套完整的智能模型全生命周期管理平台和服务配置体系，基于数据平台服务，通过对智能服务的共享复用、对智能服务研发相关角色进行管理，以及研发流程的标准化、自动化，对前台业务提供个性化智能服务的迅速构建能力支持。

二问：AI中台的主要成分？

AI中台产品的四大实现步骤为：业务理解、模型学习、数据处理和运行监控。这四个步骤加上中台管理构成了AI中台主要成分 ：

1)业务理解：根据业务需求设计实施方案，服务编排，通用方案模板管理；

2)数据处理：包括数据获取和数据准备与分析；

3)模型学习：包括特征工程、模型训练和模型评估，以及可复用模型库、算法库管理；

4)运行监控：包括模型自动部署运行、性能监控和对外服务接口管理。

5)中台管理：为了便于对AI中台进行角色、权限统一控制和资源管控，还设置了中台管理模块。

三问：AI中台的流程及架构？

AI中台的主要功能组件包括：

1)业务理解：方案模板管理、方案设计、服务编排、服务共享等；

2)数据处理：数据展示、数据访问、数据分析、数据标注等；

3)模型学习：服务设计、特征处理、模型训练、模型追踪、模型库、算法库等；

4)运行监控：具体的产品封装、自动部署、性能监控、访问接口管理、模型更新和发布测试等；

5)中台管理：角色权限、资源管理、租户管理和流程控制等。

到AI中台总体流程包括：

l步骤1：业务需求理解：包括方案模板参考、方案设计、服务编排、服务共享等，如果需要复用其他服务，在这里进行访问配置；

l步骤2：数据处理：数据中台向上提供数据参考、向下提供模型训练及监控的支持；

l步骤3：模型训练：形成复杂的循环，其本身就是一个自动化迭代的过程；

l步骤4：封装：涉及监控和对外提供访问接口等功能；

l步骤5：中台管理：在底部提供构建支持。

步骤1：业务需求理解

业务理解的运转流程如下：

1)业务需求进来后，先从数据处理中心获取数据分析和参考，采集数据样本提供可视化支持；

2)进行方案选择：是否具备可复用的方案模板？“是”即直接复用方案，只需改变数据；“否”即进行方案设计。

3)分解方案到各个服务中，并对服务进行合理有效的编排。此处还需考虑哪些服务可供复用；

4)输出三个方面的内容：向数据处理中心输出数据获取要求；向运行监控中心输出产品封装指导；向模型学习中心输出模型训练任务。

业务理解流程涉及三个角色：

l业务分析师，分析相关方案设计、服务编排；

l数据分析师，提供数据建议、方案设计建议；

l算法工程师，考虑服务编排、服务之间的数据接口等。

步骤2：数据处理

数据处理流程如下：

1)从业务处理中心获取数据要求规范，通过数据访问对接数据中台；

2)基于数据中台向上提供数据分析功能、数据展示及功能可视化；

3)通过数据展示获得参考，对数据进行标注；

4)操作数据访问，返回到数据中台，对数据进行重新加工。

5)对外输出三个方面的内容：向业务理解中心输出数据分析参考；向模型学习中心输出模型训练数据；向运行监控中心输出生产数据。

数据处理涉及四个角色：

l数据分析师：对其中主要环节都有涉猎；

l业务分析师、算法工程师：关注数据展示；

l标注工程师：参与数据标注环节。

步骤3：模型训练

模型训练流程为：

1)接收来自业务理解中心的模型服务任务、数据处理中心的训练数据、运行监控中心的性能矫正信息，进行服务设计。服务设计时要考虑需要多少个模型？模型之间如何串联？算法库和模型库中是否有可供复用的算法与模型？

2)服务流程设计完成后进行特征处理；

3)将特征输入模型进行编码和训练；

4)将模型训练结果输入模型追踪的功能组件进行模型评估；

5)经过迭代获得最优训练模型输出到运行监控中心，同时输出数据操作到数据处理中心。

步骤4：封装

封装由运行监控中心进行模型更新和性能监控。流程为：

1)接收数据处理中心提供的生产数据，通过访问接口处理输出，写回到数据处理中心；

2)接收模型学习中心的已训练模型服务、业务理解中心的产品封装指导，对产品服务进行串联封装、部署、发布、测试；

*如果要封装的产品是对已有产品的更新，则先通过模型更新机制对现有模型进行合理启停更新操作之后再部署发布测试。

3)向上将交互数据提供给访问接口，并对访问接口进行配置；向下提供性能指标给性能监控，如果发现问题及时报警，并反馈到模型学习中心进行重新训练。

步骤5：中台管理

AI中台层级架构如图，AI中台处于数据模型服务与业务解决方案之间，向上连接业务向下连接数据，每层级都有可复用的机制。

中间部分从上而下分成业务理解、模型学习、数据处理三大板块；

4)右侧的运行监控对产品和模型进行统一封装、对外统一的访问接口等；

5)左侧是贯穿于整个流程始终的平台管理，包括角色权限、租户管理、流程控制、资源管理等。

案例：智能投顾机器人

以智能投顾机器人为例，了解AI中台如何解决实际业务中的智能化需求。

智能投顾是什么？

智能投顾是通过人工智能算法，在线提供自动化资产组合配置建议和财富的管理服务。

如宜信旗下的智能理财产品：投米RA，就是通过智能化的方式帮助用户做科学的资产配置，从而实现财富管理方式的升级。

智能投顾的AI服务及数据

智能交互，比如聊天机器人；

l客户画像，对于已有客户积累的公司来说这部分数据已经具备；

l筛选产品池，从现有理财产品池中筛选表现最优的产品，目前我们的理财产品池可以实现定时批量处理，自动化筛选出每个时期表现较好的精选产品；

l风险分析，作为一个金融领域的智能应用，风险分析尤为重要，用户能承受什么样的风险、基于该风险值能取得怎么样的回报等都要有合理的分析；

l资产配比，宜信目前有很多类型的资产，如基金、股票、房产等，还会进行全球化的资产配比，这就需要科学、理性、量化的分析，纳入风险因子进行综合考量，实现资产配比；

l投资产品推荐，参考用户画像里的个人信息、风险分析、资产配比等，为用户推荐最优化收益产品。

案例中的AI中台流程实施

1.业务理解

l首先考虑业务方案是什么样的？是否可复用？假设有可复用的方案，直接接入数据即可；如果没有可复用的方案，则需要设计新的方案。

如案例中要考虑：

ü数据接口配置和数据源/角色配置。如方案的数据接口有哪些？涉及到哪些服务？如何返回？每个结构里相关的角色有哪些？等。

ü哪些服务是可复用的？假设公司内部已经有了一个聊天机器人，那么这里完全可以用它来接待客户，承担智能聊天的功能；

ü财富产品画像服务也已经有了，直接把筛选产品词这部分产生的数据源接入进来即可；

ü资产配比服务可能有相关的线下模型，并且已经将它进行服务化封装。

ü以上这些服务都可复用，风险分析服务及后续投资产品推荐服务需要新建。

l可复用的服务、需新建的服务明确之后，各个团队可以并行开发，角色配置也是如此，如此很快便可进入下一阶段，提高了开发的效率。

2.模型学习

对风险分析服务进行实际模型设计与训练。

l从方案设计获取模型服务job，设计服务流程，输入的是一个筛选后的用户画像，设计了两个比较简单的模型

ü一个是风险承受能力测评模型，这个模型之上还复用了一个已有的特征筛选模型，配合将用户画像里适合模型的有用特征提取出来并输入到模型中；

ü另一个是流动性需求模型，评估资产需求，这里加了一个Python的代码片段对用户画像的数据进行加工再输入模型中。

ü底下还新建了一个模型，对数据进行合并和输出。

l该模型可进行自动训练、可视化追踪。模型编排确定后，任务自动发送给工程师，可以在终端上通过交互式编程界面进行开发，之后对代码进行上传，在托管服务器可以将代码直接发布到训练集群上，自动进行训练。

l然后将训练结果推送到追踪服务器上，获取相关数据进行模型调优反复迭代，同时追踪服务器会记录每一次指标及模型，可选择最优的模型发布给监控中心。

3.运行监控

l运行监控主要对服务和方案进行封装、测试、发布，包括接口配置。可以单个服务测试，也可以整个方案一起进行测试。

l服务上线之后，通过提供可视化支持以及相关统计报表对整个性能进行合理监控，一旦发现报警，可回到模型学习中心，进行重新训练。

4.数据处理

前面的流程都跟数据处理有关，可以直接交给数据中台来完成，AI中台只提供数据中台的访问接口，主要操作包括：

l通过数据中台的可视化工具观察数据

l利用数据中台数据模型预处理数据

l标注平台开展各模型数据标注

最终目标是支持模型训练过程中访问数据中台绑定训练数据，比如文件、数据库以及其他数据存储系统。

关于陪学网（www.pexue.com）：我们6年来专注于产品管理类课程的开发与制作，志在为产品经理、交互设计、平面设计、需求人员分享最新、最好的产品类课程。学员遍布国内外知名互联网产品团队：百度、新浪、腾讯、领英等

数据中台设计方案是什么（数据中台设计方案是什么）

相关推荐