<p class="f_center"> <img src="http://dingyue.ws.126.net/2024/0530/5d8e3d8cg00seaddv0082d200hs002sg00it002x.gif"/><br/></p><p id="2OFP0FSB"> 作者 | 褚杏娟、Tina</p><p id="2OFP0FSC"> 在没有任何公告的情况下,知名开源大规模并行处理 (MPP) 数据库 Greenplum 突然就“404”了,而有网友反馈之前还可以访问下载,今天已经打不开了。</p><p class="f_center"> <img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0530%2Fa482f65aj00seaddx009xd200u000f2g00fe007q.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="2OFP0FSE"> https://github.com/greenplum-db/gpdb</p><p id="2OFP0FSF"> 根据提示,5 月 24 日,Greenplum 源代码仓库的访问权限修改为了“只读”,同时还清空了原有的 branch、tag、pr、issue 等信息。</p><p class="f_center"> <img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0530%2F0f809b67j00seaddy0025d200u000chg00id007m.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="2OFP0FSH"> 另外,值得注意的是,Greenplum 在国内的官网也已经打不开了。</p><p class="f_center"> <img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0530%2Fad789215j00seaddz0028d200u000dbg00id0085.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="2OFP0FSJ"> Greenplum 号称是是业界第一个开源的大规模并行(MPP)数据库,目前在 DB-Engines 的全球排行榜上为列第 48 位。</p><p class="f_center"> <img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0530%2F98bca884j00seaddz0046d200u0009wg00id0061.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/><br/></p><p id="2OFP0FSL"> 或影响当前国内数仓市场格局</p><p id="2OFP0FSM"> Greenplum 对国内数据库行业产生了影响深远,很多数据库公司创始人都曾在参与过 Greenplum 项目。</p><p id="2OFP0FSN"> 比如,拓数派(PieCloudDB)创始人冯雷,曾任 Pivotal(中国)的创始人兼总经理;四维纵横(YMatrix)创始人姚延栋,曾是 Greenplum 北京研发中心总经理、Greenplum 中国开源社区创始人;偶数科技(OushuDB)创始人常雷,曾创建 Greenplum 数据库高级研究与开发中国团队;酷克数据(HashData)联合创始人兼 CEO 简丽荣,曾在 Pivotal 从事 Greenplum 的开发。</p><p id="2OFP0FSO"> 对于 Greenplum 在社区的这一突然变化,酷克数据 HashData 研发 VP、Cloudberry Database 研发负责人杨瑜向 InfoQ 表示,严格来说这是源码归档,不是很多网友所说的“闭源”,但我们不清楚后续官方会采取什么动作。</p><p id="2OFP0FSP"> 对于该事件产生的后续影响,杨瑜认为主要有三点:</p><p id="2OFP0FSQ"> 首先,对于现有 Greenplum 社区用户来说,面临后续无法更新、升级和获得安全支持。社区用户可能需要寻找替代方案,或者尝试自行解决遇到的问题,这无疑增加了技术团队的负担和成本。</p><p id="2OFP0FSR"> 其次,可能影响当前国内数据仓库市场的竞争格局。目前国内有基于 Greenplum 的衍生版或云服务,如果团队自身没有良好的技术储备,较大依赖上游,将在后续竞争中逐渐退出,具备真正技术实力的团队会获得更多机会并加强地位。</p><p id="2OFP0FSS"> 同时,本次事件也对上下游生态系统产生影响,一些开发者可能会转向其他数据仓库项目,相关服务商也会寻找新的合作伙伴。大多数 Greenplum 衍生产品都跟随 Greenplum 上游代码的变化,归档意味着引用 Greenplum 代码不那么容易了。</p><p id="2OFP0FST"> 对于该事件是否会对酷克数据(HashData)产生影响的疑问,杨瑜表示,其目前拥有除 VMware 之外的第二大 Greenplum 开发者团队,本次 Greenplum 归档事件对团队影响较小。</p><p id="2OFP0FSU"> “我们在去年也开源了衍生版本 Cloudberry Database,能够实现对 Greenplum 的充分兼容和无缝迁移,我们将努力推动 Cloudberry Database 发展,让它成为 Greenplum 用户的替代选型方案。”杨瑜说道。</p><p id="2OFP0FSV"> 有专家表示,这利好了国内同类数据库,不过因为利益相关,该专家并未表达更多。据悉,国内著名开源数据仓库还有 Doris、StarRocks、ClickHouse 等。</p><p id="2OFP0FT0"> 另外,开源项目的主导权问题也引起了大家的关注。如今很多开源项目背后都是大公司在主导。在该事件发生后,有专家表示,开源项目还是要纳入基金会,公司管理的开源项目太容易受公司政策和存亡影响了。</p><p id="2OFP0FT1"> 开源 9 年,为何一朝变卦?</p><p id="2OFP0FT2"> 二十世纪末期,随着数据量开始增加,当时的数据仓库开始性能不足。解决方案除了 NoSQL、Hadoop,还有集群关系系统,即大规模并行处理系统。Greenplum 就是这一路线的典型代表。</p><p id="2OFP0FT3"> Greenplum 最初由 Scott Yara 和 Luke Lonergan 于 2003 年创立,由两家公司 Didera 和 Metapa 合并而成。从一开始,Greenplum 就基于流行且广泛使用的开源数据库 PostgreSQL。Greenplum 与 PostgreSQL 版本保持同步,直到 8.2.15 版本从 PostgreSQL 主线分叉。</p><p id="2OFP0FT4"> 2007 年,Greenplum 发布了第一款产品,即 3.0 版。之后的版本增加了许多新功能,其中最引人注目的是镜像和高可用,而当时底层的 PostgreSQL 还无法提供这些。</p><p id="2OFP0FT5"> 2010 年,MPP 数据库领域开始整合,许多小公司被大公司收购。EMC 在 2010 年 7 月收购了 Greenplum,当时 Greenplum 4.0 版本刚刚发布。EMC 将 Greenplum 打包成一个硬件平台,即数据计算设备 (DCA)。尽管 Greenplum 最初是纯软件产品,客户自己提供硬件平台,但 DCA 还是成为最受欢迎的平台。</p><p id="2OFP0FT6"> 2012 年,EMC 收购了知名的 Pivotal Labs,这家公司从事结合结对编程、敏捷方法的应用程序开发,并使客户参与开发过程。事实证明,这不仅对 Greenplum 未来的发展进程非常重要,也为 2013 年 Greenplum 从 EMC 剥离出来的产品命名。</p><p id="2OFP0FT7"> 剥离后的公司名为 Pivotal,吸纳了 EMC 和 VMware 的资产,包括以 Java 为中心的 Spring 框架、RabbitMQ、PaaS Cloud Foundry 和内存数据网格 Apache Geode(商业名称为 GemFire)。</p><p id="2OFP0FT8"> 2015 年,Pivotal 宣布采用开源策略。Pivotal 将把大部分软件捐赠给了 Apache 基金会,这些软件遵循 Apache 免费许可规则。不过,它保留了该软件的订阅式企业版本,并继续销售和支持该版本。</p><p id="2OFP0FT9"> Greenplum 管理层在 2015 年之前就考虑过开源战略,但认为行业尚未做好准备。直到 2015 年,许多客户要求开源。此外,Pivotal 认为开源也能吸引开发人才,通过社区参与加快 Greenplum 功能添加、最终将 Greenplum 合并到当前 PostgreSQL 版本的能力更强。</p><p id="2OFP0FTA"> 作为开源计划的一部分,Pivotal 成立了两个小组:第一个小组负责处理用户有关 Greenplum 的问题,Pivotal 数据人员负责该小组并及时提供答案;第二个小组是 Greenplum 开发社区的对话工具。</p><p id="2OFP0FTB"> 而之后,Pivotal 在 2020 年又被 VMWare 收购回去。被收购前,Pivotal 已于 18 年在纽交所上市,但市场表现一直不如人意,还因在财报没有提及公司 PaaS 技术与 Kubernetes 不兼容问题而被股东提起诉讼。</p><p id="2OFP0FTC"> 2023 年,VMWare 已经将 Greenplum 更新到了 7 大版本,目前最新的是 7.1。VMware Greenplum 7 建立在开源代码的基础上,植根于 PostgreSQL 12,并整合了近 5 年以来 PostgreSQL 的发布版本。</p><p id="2OFP0FTD"> 另外,VMware 还试着放入 AI 元素。官方称这是一个“统一分析和人工智能”平台,支持向量数据并行处理,号称“可与最新大语言模型方法(LLM)集成”、“能够可帮助企业充分利用其数据资源”。</p><p id="2OFP0FTE"> 同样在去年,博通以 610 亿美元的高价成功完成对 VMware 的收购,此外博通还要承担 VMware 的 80 亿美元的净债务。也就是说,现在 Pivotal Greenplum 属于博通资产。</p><p id="2OFP0FTF"> 因此,外界纷纷猜测此次 Greenplum 突然归档源代码仓库是受此影响。毕竟博通在开源社区的声誉并不好,甚至有网友认为其在软件方面还不如甲骨文。</p><p id="2OFP0FTG"> https://www.oreilly.com/library/view/data-warehousing-with/9781491983539/ch01.html</p>
讯享网

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/202773.html