2025年面向智能化软件开发的开源生态大数据

面向智能化软件开发的开源生态大数据点击上方蓝字关注我们 面向智能化软件开发的开源生态大数据 张洋 1 王涛 1 尹刚 2 3 余跃 1 黄井泉 3 1 国防科技大学计算机学院 湖南 长沙 2 绿色计算产业联盟 北京 3 湖南智擎科技有限公司 湖南 长沙 摘要 开源软件开发过程中包含大量有价值的数据 针对其数据规模巨大

大家好,我是讯享网,很高兴认识大家。


讯享网

点击上方蓝字关注我们

面向智能化软件开发的开源生态大数据

张洋1, 王涛1, 尹刚2,3, 余跃1, 黄井泉3

1 国防科技大学计算机学院,湖南 长沙

2 绿色计算产业联盟,北京

3 湖南智擎科技有限公司,湖南 长沙

摘要开源软件开发过程中包含大量有价值的数据,针对其数据规模巨大、碎片分散、快速膨胀的特点,研究了软件工程开源生态大数据体系,提出了一种自生长的采集处理框架与汇聚共享环境,阐述了基于软件工程开源生态大数据的智能化软件开发,以及基于软件工程开源生态大数据分析挖掘的典型应用,为面向智能化软件开发的开源生态大数据研究与应用提供相关指导。

关键词 智能化软件开发 ; 开源软件 ; 开源生态 ; 大数据

论文引用格式:

张洋, 王涛, 尹刚, 等. 面向智能化软件开发的开源生态大数据[J]. 大数据, 2021, 7(1): 94-106.

ZHANG Y, WANG T, YIN G, et al. Big data of open source ecosystem for intelligent software development[J]. Big Data Research, 2021, 7(1): 94-106.


1 引言

自20世纪末以来,开源软件在现代社会的各个领域得到了广泛的应用,取得了令人瞩目的成就。Black Duck公司2017年的调查报告显示,全球86%的企业在搭建业务时全部或部分使用了开源软件,其中60%的公司还在增加开源软件的使用比重。开源软件的开发活动以互联网软件社区为平台,其开发过程和制品数据对外开放,允许不同类型的开发者参与其中,形成一种大众参与的开源模式,给开源世界带来了强大的生产力。开源模式中大众贡献者可以自由地实践分布式协同,催生了许多群体化软件开发方法和一系列优质的开源社区。特别是,近年来云计算、大数据、人工智能、物联网等对国民经济发展产生重大影响的信息化基础设施绝大多数是以开源软件为核心构建而成的,开源软件已经在全球软件产业占据主导地位。

与传统工业化软件生产相比,大众化开源软件生产的开发数据和应用数据高度开放且规模巨大。目前,支持大众化软件生产和应用活动的开源社区包含了大量有价值的数据,如软件代码、软件版本、容器镜像等软件制品和过程数据,以及软件问答、软件评价等软件交流和反馈数据,这些数据涵盖开发数据、交付数据及应用数据等全维度数据类型,涉及开发制品、开发过程、软件产品、软件镜像、咨询讨论与应用问答等各个方面,具有规模巨大、碎片分散、快速膨胀的特点。如何构造高扩展、高性能的软件工程开源生态大数据处理体系结构,建立多源异质、广泛关联、语义丰富、覆盖全面的软件工程开源生态大数据环境,分析提炼软件知识并设计实现辅助开发工具,以提升软件开发的智能化程度,已成为重要的科学问题。

本文研究了软件工程开源生态大数据体系,并提出了一种自生长的采集处理框架与汇聚共享环境;然后,介绍了基于软件工程开源生态大数据的智能化软件开发,以及基于软件工程开源生态大数据分析挖掘的典型应用,以期为面向智能化软件开发的开源生态大数据研究与应用提供相关指导。

2 软件工程开源生态大数据

传统软件数据挖掘主要关注同质和局部软件工程数据,难以适应软件工程开源生态大数据呈现出的异构多源、类型复杂、持续增长、广泛互联等新特性,全局视角下考察软件大数据价值仍面临巨大挑战

小讯
上一篇 2025-01-17 20:08
下一篇 2025-02-28 13:04

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/122622.html