470
社区成员
数据驱动的研究范式不仅吸引着广大学者,业界从业人员也在用自己的行动构建着为数众多的开源项目,成为一个潮流,从国际开源基金会到企业,再到高校实验室。由于开源软生态的持续发展,源源不断的开放数据集为相关研究工作带来了巨大的便利性与创新机会。
其中最著名要算是 Linux Foundation 旗下的 CHAOSS 开源社区了。CHAOSS 不仅通过社区的方式系统构建了开源社区的度量指标体系,还通过诸如 GrimoireLab 这样的开源项目进行了落地实现,并被包括像 LFX Insights、Cauldron.io、Bitergia Analytics Platform 等这样的组织所采用。国内像 PingCAP 也创立了一个 OSS Insight 的项目,在展示旗下 TiDB 数据库强大性能的同时,也能为开源社区带来各种实时洞察;而我们 X-lab 开放实验室也通过创立 OpenDigger、Hypercrx 这类项目为社区的研究人员与企业用户提供数据与服务支持。例如,最近基于 OpenDigger 开源项目,我们就上线了“木兰开源社区数据大屏”,帮助木兰社区通过持续的数据洞察来辅助项目的孵化与发展。
虽然这些数据工具和服务已经取得了部分成效,但由此所带来的一个重要问题就是缺乏相关的基准、标注与评价规范,造成了一个“有数据无基准”的局面。一个开源项目处于怎样的发展位置、一个社区的健康成熟度达到了怎样的水平、企业 OSPO 能力处于行业什么位置、开发者贡献度、项目影响力等基础数据与评价,都是数据使用方迫切需要的开源领域知识。而这些都需要多方来共同开展研究与实践,形成一套与指标、数据相匹配的基准。
原文链接:https://mp.weixin.qq.com/s/amFCv_pcU8E6YJbv5hcc7w
原文账户: Xlab开放实验室