一文清楚OLAP产品:Apache Doris、DorisDB、StarRocks 和 SelectDB

一文清楚OLAP产品:Apache Doris、DorisDB、StarRocks 和 SelectDB

经验文章nimo972025-02-26 11:14:2710A+A-

1. Apache Doris 的起源与发展

Apache Doris 最初是百度为解决凤巢统计报表需求而开发的专用系统,随着百度业务的扩展,逐渐承担起内部统计报表和多维分析的任务。2013 年,百度对 Doris 进行了 MPP(大规模并行处理)框架的升级,并将其命名为 Palo。2017 年,百度将 Palo 开源,2018 年贡献给 Apache 基金会,由于与国外数据库厂商重名,最终改回最初的名字 Apache Doris。

Apache Doris 是一个高性能、高可用、高扩展的分布式分析型数据库,广泛应用于实时数据分析、OLAP 报表等场景。其开源社区主要由百度 Doris 团队主导,吸引了小米、美团、字节跳动等企业的贡献

2. DorisDB 的诞生与争议

2020 年 2 月,百度 Doris 团队的部分成员离职创业,基于 Apache Doris 开发了商业化闭源产品 DorisDB。DorisDB 在技术上继承了 Apache Doris 的核心能力,并进行了优化和改进,但其商业化闭源的策略引发了争议。

争议的核心在于:

? 品牌混淆:DorisDB 在宣传中自称是“Apache Doris 的主创团队”,甚至试图通过品牌名称的相似性吸引用户流量,导致许多用户误以为 DorisDB 是 Apache Doris 的商业版。

? 社区分化:DorisDB 团队几乎不再向 Apache Doris 贡献代码,甚至挖走 Apache Doris 企业用户的员工,导致社区关系紧张。

? 商标问题:Apache 基金会认为 DorisDB 的名称与 Apache Doris 过于相似,存在品牌侵权问题,最终迫使 DorisDB 改名为 StarRocks。

3. StarRocks 的崛起

DorisDB 因商标问题更名为 StarRocks,并继续发展其商业化产品。StarRocks 在技术上继承了 Apache Doris 的基因,并进一步优化了性能,支持向量化执行引擎、存算分离架构等新特性,广泛应用于实时数据分析、多维报表等场景。

然而,StarRocks 的开源协议(Elastic License)引发了新的争议:

? 开源协议问题:StarRocks 最初采用 Elastic License,这是一种“伪开源”协议,限制了代码的自由使用和分发,导致其无法与 Apache Doris 等主流开源项目兼容。

? 社区对立:StarRocks 团队在 Apache Doris 社区的关键技术投票中投出反对票(如向量化引擎的合并),进一步加剧了双方的对立。

4. SelectDB 的加入

SelectDB 是基于 DorisDB(StarRocks)的另一个分支,背后厂商飞轮科技(阿里云托管服务)自称是“名门正宗”,并强调其对社区的贡献。SelectDB 在技术上进行了大量改进,特别是在云原生领域,同时也在努力发展自己的商业特色,如技术支持和云服务。

SelectDB 的出现进一步复杂化了 Doris 生态的格局,形成了 Apache Doris、StarRocks 和 SelectDB 三足鼎立的局面。

5. 爱恨情仇的总结

? 技术传承:Apache Doris 是技术的源头,DorisDB(StarRocks)和 SelectDB 都是在其基础上发展而来,技术上存在高度相似性。

? 社区分化:DorisDB(StarRocks)的商业化策略导致与 Apache Doris 社区的分化,双方在品牌、代码贡献和社区规则上存在激烈冲突。

? 开源与商业化的博弈:Apache Doris 坚持开源社区路线,而 StarRocks 和 SelectDB 则更倾向于商业化发展,这种路线分歧是双方矛盾的根源。

点击这里复制本文地址 以上内容由nimo97整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

尼墨宝库 © All Rights Reserved.  蜀ICP备2024111239号-7