编辑推荐

网易数帆开源API网关与容器云项目，让云原生生产落地“多快好

网易汪源：统一负载与多云环境的“开放姿态”，才是云原生

网易数帆如何用 Kubernetes“原语”搞定云原生中间件

快手打新挤爆券商系统，网易数帆推出券商稳定性保障方案

探索智慧校园新模式，网易有数在教育行业的实践分享

金融行业大数据治理之路——数据模型篇

【大数据之数据仓库】GreenPlum优化器对比测试

阿凡达2018-07-10 12:44

在《【大数据之数据仓库】选型流水记》一文中有提及，当时没有测试GreenPlum的quicklz压缩算法和ORCA查询优化器，考虑到quicklz压缩算法因为版权问题不会开源（详情请参阅： https://github.com/greenplum-db/gpdb/blob/master/src/backend/catalog/quicklz_compression.c），今天我们就来补上已开源的ORCA查询优化器这一段。

GreenPlum有2个查询优化器：legacy query optimizer（简称LQO）和pivotal query optimizer（简称PQO），而后者就是传说中的ORCA，我把之前LQO和PQO的TPCH对比测试做了简要汇总，整理在本文，以飨各位同学。测试拓扑延续《【大数据之数据仓库】基准测试之TPCH》中的测试环境，选择了10GB和100GB两种规格的数据集，以达到测试纯内存、内存+磁盘这样两种场景。

10GB

10GB数据集的数据基本都在内存里，没有了磁盘IO开销：