【大数据之数据仓库】选型流水记
去年10月份放下了一手打造的缓存服务(NKV和NCR),投身到新成立的数据科学中心从事大数据存储相关的工作,新的部门、新的项目、新的知识,脚踏实地,从零开始。
【大数据之数据仓库】TPCH工具使用指南
本文主要为大家分享TPCH工具使用指南,操作也比较简单。
【大数据之数据仓库】TPCDS工具使用指南
本文主要介绍TPCDS工具,感兴趣的话可以与前面的TPCH做对比。
【大数据之数据仓库】基准测试之TPCH
三组测试中,表都没有进行分区,系统没有做深度定制优化,查询性能greenplum胜出、sql覆盖率也是greenplum胜出;kudu性能指标最差
【大数据之数据仓库】基准测试之TPCDS
三组测试中,表都没有分区,系统也没有做深度定制优化,查询性能parquet最优、sql覆盖率greenplum最广。
【大数据之数据仓库】kudu客户端java驱动缺陷
理论上,1张表64个buckets均匀分布在6台物理机上,数据随机产生,不会出现数据倾斜的现象。但事实是出现了1台物理机的资源消耗特别严重,而其余5台平稳的现象
【大数据之数据仓库】kudu性能测试报告分析
这篇博文主要的内容不是分析说明kudu的性能指标情况,而是分析为什么kudu的scan性能会这么龊!当初对外宣传可是加了各种逆天黑科技的呀。
GreenPlum PK DeepGreen(TPCH)
两个执行计划的关联计算任务不在一个量级,耗时也显而易见了,这就是为什么DeepGreen比GreenPlum执行慢的原因!
【大数据之数据仓库】GreenPlum优化器对比测试
今天我们就来补上已开源的ORCA查询优化器这一段。我把之前LQO和PQO的TPCH对比测试做了简要汇总,整理在本文,以飨各位同学。
【大数据之数据仓库】安装部署GreenPlum集群
本篇将向大家介绍如何快捷的安装部署GreenPlum测试集群,大家可以跟着我一块儿实践一把^_^
【大数据之数据仓库】安装部署phpPgAdmin
因为gpAdmin的安装很方便,二进制包直接装本机就能使用,而phpPgAdmin相对而言略麻烦,所以本篇就来介绍下phpPgAdmin的安装部署。
HAWQ versus GreenPlum
因为对HAWQ接触有限,没有深入具体了解,所以很多信息都是来自于博文,人云亦云,我把看过的资料简要整理,希望对感兴趣的同学有一些帮助^_^
【大数据之数据仓库】数据迁移到GreenPlum的方式
今天的博文,向各位介绍下怎么把外部数据源的数据迁移到GreenPlum上来,我们选择了4种类型的数据源:MySQL、PostgreSQL、HDFS、TEXT。
【GreenPlum】GreenPlum服务来了!
今天的博文 向大家介绍下GreenPlum这个系统 ,因为GreenPlum太过于庞大,今天就先选择部分功能点来展开。
相关产品推荐