大数据时代快速SQL引擎-Impala( 二 )
----大数据时代快速SQL引擎-Impala//---- http://
导读 | 随着大数据时代的到来 , Hadoop在过去几年以接近统治性的方式包揽的ETL和数据分析查询的工作 , 大家也无意间的想往大数据方向靠拢 , 即使每天数据也就几十、几百M也要放到Hadoop上作分析 , 只会适得其反 , 但是当面对真正的Big Data的时候 , Hadoop就会暴露出它对于数据分析查询支持的弱点 。 |
背景
甚至出现《MapReduce: 一个巨大的倒退》此类极端的吐槽 , 这也怪不得Hadoop , 毕竟它的设计就是为了批处理 , 使用用MR的编程模型来实现SQL查询 , 性能肯定不如意 。 所以通常我也只是把Hive当做能够提供将SQL语义转换成MR任务的工具 , 尤其在做ETL的时候 。
在Dremel论文发表之后 , 开源社区涌现出了一批基于MPP架构的SQL-on-Hadoop(HDFS)查询引擎 , 典型代表有Apache Impala、Presto、Apache Drill、Apache HAWQ等 , 看上去这些查询引擎提供的功能和实现方式也都大同小异 , 本文将基于Impala的使用和实现介绍日益发展的基于HDFS的MPP数据查询引擎 。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 李儒|三国杀:为什么叫李儒时代的骄傲,他到底有什么好骄傲的?厉害吗
- 梦幻西游|梦幻西游:诗情画意进入净台时代,郭无情买爆总17段野兽鞋
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- 帝国时代4|老外做的《帝国时代4》,究竟能有中国味吗?
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- 赛博朋克2077|王者荣耀:6种不花钱就能领皮肤碎片的方法!快速兑换心仪皮肤!
- 地下城与勇士|DNF:“全民云上”时代到来,一个过气小副本,究竟有何魅力?
- steam|目前Steam上什么游戏比较火?《帝国时代4》屈居第二
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?