Apache Drill 1.9.0 发布,大型数据集分析系统
时间:2016-12-02 06:22 来源:linux.it.net.cn 作者:IT
Apache Drill 1.9.0 发布了。主要更新如下:
新特性:
-
Asynchronous Parquet reader
-
Parquet filter pushdown
-
Dynamic UDF support
-
HTTPD format plugin
改进:
-
[DRILL-1950] - Implement filter pushdown for Parquet
-
[DRILL-3178] - csv reader should allow newlines inside quotes
-
[DRILL-4309] - Make this option store.hive.optimize_scan_with_native_readers=true default
-
[DRILL-4653] - Malformed JSON should not stop the entire query from progressing
-
[DRILL-4674] - Allow casting to boolean the same literals as in Postgre
-
[DRILL-4752] - Remove submit_plan script from Drill distribution
-
[DRILL-4771] - Drill should avoid doing the same join twice if count(distinct) exists
-
[DRILL-4792] - Include session options used for a query as part of the profile
-
[DRILL-4800] - Improve parquet reader performance
-
[DRILL-4864] - Add ANSI format for date/time functions
-
[DRILL-4865] - Add ANSI format for date/time functions
-
[DRILL-4927] - Add support for Null Equality Joins
-
[DRILL-4967] - Adding template_name to source code generated using freemarker template
-
[DRILL-4986] - Allow users to customize the Drill log file name
-
[DRILL-4987] - Use ImpersonationUtil in RemoteFunctionRegistry
下载地址:
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel.
该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
数据结构:
兼容已有的 SQL 环境和 Apache Hive:
(责任编辑:IT)
Apache Drill 1.9.0 发布了。主要更新如下: 新特性:
改进:
下载地址: 为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel. 该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
数据结构:
兼容已有的 SQL 环境和 Apache Hive: |