Shark - 数据仓库系统
Apache
跨平台
Scala
软件简介
Shark 是一个大型的数据仓库系统为 Spark 的设计与
Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快
30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。
要求:
-
Scala 2.10.3
-
AMPLab’s Hive 0.11
-
Spark 0.9.x