收藏官网首页
查看: 8544|回复: 0

Zeppelin交互式数据分析

36

主题

69

帖子

265

积分

中级会员

Rank: 3Rank: 3

积分
265
跳转到指定楼层
楼主
发表于 2016-6-10 18:17:44 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
校园创客福利
本帖最后由 feel 于 2016-6-10 18:24 编辑

Zeppelin是一个Apache的孵化项目.
一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享)
可实现你所需要的:
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作

数据可视化
一些基本的图表已经包含在Zeppelin中。可视化并不只限于SparkSQL查询,后端的任何语言的输出都可以被识别并可视化。
我们可以写spark  sql   进 实时交互查询及可视化

下面是代码示例
  1. import org.apache.commons.io.IOUtils
  2. import java.net.URL
  3. import java.nio.charset.Charset

  4. // Zeppelin creates and injects sc (SparkContext) and sqlContext (HiveContext or SqlContext)
  5. // So you don't need create them manually

  6. // load bank data
  7. val bankText = sc.parallelize(
  8.     IOUtils.toString(
  9.         new URL("https://s3.amazonaws.com/apache-zeppelin/tutorial/bank/bank.csv"),
  10.         Charset.forName("utf8")).split("\n"))

  11. case class Bank(age: Integer, job: String, marital: String, education: String, balance: Integer)

  12. val bank = bankText.map(s => s.split(";")).filter(s => s(0) != "\"age\"").map(
  13.     s => Bank(s(0).toInt,
  14.             s(1).replaceAll("\"", ""),
  15.             s(2).replaceAll("\"", ""),
  16.             s(3).replaceAll("\"", ""),
  17.             s(5).replaceAll("\"", "").toInt
  18.         )
  19. ).toDF()
  20. bank.registerTempTable("bank")
复制代码


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

加入Q群 返回顶部

版权与免责声明 © 2006-2024 Gizwits IoT Technology Co., Ltd. ( 粤ICP备11090211号 )

快速回复 返回顶部 返回列表