4000-520-616
欢迎来到免疫在线!(蚂蚁淘生物旗下平台)  请登录 |  免费注册 |  询价篮
主营:原厂直采,平行进口,授权代理(蚂蚁淘为您服务)
咨询热线电话
4000-520-616
当前位置: 首页 > 新闻动态 >
热卖商品
新闻详情
Delta Lake 学习笔记(二)_runzhliu大数据/容器日记-CSDN博客
来自 : CSDN技术社区 发布时间:2021-03-25

文章目录 1 Overview2 Delta Lake 依赖了什么 jar 包3 Summary

1 Overview

笔者认为 在研究一个开源项目的之前 看看起依赖管理的文件 比如说 Maven 的 pom.xml 文件 或者是 Sbt 的 build.sbt 文件。

2 Delta Lake 依赖了什么 jar 包

查看 build.sbt 文件 可以看到 Delta Lake 确实是构建于 Spark 之上的 因为他除了依赖 Spark 几个依赖外 没有再额外引入一些 jar 包了 也是因为 Spark 项目本身比较庞大 已经引入了足够用的一些依赖工具包了。

libraryDependencies Seq( // Adding test classifier seems to break transitive resolution of the core dependencies org.apache.spark %% spark-hive % sparkVersion.value % provided , org.apache.spark %% spark-sql % sparkVersion.value % provided , org.apache.spark %% spark-core % sparkVersion.value % provided , org.apache.spark %% spark-catalyst % sparkVersion.value % provided , // Test deps org.scalatest %% scalatest % 3.0.5 % test , org.apache.spark %% spark-catalyst % sparkVersion.value % test classifier tests , org.apache.spark %% spark-core % sparkVersion.value % test classifier tests , org.apache.spark %% spark-sql % sparkVersion.value % test classifier tests 

sbt 有个插件可以参考下 可以输出类似于 Maven dependency tree 的效果。

关于依赖 主要定位到文件的 libraryDependencies 可以看到 基本都是 provided 所以这个时候用 dependencyTree 是打不出依赖树的。

\"image_1d9d59de2v1pql6mc11m646q5c.png-164.2kB\"

上图可以看到 插件的 dependency 有很多类似的命令 输入 dependencyTree 命令看到如下输出 只会默认打印 compile 的依赖。

\"image_1d9d5g7n517ploa91rpb189te0219.png-101.7kB\"

这里还有一个命令 provided:dependencyTree 表示把 provided 的依赖树也会打印出来。

 provided:dependencyTree[warn] Credentials file /Users/runzhliu/.bintray/.credentials does not exist[info] io.delta:delta-core_2.11:0.1.1-SNAPSHOT[info] -org.apache.spark:spark-catalyst_2.11:2.4.2[info] | -commons-codec:commons-codec:1.10[info] | -org.antlr:antlr4-runtime:4.7[info] | -org.apache.spark:spark-core_2.11:2.4.2 [S][info] | | -com.clearspring.analytics:stream:2.7.0[info] -org.apache.spark:spark-sketch_2.11:2.4.2[info] | -org.apache.spark:spark-tags_2.11:2.4.2 [S][info] | | -org.spark-project.spark:unused:1.0.0[info] | |[info] | -org.spark-project.spark:unused:1.0.0[info] |[info] -org.apache.spark:spark-tags_2.11:2.4.2 [S][info] | -org.spark-project.spark:unused:1.0.0[info] |[info] -org.apache.xbean:xbean-asm6-shaded:4.8[info] -org.spark-project.spark:unused:1.0.0[info][success] Total time: 3 s, completed 2019-4-27 0:04:50

如上图 可以打印出所有的依赖树。

3 Summary

Delta Lake 是构建于 Spark 之上的项目 所以依赖都关于 Spark 的其他 lib。由于 Delta Lake 并没有依赖更多的项目 Spark 其实已经很多了… 所以后面我们去探索代码的时候 只要有 Spark 基础的同学 应该都可以很快上手。

本文链接: http://deltaresearch.immuno-online.com/view-748257.html

发布于 : 2021-03-25 阅读(0)
公司介绍
品牌分类
联络我们
服务热线:4000-520-616
(限工作日9:00-18:00)
QQ :1570468124
手机:18915418616
官网:http://