使用sbt正确构建罐子



我有一个map reduce .scala文件,如下所示:

import org.apache.spark._
object WordCount {
  def main(args: Array[String]){
    val inputDir = args(0)
    //val inputDir = "/Users/eksi/Desktop/sherlock.txt"
    val outputDir = args(1)
    //val outputDir = "/Users/eksi/Desktop/out.txt"
    val cnf = new SparkConf().setAppName("Example MapReduce Spark Job")
    val sc = new SparkContext(cnf)
    val textFile = sc.textFile(inputDir)
    val counts = textFile.flatMap(line => line.split(" "))
      .map(word => (word, 1))
      .reduceByKey(_ + _)
    counts.saveAsTextFile(outputDir)
    sc.stop()
  }
}

当我使用setMaster("local[1]")参数运行代码时,它工作得很好。

我想把这个代码放在.jar中,并把它扔到S3中,以便使用AWS EMR。因此,我使用下面的build.sbt来做到这一点

name := "word-count"
version := "0.0.1"
scalaVersion := "2.11.7"
// additional libraries
libraryDependencies ++= Seq(
  "org.apache.spark" % "spark-core_2.10" % "1.0.2"
)

它生成了一个jar文件,但是里面没有我的scala代码。当我提取.jar 时,我看到的只是一个清单文件

当我运行sbt package时,我得到的是:

[myMacBook-Pro] > sbt package
[info] Loading project definition from /Users/lele/bigdata/wordcount/project
[info] Set current project to word-count (in build file:/Users/lele/bigdata/wordcount/)
[info] Packaging /Users/lele/bigdata/wordcount/target/scala-2.11/word-count_2.11-0.0.1.jar ...
[info] Done packaging.
[success] Total time: 0 s, completed Jul 27, 2016 10:33:26 PM

我应该怎么做才能创建一个像一样工作的合适的jar文件

WordCount.jar WordCount

Ref:它生成了一个jar文件,但其中没有我的scala代码。当我提取.jar时,我看到的只是一个清单文件

确保您的WordCount.scala在根目录或src/main/scala

发件人http://www.scala-sbt.org/1.0/docs/Directories.html

源代码可以像hello/hw.scala一样放在项目的基本目录中。然而,大多数人不会在真正的项目中这样做;太杂乱了。

默认情况下,sbt对源文件使用与Maven相同的目录结构(所有路径都相对于基本目录):

最新更新