scala 错误 SparkContext：初始化 SparkContext 时出错

Question

提问by G.Saleh

I am using spark-1.5.0-cdh5.6.0. tried the sample application (scala) command is:

我正在使用spark-1.5.0-cdh5.6.0。尝试的示例应用程序（scala）命令是：

> spark-submit --class com.cloudera.spark.simbox.sparksimbox.WordCount --master local /home/hadoop/work/testspark.jar

Got the following error:

得到以下错误：

 ERROR SparkContext: Error initializing SparkContext.
java.io.FileNotFoundException: File file:/user/spark/applicationHistory does not exist
        at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:534)
        at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:747)
        at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:524)
        at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:424)
        at org.apache.spark.scheduler.EventLoggingListener.start(EventLoggingListener.scala:100)
        at org.apache.spark.SparkContext.<init>(SparkContext.scala:541)
        at com.cloudera.spark.simbox.sparksimbox.WordCount$.main(WordCount.scala:12)
        at com.cloudera.spark.simbox.sparksimbox.WordCount.main(WordCount.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:606)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:672)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain(SparkSubmit.scala:180)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

Answer 1

回答by Yuval Itzchakov

Spark has a feature called "history server" which allows you to browse historical events after the SparkContextdies. This property is set via setting spark.eventLog.enabledto true.

Spark 有一个名为“历史服务器”的功能，它允许您在SparkContext死亡后浏览历史事件。此属性通过设置spark.eventLog.enabled为来设置true。

You have two options, either specify a valid directory to store the event log via the spark.eventLog.dirconfig value, or simply set spark.eventLog.enabledto falseif you don't need it.

您有两个选项，要么通过spark.eventLog.dir配置值指定一个有效的目录来存储事件日志，要么在不需要时简单地设置spark.eventLog.enabled为 false。

You can read more on that in the Spark Configurationpage.

您可以在Spark 配置页面中阅读更多相关内容。

Answer 2

回答by Nagesh Singh Chauhan

I got the same error which working with nltk in spark, To fix this I just removed all the nltk related properties from spark-conf.default.

我在 spark 中使用 nltk 时遇到了同样的错误，为了解决这个问题，我刚刚从 spark-conf.default 中删除了所有与 nltk 相关的属性。

scala 错误 SparkContext：初始化 SparkContext 时出错

提问by G.Saleh

回答by Yuval Itzchakov

回答by Nagesh Singh Chauhan

相关推荐

最近更新

标签

scala 错误 SparkContext：初始化 SparkContext 时出错

提问by G.Saleh

回答by Yuval Itzchakov

回答by Nagesh Singh Chauhan

相关推荐

将 Java Future 转换为 Scala Future

scala 如何开始使用 Akka Streams？

scala 如何使用 Spark 计算累积总和

Scala：流上的 filter 和 takeWhile 有什么区别？

相关推荐

最近更新

标签