scala Spark：有没有办法打印出 spark-shell 和 spark 的类路径？

Question

提问by catrapture

I can run a spark job successfully in the spark-shell but when its packages and run through spark-submit Im getting a NoSuchMethodError.

我可以在 spark-shell 中成功运行一个 spark 作业，但是当它的包并通过 spark-submit 运行时，我得到了一个 NoSuchMethodError。

This indicates to me some sort of mismatch of classpaths. Is there a way I can compare the two classpaths? Some sort of logging statement?

这向我表明了类路径的某种不匹配。有没有办法比较这两个类路径？某种日志语句？

Thanks!

谢谢！

15/05/28 12:46:46 ERROR Executor: Exception in task 1.0 in stage 0.0 (TID 1)
java.lang.NoSuchMethodError: scala.Predef$.ArrowAssoc(Ljava/lang/Object;)Ljava/lang/Object;
    at com.ldamodel.LdaModel$$anonfun$$anonfun$apply.apply(LdaModel.scala:22)
    at com.ldamodel.LdaModel$$anonfun$$anonfun$apply.apply(LdaModel.scala:22)
    at scala.collection.TraversableLike$$anonfun$map.apply(TraversableLike.scala:244)
    at scala.collection.TraversableLike$$anonfun$map.apply(TraversableLike.scala:244)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
    at scala.collection.mutable.WrappedArray.foreach(WrappedArray.scala:34)
    at scala.collection.TraversableLike$class.map(TraversableLike.scala:244)
    at scala.collection.AbstractTraversable.map(Traversable.scala:105)
    at com.ldamodel.LdaModel$$anonfun.apply(LdaModel.scala:22)
    at com.ldamodel.LdaModel$$anonfun.apply(LdaModel.scala:22)
    at scala.collection.Iterator$$anon.hasNext(Iterator.scala:371)
    at org.apache.spark.util.collection.ExternalSorter.insertAll(ExternalSorter.scala:202)
    at org.apache.spark.shuffle.sort.SortShuffleWriter.write(SortShuffleWriter.scala:56)
    at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:68)
    at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:41)
    at org.apache.spark.scheduler.Task.run(Task.scala:64)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:203)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)

Answer 1

回答by Justin Pihony

I think this should work:

我认为这应该有效：

    import java.lang.ClassLoader
    val cl = ClassLoader.getSystemClassLoader
    cl.asInstanceOf[java.net.URLClassLoader].getURLs.foreach(println)

Answer 2

回答by Daniel Zolnai

Without modifying the code:

不修改代码：

SPARK_PRINT_LAUNCH_COMMAND=true /usr/lib/spark/bin/spark-shell

Also works with spark-submit.

也适用于spark-submit.

Answer 3

回答by NoUserException

This should do the trick without requiring any code changes:

这应该不需要任何代码更改即可解决问题：

--conf 'spark.driver.extraJavaOptions=-verbose:class'
--conf 'spark.executor.extraJavaOptions=-verbose:class'

Answer 4

回答by stackexchanger

/opt/spark/bin/compute-classpath.sh

scala Spark：有没有办法打印出 spark-shell 和 spark 的类路径？

提问by catrapture

回答by Justin Pihony

回答by Daniel Zolnai

回答by NoUserException

回答by stackexchanger

相关推荐

最近更新

标签

scala Spark：有没有办法打印出 spark-shell 和 spark 的类路径？

提问by catrapture

回答by Justin Pihony

回答by Daniel Zolnai

回答by NoUserException

回答by stackexchanger

相关推荐

scala java.sql.SQLException: 将 DataFrame 加载到 Spark SQL 时找不到合适的驱动程序

scala SBT 未解决的依赖关系

带有 VScode 的 Scala

如何将 Scala 流的内容写入文件？

相关推荐

最近更新

标签