Java Spark SQL - 如何将 DataFrame 写入文本文件？

Question

提问by Shankar

I am using Spark SQLfor reading parquet and writing parquet file.

我Spark SQL用于读取镶木地板和写入镶木地板文件。

But some cases,i need to write the DataFrameas text file instead of Json or Parquet.

但在某些情况下，我需要编写DataFrame文本文件而不是 Json 或 Parquet。

Is there any default methods supported or i have to convert that DataFrame to RDDthen use saveAsTextFile()method?

是否支持任何默认方法，或者我必须将该 DataFrame 转换为RDD然后使用saveAsTextFile()方法？

Answer 1

采纳答案by Radu Ionescu

Using Databricks Spark-CSVyou can save directly to a CSV file and load from a CSV file afterwards like this

使用Databricks Spark-CSV，您可以直接保存到 CSV 文件，然后像这样从 CSV 文件加载

import org.apache.spark.sql.SQLContext

SQLContext sqlContext = new SQLContext(sc);
DataFrame df = sqlContext.read()
    .format("com.databricks.spark.csv")
    .option("inferSchema", "true")
    .option("header", "true")
    .load("cars.csv");

df.select("year", "model").write()
    .format("com.databricks.spark.csv")
    .option("header", "true")
    .option("codec", "org.apache.hadoop.io.compress.GzipCodec")
    .save("newcars.csv");

import org.apache.spark.sql.SQLContext

SQLContext sqlContext = new SQLContext(sc);
DataFrame df = sqlContext.read()
    .format("com.databricks.spark.csv")
    .option("inferSchema", "true")
    .option("header", "true")
    .load("cars.csv");

df.select("year", "model").write()
    .format("com.databricks.spark.csv")
    .option("header", "true")
    .option("codec", "org.apache.hadoop.io.compress.GzipCodec")
    .save("newcars.csv");

Answer 2

回答by Igorock

df.repartition(1).write.option("header", "true").csv("filename.csv")

Java Spark SQL - 如何将 DataFrame 写入文本文件？

提问by Shankar

采纳答案by Radu Ionescu

回答by Igorock

相关推荐

最近更新

标签

Java Spark SQL - 如何将 DataFrame 写入文本文件？

提问by Shankar

采纳答案by Radu Ionescu

回答by Igorock

相关推荐

JavaFX 附带 JDK 8？

从数组中删除元素（Java）

在 Java 中将 WireMock 与 SOAP Web 服务结合使用

Java Swing：按下 ESC 键时如何关闭对话框？

相关推荐

最近更新

标签