scala Spark DataFrame groupBy

Question

提问by AKC

I have Spark Java that looked like this. Code pulls data from oracle table using JDBC and displays the groupby output.

我有看起来像这样的 Spark Java。代码使用 JDBC 从 oracle 表中提取数据并显示 groupby 输出。

DataFrame jdbcDF = sqlContext.read().format("jdbc").options(options).load();
jdbcDF.show();   
jdbcDF.groupBy("VA_HOSTNAME").count().show();

Long ll = jdbcDF.count();
System.out.println("ll="+ll);

When I ran the code, jdbcDF.show();is working, whereas the groupByand count are not printing anything and no errors were thrown.

当我运行代码时， jdbcDF.show();正在工作，而groupBycount 没有打印任何内容，也没有抛出任何错误。

My column name is correct. I tried by printing that column and it worked, but when groupByit's not working.

我的列名是正确的。我尝试打印该列并且它起作用了，但是当groupBy它不起作用时。

Can someone help me with DataFrameoutput? I am using spark 1.6.3.

有人可以帮我DataFrame输出吗？我正在使用火花 1.6.3。

Answer 1

回答by mrsrinivas

You can try

你可以试试

import org.apache.spark.sql.functions.count

jdbcDF.groupBy("VA_HOSTNAME").agg(count("*")).show()

scala Spark DataFrame groupBy

提问by AKC

回答by mrsrinivas

相关推荐

最近更新

标签

scala Spark DataFrame groupBy

提问by AKC

回答by mrsrinivas

相关推荐

scala Parquet 模式和 Spark

scala 从数据框火花中删除一列

scala 计算 Spark DataFrame 中非空值的数量

scala 多次触发数据帧分组

相关推荐

最近更新

标签