pandas 如何使用 matplotlib 绘制 pyspark sql 结果

Question

提问by HasanDange

I am new to pyspark. I want to plot the result using matplotlib, but not sure which function to use. I searched for a way to convert sql result to pandas and then use plot.

我是 pyspark 的新手。我想使用 matplotlib 绘制结果，但不确定要使用哪个函数。我搜索了一种将sql结果转换为pandas然后使用plot的方法。

Answer 1

采纳答案by HasanDange

Hi Team I have found the solution for this. I converted sql dataframe to pandas dataframe and then I was able to plot the graphs. below is the sample code.from

嗨团队我已经找到了解决方案。我将 sql 数据框转换为 Pandas 数据框，然后我就可以绘制图形了。下面是示例代码。来自

pyspark.sql import Row
from pyspark.sql import HiveContext
import pyspark
from IPython.display import display
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline 
sc = pyspark.SparkContext()
sqlContext = HiveContext(sc)
test_list = [(1, 'hasan'),(2, 'nana'),(3, 'dad'),(4, 'mon')]
rdd = sc.parallelize(test_list)
people = rdd.map(lambda x: Row(id=int(x[0]), name=x[1]))
schemaPeople = sqlContext.createDataFrame(people)
# Register it as a temp table
sqlContext.registerDataFrameAsTable(schemaPeople, "test_table")
df1=sqlContext.sql("Select * from test_table")
pdf1=df1.toPandas()
pdf1.plot(kind='barh',x='name',y='id',colormap='winter_r')

pandas 如何使用 matplotlib 绘制 pyspark sql 结果

提问by HasanDange

采纳答案by HasanDange

相关推荐

最近更新

标签

pandas 如何使用 matplotlib 绘制 pyspark sql 结果

提问by HasanDange

采纳答案by HasanDange

相关推荐

pandas 合并熊猫列（一对多）

pandas 如何使用groupby计算vwap（成交量加权平均价格）并应用？

FileNotFoundError：使用 Pandas

pandas 在熊猫数据框中的特定列中查找具有空值的所有行的索引

相关推荐

最近更新

标签