pandas 如何从pickle文件中获取数据到pandas数据框中

Question

提问by Andrew Smith

I'm working on a social media sentiment analysis for a class. I have gotten all of the tweets about the Kentucky Derby for a 2 month period saved into pkl files.

我正在为一个班级进行社交媒体情绪分析。我已经将所有关于肯塔基德比的推文保存到 pkl 文件中，为期 2 个月。

My question is: how do I get all of these pickle dump files loaded into a dataframe?

我的问题是：如何将所有这些泡菜转储文件加载到数据框中？

Here is my code:

这是我的代码：

import sklearn as sk
import pandas as pd
import  got3

def daterange(start_date, end_date):
for n in range(int ((end_date - start_date).days)):
    yield start_date + timedelta(n)

start_date = date(2016, 3, 31)
end_date = date(2016, 6, 1)

dates = []

for single_date in daterange(start_date, end_date):
    dates.append(single_date.strftime("%Y-%m-%d"))

for i in range(len(dates)-1): 
    this_date = dates[i]
    tomorrow_date = dates[i+1]
    print("Getting tweets for " + tomorrow_date)
    tweetCriteria = got3.manager.TweetCriteria()
    tweetCriteria.setQuerySearch("Kentucky Derby")
    tweetCriteria.setQuerySearch("KYDerby")
    tweetCriteria.setSince(this_date)
    tweetCriteria.setUntil(tomorrow_date)
    Kentucky_Derby_tweets = got3.manager.TweetManager.getTweets(tweetCriteria)
    pkl.dump(Kentucky_Derby_tweets, open(tomorrow_date + ".pkl", "wb"))

Answer 1

回答by simon

You can use

您可以使用

pd.read_pickle(filename)
add it to a list
then pd.concat(thelist)

pd.read_pickle(filename)
将其添加到列表中
然后 pd.concat(thelist)

pandas 如何从pickle文件中获取数据到pandas数据框中

提问by Andrew Smith

回答by simon

相关推荐

最近更新

标签

pandas 如何从pickle文件中获取数据到pandas数据框中

提问by Andrew Smith

回答by simon

相关推荐

pandas 即使在熊猫中使用 .loc 后，也会收到 SettingWithCopyWarning 警告

pandas 熊猫系列/数据框的对数

pandas read_sql 异常缓慢

pandas 熊猫：时间戳到日期时间

相关推荐

最近更新

标签