我如何获得与pushshift得分最高的子reddit提交?



我是一个初学者,如果这是完全错误的,我很抱歉。到目前为止,我已经能够呈现所需的字段(作者,subreddit,创建日期,评论数量,分数,提交标题,提交描述),并将其保存到数据框中。但是当这些复杂的问题开始出现时,比如一周中哪一天提交的意见书最多,我就会突然不知所措。这是我现在获得最高分的提交的代码:

subreddit = pd.read_csv('subreddit.csv', delimiter = ',')
subreddit.count()
score = "score"
h_score = subreddit.score.max()
best_submission = subreddit.score(h_score) #it comes out as TypeError: 'Series' object is not callable here
bsubmission_title = title[best_submission]
print("Submission with the highest score:", bsubmission_title)

subreddit.score.max()返回score列中的最大值。但你想要的是与那个分数在同一行的标题。为了得到它,您不需要分数值,而是需要具有最高分数值的行的索引。你可以用idxmax得到这个。然后可以使用索引来获得匹配的标题:

h_score_index = subreddit.score.idxmax()
bsubmission_title = subreddit.title[h_score_index]
print("Submission with the highest score:", bsubmission_title)

最新更新