displaytweets = tweetsDf.select( "author", "civilEvents", "phraseList", "locations", "bodyText").orderBy("times")
pandas.set_option('display.max_colwidth', 500)
display.display(displaytweets.toPandas())
" BodyText"列包含一条推文...我希望能够查询我的数据框以返回COLOMN包含标签的行。
我尝试过:
displaytweets[displaytweets['bodyText'].str.contains("#")]
以及
hashTags = displaytweets.bodyText.str.contains("#")
但是我得到了这个错误:
<ipython-input-20-eb0d77b3103e> in <module>()
1 #displaytweets[displaytweets['bodyText'].str.contains("#")]
2 hashTags = displaytweets.bodyText.str.contains("#")
3 hashTags
typeError:'列'对象不可callable
如果将数据框架转换为pandas
,这将为您提供所需的东西:
hashTags = displaytweets.where(displaytweets['bodyText'].str.contains('#')).dropna()