我想从数据框架中选择一个关键字


displaytweets = tweetsDf.select( "author", "civilEvents", "phraseList",  "locations", "bodyText").orderBy("times")
pandas.set_option('display.max_colwidth', 500) 
display.display(displaytweets.toPandas())

" BodyText"列包含一条推文...我希望能够查询我的数据框以返回COLOMN包含标签的行。

我尝试过:

displaytweets[displaytweets['bodyText'].str.contains("#")]

以及

hashTags = displaytweets.bodyText.str.contains("#")

但是我得到了这个错误:

  <ipython-input-20-eb0d77b3103e> in <module>()   
1 #displaytweets[displaytweets['bodyText'].str.contains("#")]       
2 hashTags = displaytweets.bodyText.str.contains("#")   
3 hashTags

typeError:'列'对象不可callable

如果将数据框架转换为pandas,这将为您提供所需的东西:

hashTags = displaytweets.where(displaytweets['bodyText'].str.contains('#')).dropna()

相关内容

最新更新