是否根据字符串位置进行筛选



我有一个关于在数据帧中过滤字符串对象的问题。我正在处理的许多刺激都有散列,但我只想分析单词开头有散列的刺激(比如[#T R],但不是[T R#](。我已经能够过滤我的数据帧,这样我就只能使用以下代码获得包含#的刺激:

initial_judgments = model_df_2[model_df_2[0].str.contains('#')]

然而,我仍然想知道是否有一种方法可以表明我只想要在每个刺激的初始位置都有散列的刺激。有办法做到这一点吗?

到目前为止,我的数据帧看起来像这样:

bigrams     judgments
1   AH1 N #     good
2   AE1 T #     good
3   EH1 T #     good
5   EY1 L #     good
6   AH1 NG #    good
...     ...     ...
84  # SH N  bad
85  # F T   bad
86  # Z R   bad
87  # N R   bad
88  # ZH V  bad
import pandas as pd
df = pd.DataFrame({'bigrams':['# SH','SH #','# AB','AB']})
df.loc[df['bigrams'].str.startswith('#')]

输出

bigrams
0   # SH
2   # AB

最新更新