嗨,我有一个具有文本和多个数字列的数据集我想从列中提取一个特定的数字并创建一个新的
客户出售外币产生的存款165.22美元,汇率为** 19.65万**
这是我在该列的每一行上的文本,我只对汇率感兴趣。另一个问题是,并不是每一行都有它,所以当那一行没有汇率时,我想使用另一列中已经设置为float的数字
您可以将str.extract
与捕获组一起使用:
df["curr"] = df["text"].str.extract(r'(d+(?:.d+)?) [A-Z]{2,}')
下面是一个regex演示,显示逻辑正在工作。