返回两个下划线之间的字符



我想在两个下划线之间提取一串字符。"_"两侧之间和两侧的字符数会有所不同,但只有两个下划线。带下划线的长字段是文本字段,要填写的字段是短整数。我已经能够解析下划线前后的字符并填充要素类中的其他字段,但无法将中间部分放入新字段中。

示例 1:102_1204_234324

我想返回 '1204'

示例 2:324423_1_342

我想返回"1"

我已经尝试了许多变体,我认为应该有效的一种是:

# Import system modules
import arcpy
#from arcpy import env
# Set environment settings
arcpy.env.workspace = "c:/temp/testing.gdb"
# Set local variables
inFeatures = "testFeature"
fieldName = "testField"
expression = "!parse_field!.split('_')[1::2]"
# Execute CalculateField 
arcpy.CalculateField_management(inFeatures, fieldName, expression, "PYTHON", "")

我认为这将创建一个列表,然后返回列表的每隔一个元素。但是,要填写的字段(testField)仍然是空的。

谢谢-al

    print "my_test_string".split('_')[1]

将输出"测试"

我相信

你想要一个正则表达式

import re
m = re.search('_.+_', 'goodbye_cruel_world')
m.group(0) # returns '_cruel_'

但是等等,我们可以做得更好!以下正则表达式使用 'look(ahead|behind)s' 丢弃下划线,因此为您提供重要内容:(?<=_).+(?=_)

最新更新