我有一个空白的pdf模板和一个包含一些数据的pandas数据帧。我想在df的一列中搜索一个特定的模式,如果找到了那个模式,就从那个行中获取数据,并将其写入pdf。我的搜索工作正常,能够找到所有匹配的行,并且我正在为每个匹配的行生成一个新的pdf文件。但是,第二个、第三个等文件仍然包含前几行的数据。我不知道为什么每次遍历循环时这些字符串都不会被覆盖。我还尝试在循环开始时将每个变量设置为None,但这没有帮助。
我的df的格式是。。。
标题 | 类型 | H1 | H2H3 | |
---|---|---|---|---|
s1 | 空白 | -- | ||
s2 | 261.1_1X | 1 | 2 | 3 |
s3 | 262.1_1X | 4 | 5 | 6 |
s4 | 空白 | -- | -- |
我不确定您是否正确选择了行。您的代码看起来很复杂。
您可以根据字符串模式选择行,匹配行如下:
foo = df[df['Type'].str.match(pattern)]
pandas.Series.str.match
Pandas:选择与字符串匹配的行