我的代码似乎正在输出我想要的列表,但是,当我尝试将列表打印到CSV时,由于某种原因,我在.CSV文件上没有得到相同的结果。我确信我的代码末尾有一些不正确的地方。谁能给我点光吗?提前谢谢。
import pandas as pd
df = pd.read_csv('microRuleSet-row.csv')
deduplicated_list = list()
for index, row in df.iterrows():
for item in row:
if item not in deduplicated_list:
deduplicated_list.append(item)
print(deduplicated_list)
df.to_csv('microRuleSet-row-noDupes.csv', index=False)
我以前从未使用过熊猫。但看起来您正在将加载的原始microRuleSet-row.csv输出到csv。您必须将已消除重复的列表导出为csv。好的,所以每一行都不能有重复的项目。这个代码可以做到这一点。第一行(标题(现在编号为0到5。这可以更改为原始标题,并为多余的空csv单元格添加占位符。
import pandas as pd
df = pd.read_csv('microRuleSet-row.csv')
no_duplicates_list = []
for index, row in df.iterrows():
new_row = []
for item in row:
if item not in new_row:
new_row.append(item)
no_duplicates_list.append(new_row)
print(no_duplicates_list)
df2 = pd.DataFrame(no_duplicates_list)
df2.to_csv('microRuleSet-row-noDupes.csv', index=False)