我需要解析键值逗号分隔文件。请随函附上示例日志文件格式。
event_1,log_time:2013-11-05T08:33:37:293+00,user_id:2535285332077170,profile_id:8,nickname:2535285332077170,rank_id:7,shop_tr_status:OK,
event_2,log_time:2013-11-05T08:33:37:344+00,rule_id:18372990742769963554,user_id:2535285332077170,profile_id:8,
event_3,log_time:2013-11-05T08:33:37:401+00,user_id:2535285332077170,profile_id:8,nickname:2535285332077170
我的要求是,如果是事件 1,那么我需要log_time和昵称
如果是event_2那么我需要用户 ID 和配置文件 ID
如果是event_3那么我需要用户ID和昵称
谁能建议最好的方法是什么
忘记csv.reader。您应该将 tablib 与动态列一起使用:
ds = tablib.Dataset()
ds.csv = open(csvfile).read()
然后,您可以使用以下内容添加列:
def event_data(row):
if row[0] == 'event_1':
return [row[1], row[4]]
# .. and so forth
ds.append_col(event_data, header='Event data')
根据第一列,获取该列应该为您提供所需的数据。
标题并想提取特定的列数据,请尝试
import csv
with open('csv_file.csv', 'rU') as csv_file:
csvreader = csv.DictReader(csv_file)
for row in csvreader:
print("Rows: " + str(row))
if row['header1'] == '1':
print('Data: ' + row['header2'])
CSV 文件内容:
header1,header2,header3
1,2,3
4,5,6
输出:
Rows: {'header2': '2', 'header3': '3', 'header1': '1'}
Data: 2
Rows: {'header2': '5', 'header3': '6', 'header1': '4'}
如果你有很多数据,添加标题可以让你的生活更轻松,或者你将不得不使用 csv.reader() 并解析内容并根据需要进行拆分。
使用 csv.reader() for row in
,然后在 for 循环中放置一个 if 和一些 elif。