我有一个像这样的.txt文件数据集,其中包含感兴趣的日期列:
1181206,3560076,2,01/03/2010,46,45,M,F
2754630,2831844,1,03/03/2010,56,50,M,F
3701022,3536017,1,04/03/2010,40,38,M,F
3786132,3776706,2,22/03/2010,54,48,M,F
1430789,3723506,1,04/05/2010,55,43,F,M
2824581,3091019,2,23/06/2010,59,58,M,F
4797641,4766769,1,04/08/2010,53,49,M,F
我想计算出每个日期到2010年3月1日之间的天数,并将日期替换为偏移{0,2,3,21…}的天数,得到这样的输出:
1181206,3560076,2,0,46,45,M,F
2754630,2831844,1,2,56,50,M,F
3701022,3536017,1,3,40,38,M,F
3786132,3776706,2,21,54,48,M,F
1430789,3723506,1,64,55,43,F,M
2824581,3091019,2,114,59,58,M,F
4797641,4766769,1,156,53,49,M,F
我已经尝试了很长时间,但这真的很令人沮丧。我曾尝试使用datetime.datetime.strptime('01/03',"%d/%m/%Y"(.date((方法转换为datetime,然后减去这两个日期,但它给了我一个输出,例如"3天,0:00:00",但我似乎无法只得到数字的输出!
两个日期之间的差异是时间增量。任何timedelta实例都具有所需整数值的days属性。
这很简单。使用您给出的代码:
date1 = datetime.datetime.strptime('01/03/2010', '%d/%m/%Y').date()
date2 = datetime.datetime.strptime('04/03/2010', '%d/%m/%Y').date()
您得到两个日期时间对象。
(date2-date1)
会给你时间增量。您所犯的错误是将时间增量转换为字符串。timedelta对象具有days属性。因此,您可以获得使用它的天数:
(date2-date1).days
这会产生所需的输出。
使用您的输入(有点冗长…(
#!/usr/bin/env python
import datetime
with open('input') as fd:
d_first = datetime.date(2010, 03, 01)
for line in fd:
date=line.split(',')[3]
day, month, year= date.split(r'/')
d = datetime.date(int(year), int(month), int(day))
diff=d - d_first
print diff.days
提供
0
2
3
21
64
114
156
看看pleac,那里有很多使用python的日期示例。