我有一个包含指向个人的CSV文件。此形式:
3,23/02/2015,08:27,08:27,12:29,13:52,19:48
3,24/02/2015,08:17,12:36,13:59,19:28
5,23/02/2015,10:53,13:44
5,25/02/2015,09:05,12:34,12:35,13:30,19:08
5,26/02/2015,08:51,12:20,13:46,18:47,18:58
我要它清洁。这样:
ID, DATE, IN,BREAK_OUT, BREAK_IN, OUT, WORK_TIME
3,Monday 23/02/2015,08:27,12:29,13:52,19:48,08:00hours
3,Tuesday 24/02/2015,08:17,12:36,13:59,19:28,08:00hours
5,Monday 23/02/2015,10:53,NAN,13:44,NAN,2houres
5,Wednesday 25/02/2015,09:05,12:34,13:30,19:08,08hours
你能帮我吗认为您
我建议您使用pandas从文件中导入数据
import pandas as pd
pd.read_csv(filepath, sep = ',')
假设Filepath会导致您的CSV,应该做到这一点。然后,我建议您使用DateTime函数将字符串转换为可以使用的日期(我认为您也可以使用Numpys DateTime64类型,我只是不习惯它们)。
import datetime as dt
day = dt.datetime.strptime('23/02/2015', '%d/%m/%Y')
in = dt.datetime.combine(day, dt.datetime.strptime('08:27', '%H:%M').time())
应该解决这个问题。您的in
也是datetime
对象,不仅是时间对象,否则您无法提取它们(这是计算工作时间的必要下一步。
认为这应该有点让您入门,您会在此处找到Pandas文档,并在此处找到DateTime文档。
如果您还有其他问题,请尝试提出更具体的问题。
这个问题可能会帮助您:如何将字符串分为列
首先,读取整个文件并将列分开。检查是否有数据并将其写回新文件。
如果您需要其他帮助,请告诉我们您的尝试,对您有用的是什么,什么无效。我们不会为您编写完整的程序/脚本。