Python -自动应用Excel过滤器到.csv文件/方法转换hh:mm:ss时间字符串为整数? &



我有大量的VOIP分析要处理,所有的。csv格式。

所有调用都格式化为行,并且我需要隔离与字符串"Answered"匹配的单元格行。和"终止"和通话时长<= 00:00:30。

我一直在梳理Python库,以找到一个可以快速轻松地应用必要的过滤器处理这种时髦的时间格式的库,因此我不必实际打开.csv本身,但成功与否。如果我知道一种将时间字符串转换成整数的快速方法,那也会有很大帮助。

在这种情况下最好的库和方法是什么?目前正在使用Python 3.

选中xlsxwriter,没有骰子,因为它是只写的。目前正在研究Pandas和openpyxl,但看起来很模糊。

使用Miller在命令行中过滤CSV并捕获time <= 00:00:30的所有行。

cat time_select.csv
id,time_val
1,00:00:01
2,00:00:02
3,00:00:03
4,00:00:04
5,00:00:05
6,00:00:06
7,00:00:07
8,00:00:08
9,00:00:09
10,00:00:10
...
50,00:00:50
51,00:00:51
52,00:00:52
53,00:00:53
54,00:00:54
55,00:00:55
56,00:00:56
57,00:00:57
58,00:00:58
59,00:00:59

mlr --csv filter 'strptime($time_val, "%H:%M:%S") <= strptime("00:00:30", "%H:%M:%S")' time_select.csv > time_filtered.csv
cat time_filtered.csv 
id,time_val
1,00:00:01
2,00:00:02
3,00:00:03
4,00:00:04
5,00:00:05
6,00:00:06
7,00:00:07
8,00:00:08
9,00:00:09
10,00:00:10
11,00:00:11
12,00:00:12
13,00:00:13
14,00:00:14
15,00:00:15
16,00:00:16
17,00:00:17
18,00:00:18
19,00:00:19
20,00:00:20
21,00:00:21
22,00:00:22
23,00:00:23
24,00:00:24
25,00:00:25
26,00:00:26
27,00:00:27
28,00:00:28
29,00:00:29
30,00:00:30

最新更新