读取CSV文件并提取信息



我是Python新手。

我已经学会了如何导入CSV文件并阅读它。

然而,我正在努力理解如何提取特定的数据。

这是我读取数据的代码
import csv
try:
with open ("books.csv", mode="r", encoding="utf-8")as file:
csvFile = csv.reader(file)

for row in csvFile:
print (row)
except:
print("file cannot be open")
finally:
file.close()

然而,我的问题是,我写什么代码来生成频率报告(最不频繁),顺便说一下,数据列表很长。

此外,如果有人知道使用什么代码来查找最受欢迎(最常用的项目)。

还需要用什么代码生成一个报告,该报告包含用户借阅物品的平均时间长度、用户逾期归还的比例以及平均逾期时间。

要管理来自csv文件的数据,这实际上是一种存储两路表数据的方式,我建议您使用非常流行的名为"pandas"的库。

它允许你用这样的"形式因子"来表示数据并建立了类加载/保存数据从/到CSV以及许多其他流行的文件格式(excel表格,hd5, pickle, parquet,羽毛…举几个例子)

这是一个网站的链接,该网站解释了如何使用pandas从csv文件加载数据。

然后,使用您的熊猫对象,您可以在列或行上执行.mean(使用panda_data.mean(axis=0)panda_data.mean(axis=1)分别沿列或行执行平均值)

你也有很多有用的方法来查找数据在你的表中出现的次数,特定项目的频率等。您可以很容易地找到处理您提到的每个特定应用程序的方法的线程,使用panda对象、堆栈溢出或其他地方。

要做你想做的事情,你应该遵循以下步骤:

1-在循环中从表中读取行

2-在这个循环中,在另一个循环中读取每一行,然后从循环中读取每一项,然后检查它不是空格字符,然后将项添加到容器中,list

3-在list中的每个元素中循环并计算它在list中重复的次数,然后添加该元素并将其在字典中重复的次数

4-在字典中查找Max值,然后在字典中查找该值的键

import csv
repeated = {}
list_all = []
try:
with open ("bb.csv", mode="r", encoding="utf-8")as file:
csvFile = csv.reader(file)
for row in csvFile:
for dat in row:
for y in dat:
if y != " ":
list_all.append(y)
for dat in list_all:
counter = list_all.count(dat)
repeated[dat] = counter

max_val = (max(repeated.values()))
for key,value in repeated.items():
if value == max_val:
print("the max item is: {}, and was repeated: {} times".format(key,max_val))
except:
print("file cannot be open")
finally:
file.close()

相关内容

  • 没有找到相关文章

最新更新