我有几行代码和一个小困境,所以我写了这段代码是为了分析,它占用了一个excel文件,使用pandas将其读取为Dataframme,如果我没记错的话,我对编码很陌生,并将文件装箱为5的倍数。尽管如此,我还是能够让它与一个文件一起使用,但我想知道可以做些什么来让它读取多个 excel 文件对每个文件应用相同的分箱并输出每个单独的分析文件。代码为:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import openpyxl
from pandas import ExcelWriter
data = pd.read_excel('/Users/user/Desktop/Data/Book1.xlsx')
counts, bins, patches = plt.hist(data.values, bins=range(0,
int(max(data.values)+5), 5))
df = pd.DataFrame({'bin_leftedge': bins[:-1], 'count': counts})
plt.title('Data')
plt.xlabel('Neuron')
plt.ylabel('# of Spikes')
plt.show()
writer = pd.ExcelWriter('/Users/jorge/Desktop/Data/output.xlsx')
df.to_excel(writer,'Sheet2')
writer.save()
此外,最终目标是能够让代码确定所有输入和分析的 excel 文件的最大值,并让代码保存所有这些文件的最大值(无论是 2、3、5、27 个 excel 文件(并将每个 excel 文件与该最大代码进行比较,请非常感谢任何帮助。再次,提前感谢。
开头为:
import os
import re
for files in os.listdir(r"/Users/user/Desktop/Data"):
if re.search(r".*.xlsx", files):
data = pd.read_excel("//Users//jorge//Desktop//Data/{0}".format(files))
....把你的代码放在这里...
这将遍历目录中的所有 ecel 文件,您可以对其重新设置所需的操作