导入多个 Excel 文件进行数据分析

我有几行代码和一个小困境，所以我写了这段代码是为了分析，它占用了一个excel文件，使用pandas将其读取为Dataframme，如果我没记错的话，我对编码很陌生，并将文件装箱为5的倍数。尽管如此，我还是能够让它与一个文件一起使用，但我想知道可以做些什么来让它读取多个 excel 文件对每个文件应用相同的分箱并输出每个单独的分析文件。代码为：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import openpyxl
from pandas import ExcelWriter
data = pd.read_excel('/Users/user/Desktop/Data/Book1.xlsx')
counts, bins, patches = plt.hist(data.values, bins=range(0, 
int(max(data.values)+5), 5))
df = pd.DataFrame({'bin_leftedge': bins[:-1], 'count': counts})
plt.title('Data')
plt.xlabel('Neuron')
plt.ylabel('# of Spikes')
plt.show()
writer = pd.ExcelWriter('/Users/jorge/Desktop/Data/output.xlsx')
df.to_excel(writer,'Sheet2')
writer.save()

此外，最终目标是能够让代码确定所有输入和分析的 excel 文件的最大值，并让代码保存所有这些文件的最大值(无论是 2、3、5、27 个 excel 文件(并将每个 excel 文件与该最大代码进行比较，请非常感谢任何帮助。再次，提前感谢。

开头为：

import os
import re
                                                                                                                    for files in os.listdir(r"/Users/user/Desktop/Data"):
    if re.search(r".*.xlsx", files):
        data = pd.read_excel("//Users//jorge//Desktop//Data/{0}".format(files))

....把你的代码放在这里...

这将遍历目录中的所有 ecel 文件，您可以对其重新设置所需的操作

相关内容

最新更新

热门标签：