我对编程很陌生,正在努力减少将数据写入文件所需的时间,我发现写入部分是主要问题。
以下是我的机器学习程序代码的一部分:
filename="data.csv"
f=open(filename,"w")
headers="row,openn"
f.write(headers)
for i in range (0,55970):
score=rf.predict(edit[i].reshape(1, -1))
score=str(score).replace('[','').replace(']','')
f.write(str(i) +","+ score +"n")
f.close()
我知道我应该在得到所有数据后才写数据,但我不知道该怎么做——因为我只知道f.write((。我会为我的预测和返回分数创建一个函数,然后创建一个列表来存储所有分数并将其写入吗?(如果可能的话(
[编辑]
score=rf.predict(edit)
with open('data.csv', 'w',newline='') as f:
writer = csv.writer(f)
writer.writerow(['row', 'open'])
for i in range(55970):
writer.writerow([i,str(score[i])])
^根据新建议添加。发现我应该只做预测,然后写行,这大大缩短了所花的时间!
谢谢你的帮助!!
CSV模块是一个更好的工具。更具体地说,writerows()
就是您想要的。
https://docs.python.org/3/library/csv.html#csv.csvwriter.writerows
以下是文档中的一个示例:
import csv
with open('some.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerows(someiterable)
import csv
with open('data.csv', 'w') as csv_file:
writer = csv.writer(csv_file)
writer.writerow(['row_id', 'open_flag'])
for i in range(55970):
score = str(rf.predict(edit[i].reshape(1, -1)))
score.replace('[', '').replace(']', '')
writer.writerow([i, score])