如何或在哪里为GAE mapreduce作业指定output_writer文件名和内容类型?下面的配置对我来说工作得很好,但是每次我运行作业时,它都会创建一个带有新文件名的新blobstore条目。我希望能够指定每次运行mapreduce作业时要覆盖/替换的文件名和内容类型。
我的处理程序正在为csv文件编写文本行。
mapreduce:
- name: Export a model
mapper:
input_reader: mapreduce.input_readers.DatastoreInputReader
output_writer: mapreduce.output_writers.BlobstoreOutputWriter
handler: export_model
params:
- name: entity_kind
default: models.MyModel
output_writer仍然是实验性的。目前还没有指定输出文件名的规定。您可以按照演示应用程序中的示例并间接使用:将输出博客的BlobKey附加到您选择的包含所需名称的实体。
寻找
yield StoreOutput("WordCount", filekey, output)
in main.py