如何为一个简单的mapreduce作业指定blobstoreoutputwwriter的文件名



如何或在哪里为GAE mapreduce作业指定output_writer文件名和内容类型?下面的配置对我来说工作得很好,但是每次我运行作业时,它都会创建一个带有新文件名的新blobstore条目。我希望能够指定每次运行mapreduce作业时要覆盖/替换的文件名和内容类型。

我的处理程序正在为csv文件编写文本行。

mapreduce:
- name: Export a model
  mapper:
    input_reader: mapreduce.input_readers.DatastoreInputReader
    output_writer: mapreduce.output_writers.BlobstoreOutputWriter
    handler: export_model
    params:
    - name: entity_kind
      default: models.MyModel 

output_writer仍然是实验性的。目前还没有指定输出文件名的规定。您可以按照演示应用程序中的示例并间接使用:将输出博客的BlobKey附加到您选择的包含所需名称的实体。

寻找

yield StoreOutput("WordCount", filekey, output)

in main.py

相关内容

  • 没有找到相关文章