当我批量下载用俄语编写的 GAE 数据时,我得到的文本如下
u'\u041b\u044e\u0431\u0438\u043c\u0430\u044f \u0430\u043a\u0446\u0438\u044F \u0432\u0435\u0440\u043d\u0443\u043b\u0430\u0441\u044c!\u0412 \u0440\u0435\u0441\u0442\u043e\u0440\u0430\u043d\u0430\u0445 \u0415\u0432\u0440\u0430\u0437\u0438\u044f "3 \u0440\u043E\u043B\u043B\u0430 \u043F\u043E \u0446\u0435\u043d\u0435 1""!\u0421 9 \u043f\u043E 12 \u0441\u0435\u043d\u0442\u044f\u0431\u0440\u044f! \u0422\u043E\u043B\u044C\u043A\u043E \u044D\u0442\u0438 4 \u0434\u043d\u044f! \u041F\u043E\u0434\u0440\u043E\u0431\u043D\u043E\u0441\u0442\u0438 \u043d\u0430 evrasia.spb.ru, 88005050145 \u0438 008'
使用以下bulkloader
:
transformers:
- kind: MyKind
connector: csv
connector_options:
property_map:
- property: texts
external_name: texts
我应该怎么做才能让它已经解码?
更新。我尝试执行以下操作
python_preamble:
- import: codecs
...
- property: texts
external_name: texts
export_transform: codecs.decode('unicode_escape')
但收到错误:
Unable to assign value 'codecs.decode('unicode_escape')' to attribute 'export_transform':
Code for export_transform did not return a callable. Code: "codecs.decode('unicode_escape')".
in "bulkloader.yaml", line 22, column 25
不知何故,散装机文档已从Google网站上删除,因此我不知道在哪里可以阅读有关export_transform
用法的信息。
在对 GAE 及其工作原理一无所知的情况下,我对此有一些想法,这些想法可能会也可能不会帮助您前进:
- 如果您尝试打印字符串(例如:
print the_string
(并将其写为问题中的内容,则可以使用eval
(例如:print eval(the_string)
(。或者,如果您只想将其转换为 unicode 对象,请使用:the_string=eval(the_string)
. - 通过查看您的错误消息"...export_transform没有返回可调用的..."和实际名称"export_transform"我猜export_transform需要是一个可调用的转换函数。尝试在外部定义一个或使用
lambda
函数。
希望这对您有所帮助...