Django/Jinja2:通过模板语法生成CSV(数据)



我想使用类似模板的语法为CSV文件(或任何合理的导出格式)生成数据,以访问我的django对象的字段。例如,输出字段的规范可以是:

employee.id
employee.manager.first_name
employee.user.last_login
employee.contact.phone_number

其中,字段是使用与我在Django或Jinja2模板中使用的语法相同的语法指定的。

我也希望能够像在django/jinja模板中那样使用过滤器:

employee.user.last_login|date:"c"

给定这个规范和对象列表,我想从我的对象中生成数据行。然后,我可以根据这些数据生成CSV、XML等。

我开始写这样的东西,但它很快就变得复杂了,我想我可能可以使用Django/Jinja2模板引擎的一些现有部分。

有什么东西可以让我通过Django/Jinja2语法访问我的对象吗?

首先,使用csv模块以外的任何技术生成CSV数据都不会赢得很多朋友;这是适合这份工作的工具。

使用该模块生成输出的最方便的方法是使用writer.writerows(),它采用嵌套列表(或者更确切地说,序列迭代器)。生成器是一种很好的表达方式:

def csv_spec(queryset):
    for employee in queryset:
        yield (
            employee.id,
            employee.manager.first_name,
            employee.user.last_login,
            employee.contact.phone_number)
w = csv.writer(outfile)
w.writerows(csv_spec(something))

编辑:所以你说你想要像模板一样的东西,原因和我们使用模板的原因一样,但它会产生CSV而不是文本。你可以让jinja解析和处理它在没有完整模板的占位符。

假设我们有一些数据:

>>> from collections import namedtuple
>>> from datetime import datetime
>>> Employee = namedtuple('Employee', 'id manager user contact')
>>> Person = namedtuple('Person', 'first_name last_name')
>>> Account = namedtuple('Account', 'username password last_login')
>>> Contact = namedtuple('Contact', 'phone_number email')
>>> data = [
...     Employee(0, Person('Alice', 'Brown'),
...              Account('abrown', 'secret', datetime(2013, 3, 3)),
...              Contact('5551234', 'abrown@example.com')),
...     Employee(1, Person('Bob', 'Jones'),
...              Account('bjones', 'safe', datetime(2013, 3, 3)),
...              Contact('5555678', 'bjones@example.com')),
...     Employee(2, Person('Carol', 'Smith'),
...              Account('csmith', 'hidden', datetime(2013, 3, 3)),
...              Contact('5559012', 'csmith@example.com'))]

和一个模板(你可以很容易地从文件中读取)

>>> import StringIO
>>> template = StringIO.StringIO('''employee.id
... employee.manager.first_name
... employee.user.last_login
... employee.contact.phone_number''')

要使用表达式编译器,您需要一个Environment;无需选择指定:

>>> import jinja2
>>> env = jinja2.Environment()
>>> template_filter = map(env.compile_expression, template)

正如我提到的,使用csv模块:

>>> import csv
>>> import sys
>>> writer = csv.writer(sys.stdout)

最后,使用编译后的表达式,我们可以在数据上运行一行一个时间,对于每一行,应用每个表达式

>>> writer.writerows([[field(employee=row) for field in template_filter]
...                   for row in data])
0,Alice,2013-03-03 00:00:00,5551234
1,Bob,2013-03-03 00:00:00,5555678
2,Carol,2013-03-03 00:00:00,5559012
Django文档是一个优秀的资源-http://docs.python.org/2/library/csv.html

您只需要知道python中用于访问对象属性的点表示法。

最新更新