在Python中将LaTex表读取到数组中



对于Python初学者来说,我有一项艰巨的任务,我需要从用LaTex编写的源文件中导入一个表。我在想,我将使用表的名称作为标识符,然后从表的开头到末尾,逐行地将其写入数组。做这份工作的"自然"方式是什么?

astropy包有一个LaTeX表读取器。

from astropy.table import Table
tab = Table.read('file.tex')

读取器功能应自动识别格式并读取文件中的第一个表。(如果需要以后的表格,请将相关部分剪切并粘贴到新文件中)。不过,读者也有一些局限性。最重要的是,每一行数据都必须在一行上(问题中指向表的链接已经失效,所以我看不出这是否有问题),并且不能有像multicolumnmultirow这样的命令。

查看astropy中的Latex阅读文档,了解更多选项:https://astropy.readthedocs.org/en/latest/api/astropy.io.ascii.Latex.html#astropy.io.ascii.Latex

我个人会在表的开头和结尾放一个乳胶注释,以表示您感兴趣的行的范围。

import linecache
FILEPATH = 'file.tex'

def get_line_range():
    'returns the lines at which the table begins and ends'
    begin_table_line = None
    end_table_line = None
    with open(FILEPATH, "r") as file:
        array = []
        for line_number, line in enumerate(file):
            if 'latex comment denoting beginning of table' in line:
            begin_table_line = line_number
            if 'latex comment denoting end of table' in line:
            end_table_line = line_number
    return begin_table_line+1, end_table_line
def get_table():
    'gets the lines containing the table'
    start, end = get_line_range()
    return [linecache.getline(FILEPATH, line) for line in xrange(start, end)]

上面的代码是在没有测试的情况下完成的,但应该可以从.tex文件中获得表格。不过,它的一个明显问题是,它读取了两次文件,肯定可以进行优化。

相关内容

  • 没有找到相关文章

最新更新