我正在尝试从几千个库的 setup.py 中提取setup_requires
和test_requires
值。 我有这个格拉默
grammar SetupPy ;
file_input: (ignore setupRequires | ignore testRequires )* EOF;
setupRequires : SETUPDEC '[' dependencyValue* (',' dependencyValue)* ']';
testRequires : TESTDEC '[' dependencyValue* (',' dependencyValue)* ']';
ignore: UNKNOWN_CHAR;
dependencyValue: LISTVAL;
//ignore : UNKNOWN_CHAR? ;
LISTVAL: SHORT_STRING;
SETUPDEC: 'setup_requires' '=';
TESTDEC: 'tests_require' '=';
UNKNOWN_CHAR: . -> channel(HIDDEN);
fragment SHORT_STRING: ''' ( STRING_ESCAPE_SEQ | ~[\rnf'] )* '''
| '"' ( STRING_ESCAPE_SEQ | ~[\rnf"] )* '"';
fragment STRING_ESCAPE_SEQ
: '\' .
| '\'
;
它适用于一个非常简单的示例。 但是,当我把它放在一个完整的文件上时,令牌会被文件中的其他内容绊倒。
# -*- coding: utf-8 -*-
from __future__ import with_statement
from setuptools import setup
def get_version(fname='mccabe.py'):
with open(fname) as f:
for line in f:
if line.startswith('__version__'):
return eval(line.split('=')[-1])
def get_long_description():
descr = []
for fname in ('README.rst',):
with open(fname) as f:
descr.append(f.read())
return 'nn'.join(descr)
setup(
name='mccabe',
version=get_version(),
description="McCabe checker, plugin for flake8",
long_description=get_long_description(),
keywords='flake8 mccabe',
author='Tarek Ziade',
author_email='tarek@ziade.org',
maintainer='Ian Cordasco',
maintainer_email='graffatcolmingov@gmail.com',
url='https://github.com/pycqa/mccabe',
license='Expat license',
py_modules=['mccabe'],
zip_safe=False,
setup_requires=['pytest-runner'],
tests_require=['pytest'],
entry_points={
'flake8.extension': [
'C90 = mccabe:McCabeChecker',
],
},
classifiers=[
'Development Status :: 5 - Production/Stable',
'Environment :: Console',
'Intended Audience :: Developers',
'License :: OSI Approved :: MIT License',
'Operating System :: OS Independent',
'Programming Language :: Python',
'Programming Language :: Python :: 2',
'Programming Language :: Python :: 2.7',
'Programming Language :: Python :: 3',
'Programming Language :: Python :: 3.3',
'Programming Language :: Python :: 3.4',
'Programming Language :: Python :: 3.5',
'Programming Language :: Python :: 3.6',
'Topic :: Software Development :: Libraries :: Python Modules',
'Topic :: Software Development :: Quality Assurance',
],
)
如何设置此语法器以忽略除我指定的两个值之外的所有内容?
在查看了您之前的问题以及解析简化输入的便利性之后,我认为最快的方法是对这些文件进行简单的文本预处理,丢弃所有您不需要的东西,只保留您感兴趣的两部分。 例:
- 打开每个文件。
- 将整个文件读入字符串变量。
- 查找令牌
setup_requires
的起始位置。 - 从该位置,由于这些是数组,请查找下一次出现
]
的位置,这将表示setup_requires
数组定义的结束。 - 使用这些索引,将完整的句子
setup_requires=['pytest-runner']
写入输出文件。 - 对令牌
tests_require
遵循类似的方法,附加到输出文件。 - 现在使用我在另一个答案中提出的语法解析大大简化的输出文件,该语法适用于简单的输入。 通过这种方式,您可以避免解析所有其他内容,并利用我之前所做的可证明的正确答案。
- 对每个输入文件重复此操作。