我从未使用过Cython,但我需要加密我的源代码。
我的问题是,如何将包含df.query("foo=@bar")
等行的python文件转换为Cython。
如何复制此错误:
foo.py
import pandas as pd
bar=1
df=pd.DataFrame([1,2,3,4,5],columns=['test'])
print(df.query("test==@bar"))
setup.py
from distutils.core import setup
from distutils.extension import Extension
from Cython.Distutils import build_ext
ext_modules = [
Extension("sample_code", ["foo.py"]),
]
setup(
name = 'My Program',
cmdclass = {'build_ext': build_ext},
ext_modules = ext_modules
)
然后,运行python setup.py build_ext --inplace
from sample_code import foo
我得到错误:pandas.core.computation.ops.UndefinedVariableError: local variable 'bar' is not defined
>正如@hpaulj在评论中所说:@bar
不会起作用,因为它使用Python内省机制来查找调用者的字典。Cython不会生成信息。
根据DataFrame.Eval
的文档,您可以将关键字参数传递locals_dict
或globals_dict
。因此,您可以执行以下任一操作:
df.query("test==@bar", locals_dict={'bar': bar})
或
df.query("test==@bar", locals_dict=locals())
值得强调的是,简单地将其放在Cython文件中不会提供任何性能优势。性能将取决于 Pandas 的性能,而您编译了调用 Pandas 的文件这一事实根本没有区别。
在您的情况下,它还提供了有限的"加密"优势 - 字符串"test==@bar"
肯定会在您编译的 Cython 文件中找到。