我正在寻找一种方法来对熊猫数据帧数据进行断言编程,就像R中的assertr
一样。
有方便的图书馆吗?欢迎所有建议。
我不知道有哪些类似的库专门与Pandas集成,但assert
是Python中的一个内置关键字,您可以使用它来验证数据管道中各个点的数据。
语法很简单:
assert [condition]
如果是真的,什么也不会发生。如果为false,则会引发一个AssertionError
。
为了验证Pandas的数据,你可以写这样的声明:
import pandas as pd
import seaborn as sns
iris = sns.load_dataset('iris')
# throws an exception if there are negative values in the sepal_length column
assert (iris['sepal_length'] > 0).all()
我找到了自己问题的答案:确切地说,我在寻找什么。