防止 symfit 模型共享参数对象



多个 symfit 模型实例共享具有相同名称的参数对象。我想了解这种行为来自哪里,它的意图是什么以及是否可以停用。

为了说明我的意思,举一个最小的例子:

import symfit as sf
# Create Parameters and Variables
a = sf.Parameter('a',value=0)
b = sf.Parameter('b',value=1,fixed=True)
x, y = sf.variables('x, y')
# Instanciate two models
model1=sf.Model({y:a*x+b})
model2=sf.Model({y:a*x+b})
# They are indeed not the same
id(model1) == id(model2)
>>False
# There are two parameters
print(model1.params)
>>[a,b]
print(model1.params[1].name, model1.params[1].value)
>>b 1
print(model2.params[1].name, model2.params[1].value)
>>b 1
#They are initially identical
# We want to manually modify the fixed one in only one model
model1.params[1].value = 3
# Both have changed
print(model1.params[1].name, model1.params[1].value)
>>b 3
print(model2.params[1].name, model2.params[1].value)
>>b 3
id(model1.params[1]) == id(model2.params[1])
>>True
# The parameter is the same object

我想用不同的模型拟合多个数据流,但不同的固定参数值取决于数据流。重命名模型每个实例中的参数都可以,但鉴于参数表示相同的数量,这很丑陋。可以按顺序处理它们并在两者之间修改参数,但我担心步骤之间的意外交互。

PS:有足够声誉的人可以创建symfit标签吗

很好的问题。原则上这是因为Parameter对象是sympy.Symbol的子类,并且从其文档字符串来看:

Symbols are identified by name and assumptions:
>>> from sympy import Symbol
>>> Symbol("x") == Symbol("x")
True
>>> Symbol("x", real=True) == Symbol("x", real=False)
False

这是sympy内部工作的基础,因此我们也在symfit中使用。但是值和固定参数不被视为假设,因此它们不用于区分参数。

现在,回答您关于这将如何影响合身的问题。就像你说的,按顺序工作是一个很好的解决方案,而且不会有任何副作用:

model = sf.Model({y:a*x+b})
b.fixed = True
fit_results = []
for b_value, xdata, ydata in datastream:
b.value = b_value
fit = Fit(model, x=xdata, y=ydata)
fit_results.append(fit.execute())

因此,无需在每次迭代中定义新Parameterb.value属性在每个循环中都是相同的,因此不会出错。我能想象到这出错的唯一方法是,如果你使用threading,这可能会产生一些竞争条件。但无论如何,threading对于 CPU 密集型任务来说都是不可取的,multiprocessing这是要走的路。在这种情况下,将生成单独的进程,创建单独的微观世界,因此那里也应该没有问题。

我希望这能回答你的问题,如果没有让我知道。

附言我慢慢地回答到1500来制作那个标签,但如果有人打败我,我当然会为此感到高兴;)