在多元函数根的寻根算法中，括号是两个根之一

为标题(可能具有误导性)和可能令人困惑的问题本身道歉，我很难用语言表达我的问题，尤其是把它压缩成标题的一句话。我想使用python查找具有两个变量w和t的函数f(w, t, some_other_args)的根。真正的功能结构非常漫长和复杂，你可以在这篇文章的末尾找到它。重要的是它包含以下行：

k = 1.5 * m.sqrt((1.0 - w) / (1.0 - 0.25 * w))

这意味着w不能超过1，因为这将导致计算负数的平方根，当然这是不可能的。我有算法可以使用函数中的其他值来计算w和t的近似值，但它们非常不准确。

因此，我尝试用scipy.optimize.fsolve计算根(在尝试了我在网上能找到的每一个根查找算法后，我发现这个算法对我的函数来说是最好的)，使用这些近似值作为起点，看起来像这样：

solution = optimize.fsolve(f, x0=np.array([t_approx, w_approx]), args=(some_other_args))

对于大多数价值观来说，这是非常好的。然而，如果w过于接近1，则总是会出现fsolve尝试w的某个大于1的值的点，这反过来又会引发ValueError(因为计算负数的根在数学上是不可能的)。这是一个打印fsolve使用的值的示例，其中w应该在0.997:左右

w_approx: 0.9960090844989311
t_approx: 24.26777844720981
Values: t:24.26777844720981, w:0.9960090844989311
Values: t:24.26777844720981, w:0.9960090844989311
Values: t:24.26777844720981, w:0.9960090844989311
Values: t:24.267778808827888, w:0.9960090844989311
Values: t:24.26777844720981, w:0.996009099340623
Values: t:16.319554685876746, w:1.0096680915775516
solution = optimize.fsolve(f, x0=np.array([t_approx, w_approx]), args=(some_other_args))
File "C:Users...venvlibsite-packagesscipyoptimizeminpack.py", line 148, in fsolve
res = _root_hybr(func, x0, args, jac=fprime, **options)
File "C:Users...venvlibsite-packagesscipyoptimizeminpack.py", line 227, in _root_hybr
ml, mu, epsfcn, factor, diag)
File "C:Users...algorithm.py", line 9, in f
k = 1.5 * m.sqrt((1.0 - w) / (1.0 - 0.25 * w))
ValueError: math domain error

那么，我如何告诉optimize.fsolvew不能大于1呢？或者，有什么替代算法可以做这样的事情(我知道brentq等等，但所有这些都需要为两个根给定一个区间，我不想这样做。)？

测试代码(这里需要注意的是：尽管理论上func应该在给定t和w的情况下计算R和T，但我不得不反过来使用它。它有点笨拙，但我根本无法重写函数，使其接受T, R来计算t, w——这对我平庸的数学专业知识来说有点太多了；)：

import math as m
from scipy import optimize
import numpy as np

def func(t, w, r_1, r_2, r_3):
k = 1.5 * m.sqrt((1.0 - w) / (1.0 - 0.25 * w))
k23 = 2 * k / 3
z1 = 1 / (1 + k23)
z2 = 1 / (1 - k23)
z3 = 3 * ((1 / 5 + r_1 - r_2 - 1 / 5 * r_1 * r_2) / (z1 - r_2 * z2)) * m.exp(t * (k - 1))
z4 = -(z2 - r_2 * z1) / (z1 - r_2 * z2) * m.exp(2 * k * t)
z5 = -(z1 - r_2 * z2) / (z2 - r_2 * z1)
z6 = 3 * (1 - r_2 / 5) / (z2 - r_2 * z1)
beta_t = r_3 / (z2 / z1 * m.exp(2 * k * t) + z5) * (z6 - 3 / (5 * z1) * m.exp(t * (k - 1)))
alpha_t = beta_t * z5 - r_3 * z6
beta_r = (z3 - r_1 / 5 / z2 * m.exp(-2 * t) * 3 - 3 / z2) / (z1 / z2 + z4)
alpha_r = -z1 / z2 * beta_r - 3 / z2 - 3 / 5 * r_1 / z2 * m.exp(-2 * t)
It_1 = 1 / 4 * w / (1 - 8 / 5 * w) * (alpha_t * z2 * m.exp(-k * t) + beta_t * z1 * m.exp(k * t) + 3 * r_3 * m.exp(-t))
Ir_1 = (1 / 4 * w / (1 - 8 / 5 * w)) * (z1 * alpha_r + z2 * beta_r + 3 / 5 + 3 * r_1 * m.exp(-2 * t))
T = It_1 + m.exp(-t) * r_3
R = Ir_1 + m.exp(-2 * t) * r_1
return [T, R]

def calc_1(t, w, T, R, r_1, r_2, r_3):
t_begin = float(t[0])
T_new, R_new = func(t_begin, w, r_1, r_2, r_3)
a = abs(-1 + T_new/T)
b = abs(-1 + R_new/R)
return np.array([a, b])

def calc_2(x, T, R, r_1, r_2, r_3):
t = x[0]
w = x[1]
T_new, R_new = func(t, w, r_1, r_2, r_3)
a = abs(T - T_new)
b = abs(R - R_new)
return np.array([a, b])

def approximate_w(R):
k = (1 - R) / (R + 2 / 3)
w_approx = (1 - ((2 / 3 * k) ** 2)) / (1 - ((1 / 3 * k) ** 2))
return w_approx

def approximate_t(w, T, R, r_1, r_2, r_3):
t = optimize.root(calc_1, x0=np.array([10, 0]), args=(w, T, R, r_1, r_2, r_3))
return t.x[0]

def solve(T, R, r_1, r_2, r_3):
w_x = approximate_w(R)
t_x = approximate_t(w_x, T, R, r_1, r_2, r_3)
sol = optimize.fsolve(calc_2, x0=np.array([t_x, w_x]), args=(T, R, r_1, r_2, r_3))
return sol

# Values for testing:
T = 0.09986490557943692
R = 0.8918728343037964
r_1 = 0
r_2 = 0
r_3 = 1
print(solve(T, R, r_1, r_2, r_3))

如何对要约束的参数进行逻辑化？我的意思是，在f内，你可以进行

import numpy as np
def f(free_w, ...):
w = 1/(1 + np.exp(-free_w)) # w will always lie between 0 and 1
...
return zeros

然后，您只需要对free_w的解值应用相同的逻辑变换，就可以得到w*。参见

solution = optimize.fsolve(f, x0=np.array([t_approx, w_approx]), args=(some_other_args))
free_w   = solution[0]
w        = 1/(1 + np.exp(-free_w))

您报告的错误发生在fsolve无法处理w到k转换中的隐含限制时。这可以通过颠倒这种依赖性来从根本上解决，使func依赖于t和k。

def w2k(w): return 3 * m.sqrt((1.0 - w) / (4.0 - w))
#k = 1.5 * m.sqrt((1.0 - w) / (1.0 - 0.25 * w))
# (k/3)**2 * (4-w)= 1-w 
def k2w(k): return 4 - 3/(1-(k/3)**2)
def func(t, k, r_1, r_2, r_3):
w = k2w(k)
print "t=%20.15f, k=%20.15f, w=%20.15f"%(t,k,w)
...

然后从calc1和calc2中的函数值中去除绝对值。这只会将你的解渲染为不可微点，这对任何寻根算法都是不利的。符号变化和光滑的根对于类似牛顿的方法是有益的。

def calc_2(x, T, R, r_1, r_2, r_3):
t = x[0]
k = x[1]
T_new, R_new = func(t, k, r_1, r_2, r_3)
a = T - T_new
b = R - R_new
return np.array([a, b])

通过求解分别保持CCD_ 36的方程来寻找CCD_。k已修复，它只是使计算工作量增加了一倍。

def approximate_k(R):
k = (1 - R) / (R + 2 / 3)
return k
def solve(T, R, r_1, r_2, r_3):
k_x = approximate_k(R)
t_x = 10
sol = optimize.fsolve(calc_2, x0=np.array([t_x, k_x]), args=(T, R, r_1, r_2, r_3))
return sol
t,k = solve(T, R, r_1, r_2, r_3)
print "t=%20.15f, k=%20.15f, w=%20.15f"%(t, k, k2w(k))

通过这些修改，解决方案

t=  14.860121342410327, k=   0.026653140486605, w=   0.999763184675043

在15个功能评估中找到。

在优化函数之前，应该尝试显式定义函数，这样可以更容易地检查域。

本质上，你有一个T和R的函数。这对我有用：

def func_to_solve(TR_vector, r_1, r_2, r_3):
T, R = TR_vector   # what you are trying to find
w_x = approximate_w(R)
t_x = approximate_t(w_x, T, R, r_1, r_2, r_3)
return (calc_2([t_x, w_x], T, R, r_1, r_2, r_3))
def solve(TR, r_1, r_2, r_3):
sol = optimize.fsolve(func_to_solve, x0=TR, args=(r_1, r_2, r_3))
return sol

另外，用np.exp替换m.exp

相关内容

最新更新

热门标签：