Pandas/Python-确定一个范围内多项式方程的局部最小值和最大值



我有一个四阶回归方程,我想找到因变量(y(和相应的自变量(x(的值。本质上,我在寻找在给定范围内曲线斜率为零的点(曲线触底(。

我的方程式是:

y = 2661x^5 + 637x^4 + 9.32x^3 - 3.88x^2 - 0.62x + .21

我对x[-0.155,0.103]范围内的最小y值感兴趣。

实际方程变量如下:

     In [54]:
df3.dtypes
Out[54]:
date       datetime64[ns]
expDate    datetime64[ns]
X^5               float64
X^4               float64
X^3               float64
X^2               float64
X                 float64
Const             float64
minls             float64
maxls             float64
dtype: object
In [55]: 
df3
Out[55]:
        date    expDate          X^5         X^4       X^3       X^2  
5 2008-01-02 2008-01-19  2661.368357  637.214501  9.320573 -3.884286   
          X    Const     minls     maxls  
5 -0.621015  0.21083 -0.154444  0.102655  

其中minls和maxls是范围变量

有没有一种优雅的方法可以做到这一点?我确实看过scipy.optimize.brent,但就是看不到它的实现

我还想提到,我已经在数据帧上执行了[date,expDate]的分组,以防它对解决方案有影响。我的愿望是有一个新的变量df3.zerolls包含"ls"值在范围[minls,maxls]内

提前感谢的任何帮助

约翰·

更新:当我只有一行数据时,我得到了一些帮助,能够执行所需的过程。以下是我迄今为止的代码。在对ondate和expDate执行分组之后,我需要能够对许多行执行相同的分析。

In [13]:

%cd C:UserscamcompcoPycharmProjectsRegression
df=pd.read_csv('min.csv')
C:UserscamcompcoPycharmProjectsRegression
In [14]:
df.head()
Out[14]:
       date    expDate      X^5     X^4    X^3   X^2     X  Const  minls  
0  1/2/2008  1/19/2008  2661.37  637.21   9.32 -3.88 -0.62   0.21  -0.15   
1  1/2/2008  2/16/2008   188.65   94.25  11.00 -1.44 -0.73   0.22  -0.15   
2  1/2/2008  3/22/2008    28.31   19.98   3.85 -0.53 -0.57   0.23  -0.15   
3  1/3/2008  1/19/2008  2715.64  571.99  -6.31 -3.66 -0.48   0.20  -0.15   
4  1/3/2008  2/16/2008   135.61   76.55   9.96 -1.18 -0.70   0.21  -0.15   
    maxls  
0  0.1000  
1  0.1001  
2  0.1002  
3  0.1003  
4  0.1004  
In [21]:
row = df.iloc[0]
f = np.poly1d(row.iloc[2:8])
In [22]:
f
Out[22]:
poly1d([2661.3699999999999, 637.21000000000004, 9.3200000000000003,
       -3.8799999999999999, -0.62, 0.20999999999999999], dtype=object)
In [23]:
result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
In [24]:
result.x
Out[24]:
0.066556628458908085
In [25]:
f(result.x)
Out[25]:
0.1702749792881138
In [ ]:

你说你想要斜率为零的地方,然后你说你需要一个范围内的最小y值。这两者不必相同(在你寻找的地方甚至不需要存在局部最小值(。假设你真的对(a(最小y值感兴趣,我们可以使用np.poly1d将系数转化为函数,然后使用scipy.optimize.minimize_scalar找到你范围内的最小值。

首先我们做多项式:

>>> row = df3.iloc[0]
>>> f = np.poly1d(row.iloc[2:8])
>>> f
poly1d([2661.3683569999998, 637.21450100000004, 9.3205729999999996,
       -3.8842859999999999, -0.62101499999999998, 0.21082999999999999], dtype=object)

检查以确保系数符合我们期望的顺序总是一个好主意:

>>> f(0)
0.21082999999999999

然后我们使用minimize_scalar和有界方法:

>>> result = scipy.optimize.minimize_scalar(f, bounds=(row["minls"], row["maxls"]), method='bounded')
>>> result
 message: 'Solution found.'
 success: True
     fun: 0.17101866540403174
  status: 0
       x: 0.06659055175137768
    nfev: 11

我们想要的x的值在result:中

>>> result.x
0.06659055175137768
>>> f(result.x)
0.17101866540403174

scipy.optimize.minimize_scalar,如@DSM所示,是最好的解决方案-它经过了优化,对于您的示例,只需要进行11次功能评估(result['nfev'](。我本来打算自己去那里,但我太慢了。

我将提供一个滚动您自己的解决方案,足够好精度,为您提供一个如何思考问题的例子-再次假设您正在寻找一个局部最小值,而不是零斜率

import numpy as np

创建poly1d

f = np.poly1d([2661.3683569999998, 637.21450100000004, 9.3205729999999996,
       -3.8842859999999999, -0.62101499999999998, 0.21082999999999999])

创建一个具有所需分辨率的自变量数组(本例为.01(

minx, maxx = (-0.154444,  0.102655)
#resolution = .0001
resolution = .01
x_s = np.linspace(minx, maxx, num = (maxx - minx)/resolution)
>>> x_s
array([-0.154444  , -0.14373154, -0.13301908, -0.12230663, -0.11159417,
       -0.10088171, -0.09016925, -0.07945679, -0.06874433, -0.05803188,
       -0.04731942, -0.03660696, -0.0258945 , -0.01518204, -0.00446958,
        0.00624287,  0.01695533,  0.02766779,  0.03838025,  0.04909271,
        0.05980517,  0.07051762,  0.08123008,  0.09194254,  0.102655  ])
>>> np.diff(x_s)
array([ 0.01071246,  0.01071246,  0.01071246,  0.01071246,  0.01071246,
        0.01071246,  0.01071246,  0.01071246,  0.01071246,  0.01071246,
        0.01071246,  0.01071246,  0.01071246,  0.01071246,  0.01071246,
        0.01071246,  0.01071246,  0.01071246,  0.01071246,  0.01071246,
        0.01071246,  0.01071246,  0.01071246,  0.01071246])

创建因变量矢量

v = f(x_s)
>>> v
array([ 0.30844319,  0.3008677 ,  0.29143552,  0.28137826,  0.27156949,
        0.26256978,  0.25467177,  0.2479452 ,  0.242282  ,  0.23744129,
        0.2330945 ,  0.22887038,  0.22440004,  0.21936206,  0.2135275 ,
        0.20680496,  0.19928564,  0.19128841,  0.18340481,  0.17654419,
        0.17197868,  0.17138828,  0.17690593,  0.19116253,  0.21733202])

查找v 最小值的索引

min_idx = np.where(v == v.min())
>>> min_idx
(array([21]),)

使用该索引检索创建的x值。

local_min = x_s[min_idx]
>>> local_min
array([ 0.07051762])

布尔索引也可以让你达到

>>> x_s[v == v.min()]
array([ 0.07051762])
>>>

最新更新