将随机变量传递给sklearn随机搜索(RandomizedSearchCV)



以下代码中的reciprocal()expon()有什么用途?

svm_grid_R = {'kernel':["linear","rbf"], 'C': reciprocal(20,200000), "gamma" : expon(scale=1.0)}

为什么我们不能只使用range()expon(scale=1.0)reciprocal(20,200000)表示什么范围?

对于上下文,使用这些参数的代码如下所示:

svm_reg = SVR()
rnd_search = RandomizedSearchCV(svm_reg, param_distributions=svm_grid_R,
n_iter=50, cv=5, scoring='neg_mean_squared_error',
verbose=2, random_state=42)
rnd_search.fit(housing_prepared, housing_labels)

我建议您检查脚本中导入函数的部分,以便弄清楚它们是什么。根据你的问题,我推断如下:

  • reciprocal应该来自from scipy.stats import reciprocal,它会给你一个倒数随机变量
  • expon应该来自from scipy.stats import expon,它会给你一个指数随机变量

在代码中,将这些随机变量作为Cgamma参数传递给随机搜索。这意味着搜索使用的随机参数将从这两个分布中采样。

从技术上讲,您还可以使用range来告诉搜索从给定序列中随机抽取数字。另一种方法是向搜索传递一个随机变量,从中对随机参数进行采样。您的代码正在采用第二种方法。

为了更好地理解第二种方法的全部内容,请尝试以下操作:

# Import the distribution
from scipy.stats import expon
# Initialize a random variable with lambda=1 (scale=1)
exponential_rv = expon(scale=1)
# Draw a random sample from this distribution
exponential_rv.rvs()
> 0.780028923390962

在这种特定情况下,您的搜索将把C=0.780028923390962传递给您的支持向量机。

最新更新