大型数据集对训练模型大小的影响?



如果数据集很大,是否意味着模型大小也会很大?

例如,我们的真实世界数据是函数y = ax + b

数据集是此行上的所有数据点

模型是我们表示这些数据的数学表示

模型大小是我们用于表示的参数数量

现在,模型大小与我们想要表示的实际函数相关。

我们可以为线ax + b创建一个巨大的数据集,但是这个函数的模型只需要两个参数ab,如果我们只有这条线的两个点,我们可以创建模型

现实世界的数据并不像一条线那么简单,但是如果我们有一些具有相同结果模型且参数数量最少的模型,那么就是野兽一。

训练数据集大小取决于模型的复杂性

最新更新