如果数据集很大,是否意味着模型大小也会很大?
例如,我们的真实世界数据是函数y = ax + b
数据集是此行上的所有数据点
模型是我们表示这些数据的数学表示
模型大小是我们用于表示的参数数量
现在,模型大小与我们想要表示的实际函数相关。
我们可以为线ax + b
创建一个巨大的数据集,但是这个函数的模型只需要两个参数a
和b
,如果我们只有这条线的两个点,我们可以创建模型
现实世界的数据并不像一条线那么简单,但是如果我们有一些具有相同结果模型且参数数量最少的模型,那么就是野兽一。
训练数据集大小取决于模型的复杂性