我是典型相关分析的新手。通过sklearn cca是n_components
字段,我找不到任何关于变量的概念性描述。变量究竟是什么,我如何决定我应该设置它的值?
n_components
变量是您希望在您的CCA模型中保留的组件的数量。
你可以把它想象成你想要表示你的数据的维数。
有几种方法可以决定在你的模型中保留多少组件。
决定保留多少组件的一种方法是查看典型相关性。
典型相关性表示由CCA转换的两组变量之间的相关性。
如果您只想保留相关度最高的维度,则可以将n_components
设置为具有最高典型相关性的组件的数量。
在您的CCA模型中保留多少组件没有正确或错误的答案。
这真的取决于你想用你的CCA模型实现什么。