我有RGB形式的颜色。有4列
- 的accent_color"→(0.6901960784313725, 0.14901960784313725, 0.10588235294117647)
- 的dominant_colors"→[(0.6470588235294118, 0.16470588235294117, 0.16470588235294117), (0.0, 0.0, 0.0), (1.0, 1.0, 1.0)]
- 的bg_color"比;(0.6470588235294118, 0.16470588235294117, 0.16470588235294117)
- 的fore_color"→(0.0, 0.0, 0.0)
我想在文本模型中使用这些值作为特征。这些颜色将用于确定该帖子是否有更多的可能性获得喜欢的颜色。如有任何建议,我将不胜感激。
从您提供的信息中回答这个问题非常广泛,但我认为,首先您需要进行一些解释性分析,以了解您的数据集是否可以很好地代表您的类。在进行此分析之前,需要将此数据转换为表格形式。
我将每个颜色组表示为">一个像这样的编码"表单,从你的数据集的一行看起来像:
accent_color_R : 0.6901960784313725
accent_color_G : 0.14901960784313725
accent_color_B : 0.10588235294117647
dominant_colors_first_group_R : 0.6470588235294118
dominant_colors_first_group_G : 0.16470588235294117
dominant_colors_first_group_B : 0.16470588235294117
dominant_colors_second_group_R : 0.0
dominant_colors_second_group_G : 0.0
dominant_colors_second_group_B : 0.0
dominant_colors_third_group_R : 1.0
dominant_colors_third_group_G : 1.0
dominant_colors_third_group_B : 1.0
bg_color_R : 0.6470588235294118
bg_color_G : 0.16470588235294117
bg_color_B : 0.16470588235294117
fore_color_R : 0.0
fore_color_G : 0.0
fore_color_B : 0.0
class_label : (0 or 1) OR a continuous value that represent probability
所以它将是一个18列(特征)表。它可以是liked/not_liked二元分类问题或者可以是回归问题,对于回归你的标签将是一个连续值它代表概率所以你的类标签将在
[0,1] = {0 & lt; = class_label & lt; = 1}
你可以使用神经网络来实现回归。如果你输入"用神经网络实现回归",你可以找到大量的信息。谷歌。