浏览器和版本应该是一个热门编码的



我需要输出一个热编码的浏览器和版本数据。我们提出了一些选项(下面概述)。我进行了一些搜索,但找不到任何具有类似数据的人的现有示例(搜索Kaggle数据集和DuckDuckgo)。

  • 选项1:一列带有浏览器名称和版本的列一起连接在一起
    • 例如。" browser_version"列值:" Safari-1.2.3"," Chrome-4.5.6"," Firefox-7.8.9"
| order_id | browser_version |
| 1        | Safari-1.2.3    |
| 2        | Chrome-4.5.6    |
| 3        | Firefox-7.8.9   |
  • 选项2:两个列:一个带有浏览器名称,另一个带有浏览器版本
    • 例如。"浏览器"(第1列)值:" Safari"," Chrome"," Firefox"
    • 例如。"版本"(第2列)值:" 1.2.3"," 4.5.6"," 7.8.9"
| order_id | browser | version |
| 1        | Safari  | 1.2.3   |
| 2        | Chrome  | 4.5.6   |
| 3        | Firefox | 7.8.9   |
  • 选项3:两列:一个带有浏览器名称的列,另一个带有浏览器名称的曲线,并将版本连接在一起
    • 例如。"浏览器"(第1列)值:" Safari"," Chrome"," Firefox"
    • 例如。" browser_version"(第2列)值:" Safari-1.2.3"," Chrome-4.5.6"," Firefox-7.8.9"
| order_id | browser | browser_version |
| 1        | Safari  | Safari-1.2.3    |
| 2        | Chrome  | Chrome-4.5.6    |
| 3        | Firefox | Firefox-7.8.9   |

为一个热编码设置数据值(假设CSV文件,列)的最有益方法是什么?

我想正确的答案可能是测试每个选项并检查结果,但我认为这可能是以前已经完成的事情,所以我认为值得一提。

我将使用第一个选项。它将给出每对索引(浏览器|版本)。

第二个选项将不同浏览器的版本编号放在同一列中,而这些数字则不可比。您可以将Chrome版本号与另一个Chrome版本编号进行比较,而不是使用Firefox One的Chrome版本编号。

,第三个选项包含第一个选项,带有其他冗余数据。

最新更新