我知道以前也有人问过类似的问题,但提出的解决方案似乎都不适合我。我有以下Pandas
数据框架:
标题 | Tag3 | Tag4标签5标签5标签6标签7标签8标签8标签9标签 | ||
---|---|---|---|---|
0 | 罗恩·约翰逊提到";乐高电影;作为";阴险的反商业阴谋"> | 0 | ||
nan | nan | nan | ||
1 | "财富500强中有40%是由移民或移民子女创办的"> | 1 | ||
nan | nan | nan | nan |
我通过简单地将数据集转换为Numpy
ndarray找到了解决此问题的方法。
# To numpy
numpy_dataset = data.to_numpy(dtype="<U43")
#Get Target
target = data.pop("Target")
#TF dataset
dataset = tf.data.Dataset.from_tensor_slices((numpy_dataset, target.values))
当我尝试tf feature_columns.ipynb的演示时,我遇到了同样的问题。我发现数据包含空数据,删除它们后,代码工作
#drop null data
dataframe = dataframe.dropna(axis=0, how='any')