在进行探索性数据分析(EDA)时,NLP数据集中"Letter Distribution"什么以及"Word Distribution"什么



伙计们,我是数据分析师的新手,我正在努力提高我的技能,所以我从kaggle中获取了一个数据集。这些都是数据集的任务我被EDA的任务3和4卡住了。任何人都可以在这方面帮助我,以及我如何才能做到这一点。[注:这不是任何项目。我只是想提高我的工作技能]

他们希望您统计数据集中每个单词或字母的#(实例(。

然而,这是EDA的一部分,所以我相信你并不严格需要这样做,它只是潜在地有助于确定进一步的分析途径。

最新更新