如何获取项目的csv文件中的YouTube视频数据?



我正在做一个小项目,在YouTube视频数据上应用聚类/检索ML方法,以从大型视频数据集中返回一些我想要的特定视频。

首先,我在弄清楚如何获取YouTube视频的数据集时遇到了一些麻烦。最终目标是我想要这样的东西:

video_id | video_title | 类别 | 喜欢 | 不喜欢 | 视图 | words_comment |

对于一堆 csv 格式的视频(也许是 ~10000 行?(,我可以应用 Python 机器学习算法。

最好的方法是什么?我已经尝试过 youtube API,但我不熟悉它是如何工作的,我遇到了错误。直接从 youtube 网站抓取更容易吗?

谢谢!

如果您认为抓取更容易,您可以尝试抓取,但如果您不熟悉 api 调用,您可能觉得抓取不容易。我会研究使用 api 的工作。它们一开始有点时髦,但一旦掌握了它们的窍门,它们就不难使用。

YouTube上有一个名为thenewboston的频道,我相信他有一些api的东西,一般的python视频会有所帮助,因为api响应将被格式化为类似于python的数据类型。

相关内容

最新更新