我是python的新手,但我想尝试使用k-means进行聚类。 但首先我需要提取我的文档,以便我可以执行预处理过程。 之后,我想将其转换为CSV。谁能建议我需要采取什么步骤?
一个好的开始是弄清楚如何从文档中提取单词。快速搜索得出了这个库
如果您希望在没有库的情况下完成此部分,这里有一篇文章提供了仅使用标准库读取.docx文件的代码片段
您可以在整个过程中围绕NLTK python库进行分层
我是python的新手,但我想尝试使用k-means进行聚类。 但首先我需要提取我的文档,以便我可以执行预处理过程。 之后,我想将其转换为CSV。谁能建议我需要采取什么步骤?
一个好的开始是弄清楚如何从文档中提取单词。快速搜索得出了这个库
如果您希望在没有库的情况下完成此部分,这里有一篇文章提供了仅使用标准库读取.docx文件的代码片段
您可以在整个过程中围绕NLTK python库进行分层
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium