我正在开发一个Google apps迁移/存档系统,在开发的这一点上,我正试图想出一种方法来下载我的域用户创建的所有组中的所有消息。我知道我可以设置转发过滤器并将所有邮件归档到电子邮件中,但这对旧邮件没有帮助。
是否有一种方法可以从谷歌组下载这些消息,如果是这样,是否有在管理API获得用户创建的所有组的列表?
如果您不介意使用#bash,您可以尝试我编写的一个工具
https://github.com/icy/google-group-crawler可以从Google Group下载所有mbox文件。如果你有一个cookie文件,你甚至可以从一个私人谷歌组下载所有文件,和/或查看所有原始电子邮件。它还可以读取rss订阅并获取最新的帖子;这是很有用的每日镜子。
示例结果如下http://l.archlinuxvn.org/archlinuxvn/。MHonArch用于将mbox
文件转换为HTML格式
最终我使用gdata python库来获得所有组的列表以及它们各自的url。从那里,我使用selenium来抓取消息和所有回复的组。可能不是最好的解决方案,但它可以满足我的需要。
我使用selenium和htmlunit制作了一个简单的废料实用程序。你可以用它…它不是很优化,只能帮助你下载小群消息(最多7000条消息)
https://github.com/himukr/google-grp-scraper我们可以尝试下面的内容
- 将google群组消息转发到电子邮箱
- 使用IMAP协议Gmail的应用程序密码下载所有带有 标签的电子邮件
- 对产生的电子邮件进行排序和过滤
注意:不确定这是否适用于历史消息,只适用于较新的消息