混合面板:合并重复的人员配置文件并合并事件



由于代码中标识符的切换,我有重复的配置文件。我现在想合并重复的配置文件,并合并事件/活动提要。

我让 API 工作并通过调用

deduplicate_people(prop_to_match='$email',merge_props=True,case_sensitive=False,backup=True,backup_file=None)

重复项实际上被删除,但事件/活动源未合并。所以我会失去很多活动。

有没有办法同时删除重复项和合并事件/活动源?

由于标识符的更改,某些人使用 ID 和其他人使用电子邮件作为distinct_id,因此会发生重复。事件由该 ID 或电子邮件引用给相应的人员。

因此,以下是我最终为人们及其事件重新创建身份映射所做的工作:

我使用Mixpanel的API(export_people/export_events(来创建人员和事件的备份。我编写了一个脚本,为使用实际 ID 作为 distinct_id 而不是电子邮件的人创建一个映射"distinct_id <-> 电子邮件"(无论 $distinct_id 的内容如何,每个人都有一个$email字段(。

然后我检查了所有导出的事件。对于每个 ID 为 distinct_id 的事件,我使用映射将该distinct_id更改为电子邮件。更新的事件保存在 JSON 文件中。从而创建从事件到使用电子邮件作为distinct_id的人的引用 - 否则丢失的事件。

然后我继续使用Mixpanel中的重复数据删除API删除所有重复项 - 从而丢失了一些事件。现在,我从前面的步骤导入了事件,这让我返回了那些丢失的事件。

在使用此方法之前需要考虑的三个未决问题:

  1. 我相信重复数据删除实际上不会删除事件。因此,通过再次导入它们,系统中可能存在重复的事件,这些事件只是没有引用到某个人,并且可能会在某个时候出现。

  2. $email的重复数据删除确实保留了使用电子邮件的人作为distinct_id,并删除了具有实际ID的人。我不知道每次都是这样,还是巧合。对于仍然使用 ID 作为distinct_id的人来说,我的方法将失败。

  3. 我想通常不鼓励像这样破解distinct_id,因为犯错可能会导致数据丢失。所以一定要做对..

最新更新