MySQL删除基于列的重复数据



我使用的是MySQL 5.7.13

我的数据库中有以下记录,我想根据单列(email_identifier(过滤掉这些记录。即在特定列具有重复值的情况下仅返回单个记录。

我正在尝试以下查询,但它抛出以下错误

mysql> select * from list_subscriber where list_master_id = 202 group by email_identifier;

错误1055(42000(:SELECT列表的表达式#1不在GROUP BY子句中,并且包含非聚合列"db1.listrongubscriber.id",该列在功能上不依赖于GROUP BY子句的列;这与sql_mode=only_full_group_by 不兼容

理想情况下,上面的查询应该只返回一条记录,并且包含所有列

请建议我如何实现这一目标

数据库行样本

mysql> select * from list_subscriber where list_master_id = 202 limit 2G;
*************************** 1. row ***************************
                         id: 30518899
             list_master_id: 202
          unique_identifier: A
           email_identifier: xyz@yahoo.co.in
          mobile_identifier: 9195423432432
alternate_mobile_identifier: 
          region_identifier: 
            city_identifier: 
         country_identifier: 
             age_identifier: 
          gender_identifier: 
                   raw_data: {"user":"A","number":"919542342423","msg":"msg3","emailid":"xyz@vfirst.com"}
                 created_at: 2016-07-08 15:33:24
                 updated_at: 2016-08-11 14:55:52
                 deleted_at: NULL
*************************** 2. row ***************************
                         id: 30518901
             list_master_id: 202
          unique_identifier: J
           email_identifier: xyz@vfirst.com
          mobile_identifier: 919540077166
alternate_mobile_identifier: 
          region_identifier: 
            city_identifier: 
         country_identifier: 
             age_identifier: 
          gender_identifier: 
               raw_data: {"user":"J","number":"919540077166","msg":"msg4","emailid":"xyz@vfirst.com"}
                 created_at: 2016-07-08 15:34:49
                 updated_at: 2016-08-11 14:55:52
                 deleted_at: NULL

更新

CREATE TABLE `list_subscriber` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`list_master_id` int(10) unsigned NOT NULL,
`unique_identifier` varchar(512) COLLATE utf8_unicode_ci NOT NULL,
`email_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`mobile_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`alternate_mobile_identifier` varchar(255) COLLATE utf8_unicode_ci NOT   NULL,
`region_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`city_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`country_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`age_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`gender_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`raw_data` longtext COLLATE utf8_unicode_ci NOT NULL,
`created_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updated_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
`deleted_at` timestamp NULL DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `list_subscriber_list_master_id_foreign` (`list_master_id`),
CONSTRAINT `list_subscriber_list_master_id_foreign` FOREIGN KEY    (`list_master_id`) REFERENCES `list_master` (`id`) ON DELETE CASCADE ON UPDATE CASCADE
)   ENGINE=InnoDB AUTO_INCREMENT=66956432 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci

在执行group by时,您需要为每列提供一个聚合函数,否则MySQL如何从两个不同的值中选择一个?

如果您不想强制要求电子邮件在表中是唯一的,那么应该告诉MySQL这一点。最好的方法是添加一个唯一的索引。

alter table list_subscriber add unique key unique_email (email_identifier);

如果表中已有重复项,则此操作可能会失败。要查找所有重复的电子邮件,请运行

select email_identifier, count(1) as cnt from list_subscriber group by email_identifier having cnt > 1;

这将给你所有的电子邮件,然后你必须手动删除/合并记录。

关于分组依据:

例如:

select a, b,c from abc group by a

在这种情况下,您需要将聚合函数添加到列b和c您可以通过将列b和c添加到组中,例如:

select a,b,c from group by a, b, c

相关内容

  • 没有找到相关文章

最新更新