我使用的是MySQL 5.7.13
我的数据库中有以下记录,我想根据单列(email_identifier(过滤掉这些记录。即在特定列具有重复值的情况下仅返回单个记录。
我正在尝试以下查询,但它抛出以下错误
mysql> select * from list_subscriber where list_master_id = 202 group by email_identifier;
错误1055(42000(:SELECT列表的表达式#1不在GROUP BY子句中,并且包含非聚合列"db1.listrongubscriber.id",该列在功能上不依赖于GROUP BY子句的列;这与sql_mode=only_full_group_by 不兼容
理想情况下,上面的查询应该只返回一条记录,并且包含所有列。
请建议我如何实现这一目标
数据库行样本
mysql> select * from list_subscriber where list_master_id = 202 limit 2G;
*************************** 1. row ***************************
id: 30518899
list_master_id: 202
unique_identifier: A
email_identifier: xyz@yahoo.co.in
mobile_identifier: 9195423432432
alternate_mobile_identifier:
region_identifier:
city_identifier:
country_identifier:
age_identifier:
gender_identifier:
raw_data: {"user":"A","number":"919542342423","msg":"msg3","emailid":"xyz@vfirst.com"}
created_at: 2016-07-08 15:33:24
updated_at: 2016-08-11 14:55:52
deleted_at: NULL
*************************** 2. row ***************************
id: 30518901
list_master_id: 202
unique_identifier: J
email_identifier: xyz@vfirst.com
mobile_identifier: 919540077166
alternate_mobile_identifier:
region_identifier:
city_identifier:
country_identifier:
age_identifier:
gender_identifier:
raw_data: {"user":"J","number":"919540077166","msg":"msg4","emailid":"xyz@vfirst.com"}
created_at: 2016-07-08 15:34:49
updated_at: 2016-08-11 14:55:52
deleted_at: NULL
更新
CREATE TABLE `list_subscriber` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`list_master_id` int(10) unsigned NOT NULL,
`unique_identifier` varchar(512) COLLATE utf8_unicode_ci NOT NULL,
`email_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`mobile_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`alternate_mobile_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`region_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`city_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`country_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`age_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`gender_identifier` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`raw_data` longtext COLLATE utf8_unicode_ci NOT NULL,
`created_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updated_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
`deleted_at` timestamp NULL DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `list_subscriber_list_master_id_foreign` (`list_master_id`),
CONSTRAINT `list_subscriber_list_master_id_foreign` FOREIGN KEY (`list_master_id`) REFERENCES `list_master` (`id`) ON DELETE CASCADE ON UPDATE CASCADE
) ENGINE=InnoDB AUTO_INCREMENT=66956432 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci
在执行group by
时,您需要为每列提供一个聚合函数,否则MySQL如何从两个不同的值中选择一个?
如果您不想强制要求电子邮件在表中是唯一的,那么应该告诉MySQL这一点。最好的方法是添加一个唯一的索引。
alter table list_subscriber add unique key unique_email (email_identifier);
如果表中已有重复项,则此操作可能会失败。要查找所有重复的电子邮件,请运行
select email_identifier, count(1) as cnt from list_subscriber group by email_identifier having cnt > 1;
这将给你所有的电子邮件,然后你必须手动删除/合并记录。
关于分组依据:
例如:
select a, b,c from abc group by a
在这种情况下,您需要将聚合函数添加到列b和c您可以通过将列b和c添加到组中,例如:
select a,b,c from group by a, b, c