一天一篇mysql之十五：mysql中完美去重 - 代码天地

一天一篇mysql之十五：mysql中完美去重

其他 2018-09-26 10:07:14 阅读次数: 0

表里面有很多垃圾数据，现在删除保留其中一条（是否重复判断基准为多个字段）

方案一：

DELETE
FROM
 vitae a
WHERE
 (a.peopleId, a.seq) IN (
  SELECT
   peopleId,
   seq
  FROM
   vitae
  GROUP BY
   peopleId,
   seq
  HAVING
   count(*) > 1
 )
AND rowid NOT IN (
 SELECT
  min(rowid)
 FROM
  vitae
 GROUP BY
  peopleId,
  seq
 HAVING
  count(*) > 1
)

无奈报错

解决

DELETE
FROM
 vitae a
WHERE
 (a.peopleId, a.seq) IN (
  SELECT t.* FROM (SELECT
   peopleId,
   seq
  FROM
   vitae
  GROUP BY
   peopleId,
   seq
  HAVING
   count(*) > 1) t
 )
AND rowid NOT IN (
 SELECT t.* FROM (SELECT
  min(rowid)
 FROM
  vitae
 GROUP BY
  peopleId,
  seq
 HAVING
  count(*) > 1) t
)

方案二：完美的【去重留一】SQL

DELETE consum_record
FROM
 consum_record, 
 (
  SELECT
   min(id) id,
   user_id,
   monetary,
   consume_time
  FROM
   consum_record
  GROUP BY
   user_id,
   monetary,
   consume_time
  HAVING
   count(*) > 1
 ) t2
WHERE
 consum_record.user_id = t2.user_id 
 and consum_record.monetary = t2.monetary
 and consum_record.consume_time = t2.consume_time
AND consum_record.id > t2.id;



=======================================================


DELETE users  FROM users , (SELECT user_id FROM users 
    GROUP BY name, age 
    having COUNT(*) > 1) AS t1
WHERE users .user_id = t1.qzkh_id

上面这条sql语句，仔细看一下，揣摩出思路也不难，大概也分为3步来理解：

(SELECT min(id) id, user_id, monetary, consume_time FROM consum_record GROUP BY user_id, monetary, consume_time HAVING count(*) > 1 ) t2 查询出重复记录形成一个集合（临时表t2），集合里是每种重复记录的最小ID

consum_record.user_id = t2.user_id and consum_record.monetary = t2.monetary and consum_record.consume_time = t2.consume_time 关联判断重复基准的字段

猜你喜欢

转载自blog.csdn.net/weixin_39666581/article/details/82633682

一天一篇mysql之十五：mysql中完美去重

一天一篇mysql之七：mysql中in和exist选择

一天一篇mysql之十九：mysql中的索引入门

一天一篇mysql之十八：mysql中的limit、between and、in

一天一篇mysql之十六：mysql中的like

一天一篇mysql之十四：mysql中group by和distinct

一天一篇mysql之十三：mysql中group by和order by

一天一篇mysql之十二：mysql中group by的使用建议

一天一篇mysql之十一：mysql中order by关键字

一天一篇mysql之十：mysql中group by的执行原理

一天一篇mysql之九：mysql中group by关键字

一天一篇mysql之八：mysql中not in和not exist选择

一天一篇mysql之六：mysql中select语句的执行顺序

一天一篇mysql之十七：mysql中的关键字like优化

一天一篇mysql之二十：mysql中的索引优化

一天一篇mysql之五：SQL语句补充

一天一篇mysql之一：认识mysql

一天一篇mysql之四：mysql的数据类型以及如何选择数据选择

一天一篇mysql之三：sql语句分类细讲

一天一篇mysql之二：sql语句的学习

一天一篇博客

一天一篇博客----玩转设计模式之策略模式

mysql 去重留一

一天一模式之16策略模式

一天一模式之3外观模式

一天一模式之12命令模式

一天一模式之17状态模式

一天一个命令之--usermod

一天一个命令之---sysctl

一天一个命令之--vimdiff!

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)