• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    SQL对冗余数据的删除重复记录只保留单条的说明
    我们先看一下相关数据结构的知识。

    在学习线性表的时候,曾有这样一个例题。

    已知一个存储整数的顺序表La,试构造顺序表Lb,要求顺序表Lb中只包含顺序表La中所有值不相同的数据元素。
    算法思路:
    先把顺序表La的第一个元素付给顺序表Lb,然后从顺序表La的第2个元素起,每一个元素与顺序表Lb中的每一个元素进行比较,如果不相同,则把该元素附加到顺序表Lb的末尾。
    复制代码 代码如下:

    public SeqListint> Purge(SeqListint> La)
    {
    SeqListint> Lb = new SeqListint>(La.Maxsize);
    //将a表中的第1个数据元素赋给b表
    Lb.Append(La[0]);
    //依次处理a表中的数据元素
    for (int i = 1; i = La.GetLength() - 1; ++i)
    {
    int j = 0;
    //查看b表中有无与a表中相同的数据元素
    for (j = 0; j = Lb.GetLength() - 1; ++j)
    {
    //有相同的数据元素
    if (La[i].CompareTo(Lb[j]) == 0)
    {
    break;
    }
    }
    //没有相同的数据元素,将a表中的数据元素附加到b表的末尾。
    if (j > Lb.GetLength() - 1)
    {
    Lb.Append(La[i]);
    }
    return Lb;
    }
    }

    如果理解了这个思路,那么数据库中的处理就好办了。

    我们可以做一个临时表来解决问题
    复制代码 代码如下:

    select distinct * into #Tmp from tableName
    drop table tableName
    select * into tableName from #Tmp
    drop table #Tmp

    发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

    但是你说了,我不想增加任何字段,但这时候又没有显式的标识列,怎么取出标识列呢?(可以是序号列,GUID,等)

    上个问题先不讲,先看看这个问题。

    我们分别在三种数据库中看一下处理办法,就是通常我们用的Sqlserver2000,Sqlserver2005,Oracle 10g.

    1. SQL Server 2000 构造序号列

    方法一:
    SELECT 序号=
    (SELECT COUNT(客户编号) FROM 客户 AS a WHERE a.客户编号= b.客户编号),
    客户编号,公司名称 FROM 客户 AS b ORDER BY 1;
    方法二:

    SELECT 序号= COUNT(*),
    a.客户编号, a.公司名称FROM 客户 AS a, 客户 AS b
    WHERE a.客户编号>= b.客户编号 GROUP BY a.客户编号, b.公司名称 ORDER BY 序号;
    2. SQL Server 2005 构造序号列

    方法一:
    SELECT RANK() OVER (ORDER BY 客户编号 DESC) AS 序号, 客户编号,公司名称 FROM 客户;

    方法二:
    WITH TABLE AS
    (SELECT ROW_NUMBER() OVER (ORDER BY 客户编号 DESC) AS 序号, 客户编号,公司名称 FROM 客户)
    SELECT * FROM TABLE
    WHERE 序号 BETWEEN 1 AND 3;
    3. Oracle 里 rowid 也可看做默认标识列
    在Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、块、行上。
    在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大rowid的就可以了,其余全部删除。
    复制代码 代码如下:

    select * from test;select * from test group by id having count(*)>1select * from test group by idselect distinct * from testdelete from test a where a.rowid!=(select max(rowid) from test b where a.id=b.id);扯远了,回到原来的问题,除了采用数据结构的思想来处理,因为数据库特有的事务处理,能够把数据缓存在线程池里,这样也相当于临时表的功能,所以,我们还可以用游标来解决删除重复记录的问题。
    declare @max int,
    @id int
    declare cur_rows cursor local for select id ,count(*) from test group by id having count(*) > 1
    open cur_rows
    fetch cur_rows into @id ,@max
    while @@fetch_status=0
    begin
    select @max = @max -1
    set rowcount @max --让这个时候的行数等于少了一行的统计数,想想看,为什么
    delete from test where id = @id
    fetch cur_rows into @id ,@max
    end
    close cur_rows
    set rowcount 0 以上是闪电查阅一些资料写出的想法,有考虑不周的地方,欢迎大家指出。
    您可能感兴趣的文章:
    • SQL语句实现删除重复记录并只保留一条
    • MySQL数据库中删除重复记录的方法总结[推荐]
    • SqlServer2005中使用row_number()在一个查询中删除重复记录的方法
    • SQL Server2008中删除重复记录的方法分享
    • sqlserver 删除重复记录处理(转)
    • SqlServer 2005中使用row_number()在一个查询中删除重复记录
    • mysql删除重复记录语句的方法
    • SQL语句实现删除ACCESS重复记录的两种方法
    • 有用的SQL语句(删除重复记录,收缩日志)
    • sql 删除表中的重复记录
    上一篇:一次SQL调优数据库性能问题后的过程(300W)
    下一篇:数据结构简明备忘录 线性表
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    SQL对冗余数据的删除重复记录只保留单条的说明 SQL,对,冗余,数据,的,删除,