What is a promise in Javascript?

Question

Asked: 2020-12-25 15:16:52 +0800 CST 2020-12-25 15:16:52 +0800 CST 2020-12-25 15:16:52 +0800 CST

Как удалить повторяющиеся строки?

772

Как лучше всего удалить повторяющиеся строки из довольно большой таблицы? (Например, более 300 000 строк)

Конечно, строки не будут идеальными дубликатами из-за существования поля идентификации.ROWID

MyTable
-----------
RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

Оригинальный вопрос: как удалить повторяющиеся строки?

5 Answers

Voted

Juan Ruiz de Castilla · Answer 1 · 2020-12-25T16:11:22+08:00

Прежде всего, вам нужно решить, каковы будут ваши критерии двуличия. Например, я хочу проверить, повторяются ли вместе второй (col1) и третий (col2) столбцы.

дата теста первая

insert into MyTable
values (1,4533660,1,'COMPANY 1')
insert into MyTable
values (2,4533660,1,'COMPANY 1')
insert into MyTable
values (3,954189547,1,'COMPANY 2')
insert into MyTable
values (4,954189547,1,'COMPANY 2')
insert into MyTable
values (5,3652591,1,'COMPANY 3')
insert into MyTable
values (6,4201580,1,'COMPANY 4')
insert into MyTable
values (7,3337788,1,'COMPANY 5')

Затем запрос для получения дубликатов на основе предопределенных критериев.

Select 
Col1,
Col2,
COUNT(*)
from MyTable 
group by Col1,
Col2
HAVING COUNT(*) > 1

С помощью этого запроса вы можете легко найти дубликаты, более важными, чем сам запрос, являются критерии, которые вы используете.

Если вы хотите устранить повторяющиеся данные (очевидно, рекомендуется сделать резервную копию или инкапсулировать все в транзакцию), вы можете сделать следующее:

DELETE A
FROM MyTable A 
INNER JOIN 
(
        SELECT ROW_NUMBER()OVER(PARTITION BY a.col1,
        a.Col2
        ORDER BY a.Col1,a.Col2)AS POS,
        a.rowID,
        a.Col3
        FROM MyTable A
        JOIN 
        (
            Select 
            Col1,
            Col2,
            COUNT(*) AS CONTADOR
            from MyTable 
            group by Col1,
            Col2
            HAVING COUNT(*) > 1
        ) TB
        ON A.col1 = TB.col1
        AND A.col2 = TB.col2
) TB_2
ON
a.ROWID = tb_2.ROWID 
and tb_2.pos > 1

Alvaro Montoro · Answer 2 · 2020-12-26T02:23:38+08:00

Один из вариантов — использовать временные таблицы. Для этого:

Создайте временную таблицу, в которой будут неповторяющиеся строки.
Вставляет все неповторяющиеся строки во временную таблицу.
Удалить все записи из исходной таблицы.
Сбрасывает временную таблицу в исходную таблицу.
При желании удалите временную таблицу (она будет автоматически удалена в конце сеанса).

Код (я его не тестировал) будет примерно таким:

-- Los puntos 1 y 2 se podrían hacer en un solo paso: crear tabla temporal e insertar datos
INSERT INTO #tablaTemporal
SELECT DISTINCT Col1, Col2, Col3
FROM   MyTable;

-- Borrar todos los datos de la tabla original
DELETE FROM MyTable;

-- Volcar los datos no duplicados desde la tabla temporal a la original
INSERT INTO MyTable
SELECT * FROM #tablaTemporal;

Gerson Ubence Izaguirre Morale · Answer 3 · 2020-04-11T18:14:47+08:00

принимая во внимание, что дублирование будет происходить в других столбцах и что есть столбец, который, если бы он был другим (RowID), был бы только пронумерован с помощью функции ROW_NUMBER, разделен на все столбцы, кроме RowID, и удалить эти записи, и в этом случае нумерация должна быть> 1, я не знаю, лучший ли это способ, но это был бы вариант:

DELETE FROM MyTable
  WHERE RowID IN (SELECT RowID 
                    FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Col1,Col2,Col3 ORDER BY (SELECT NULL)) AS R_ID,RowID,Col1,Col2,Col3
                            FROM MyTable) a
                   WHERE R_ID > 1)

Следующая форма также работает, и ее полезно использовать, если нет столбца для различения записей (в случае, если вы укажете, у него был RowId). Но я не знаю, зависит ли это от версии SQL Server, у меня это сработало в SQL Server 2012:

WITH FUENTE AS (
SELECT ROW_NUMBER() OVER(PARTITION BY Col1,Col2,Col3 ORDER BY (SELECT NULL)) AS R_ID,Col1,Col2,Col3
  FROM MyTable) DELETE FROM FUENTE WHERE R_ID > 1;

jkvalero · Answer 4 · 2020-10-05T05:31:50+08:00

Привет друзья! Прилагаю разработанный мною Transact, который работает без дополнительных таблиц. Я не удаляю повторяющиеся строки, но можно изменить строку обновления на строку удаления.

Declare @Fecha Date, @Liquidacion Int, @IdPersonal Int;
DECLARE CN CURSOR FOR
SELECT Fecha, Liquidacion, IdPersonal FROM Personal_tarjas
Where IdPersonal = 9
GROUP BY Fecha, Liquidacion, IdPersonal
HAVING count(*) > 1 And IdPersonal <> 0
OPEN CN;
    FETCH NEXT FROM CN Into @Fecha, @Liquidacion, @IdPersonal;
WHILE @@FETCH_STATUS = 0
  Begin
    WHILE (Select Count(*) From Personal_tarjas Where Fecha = @Fecha And 
Liquidacion = @Liquidacion And IdPersonal = @IdPersonal AND IdPersonal = 9) > 1
    BEGIN
        Update Top(1) Personal_tarjas Set IdPersonal = 0 Where Fecha = @Fecha 
And Liquidacion = @Liquidacion And IdPersonal = @IdPersonal AND IdPersonal = 9;
        If (Select Count(*) From Personal_tarjas Where Fecha = @Fecha And 
Liquidacion = @Liquidacion And IdPersonal = @IdPersonal AND IdPersonal = 9) <= 1
            BREAK;
        Else
            CONTINUE;
    END;
    FETCH NEXT FROM CN Into @Fecha, @Liquidacion, @IdPersonal;
  End
  CLOSE CN;
  DEALLOCATE CN;

Я надеюсь, что это служит вам. Хуан Карлос

Danilator Filewalker · Answer 5 · 2020-08-12T12:02:24+08:00

        SELECT ROW_NUMBER() OVER (PARTITION BY A.[ID],A.[NRO_SS] ORDER BY A.[ID],A.[NRO_SS] ) AS POS,*
        INTO #DM_TdeInterFallasDrive FROM [dbImport].[dbo].[DM_TdeInterFallasDrive] A

        DELETE FROM #DM_TdeInterFallasDrive WHERE POS > 1

        DROP TABLE [dbImport].[dbo].[DM_TdeInterFallasDrive]
        
        SELECT * INTO [dbImport].[dbo].[DM_TdeInterFallasDrive] FROM #DM_TdeInterFallasDrive

        DROP TABLE #DM_TdeInterFallasDrive

        ALTER TABLE [dbImport].[dbo].[DM_TdeInterFallasDrive]
        DROP COLUMN POS
    
        SELECT * FROM [dbImport].[dbo].[DM_TdeInterFallasDrive]

Как удалить повторяющиеся строки?

HTML button that sends you to another page

Why do I get the error "Call to undefined function mysql_connect()"?

How to create an HTML button that works as a link?

How to separate a String in Java. How to use split()

Filter by dates in sql server

How to limit the number of decimal places in a double?

For each in JavaScript?

Position footer ALWAYS glued to the footer

Definitive Guide to Type Conversion in Java

How to properly compare Strings (and objects) in Java?