What is a promise in Javascript?

Question

Asked: 2020-01-21 12:15:26 +0800 CST 2020-01-21 12:15:26 +0800 CST 2020-01-21 12:15:26 +0800 CST

Разница в производительности при запросе с помощью SELECT DISTINCT и GROUP BY?

772

Я просматриваю и изучаю SQL, я замечаю кое-что, что кажется мне любопытным.

Предположим, у меня есть таблица с именем, productosи одно из ее полей равно categoria, при выполнении следующих запросов я вижу, что результат тот же:

SELECT DISTINCT categoria FROM productos;

Д

SELECT categoria FROM productos GROUP BY categoria;

Разница, которую я замечаю, заключается в том, что у DISTINCTменя он фильтрует дубликаты и соблюдает порядок их появления, а в предложении, которое он использует, он GROUP BYупорядочивает их в алфавитном порядке. Исходя из этого, можно сказать, что первый оператор выполняется быстрее. Если да, то будет ли разница в производительности значительной при обработке больших объемов данных?

5 Answers

Voted

Leandro Tuttini · Answer 1 · 2020-01-21T12:36:29+08:00

Хотя очевидно, что оба метода дают один и тот же конечный результат, не все из них можно рассматривать как пригодные для достижения желаемого результата.

Принимая во внимание сделанное вами предложение, правильно было бы использовать DISTINCT, поскольку оно применяется к строке, вместо этого GROUP BYбыло создано для работы с такими агрегатами, как SUM(), MAX(), AVG()и т. д.

Вопрос порядка не будет проблемой, потому что можно ORDER BYбудет разрешить разногласие.

В этих ссылках, хотя они и на английском языке, поднимался тот же вопрос:

Luis Suarez · Answer 2 · 2020-01-21T12:28:02+08:00

GROUP BYИспользуется больше для операций типа: count, sum, и т.п.

В зависимости от количества записей в таблице (речь идет о миллионах записей) select(будь то с distinctили с group by) займет более или менее одинаковое время

Если дело в том, что таблица содержит миллионы записей (100, 200, 500), иногда лучше всего извлечь данные, которые вы хотите сгруппировать, во временную таблицу ( select ... insert) и во временной таблице выполнить команду distinctили команду group by. Время запроса значительно быстрее.

Juan Ruiz de Castilla · Answer 3 · 2020-01-22T12:42:09+08:00

В дополнение к тому, что комментирует Леандро, и как точный перевод одного из ответов в ссылке, которую он сам прикрепляет, ответ зависит от движка, но вы можете иметь область действия этих двух движков базы данных:

РПТА:

Нет никакой разницы (по крайней мере, в SQL Server). Оба запроса используют один и тот же план выполнения.

http://sqlmag.com/database-performance-tuning/distinct-vs-group

Возможно, есть разница, если задействованы подзапросы:

http://blog.sqlauthority.com/2007/03/29/sql-server-difference-between-distinct-and-group-by-distinct-vs-group-by/

Без разницы (в стиле Oracle):

http://asktom.oracle.com/pls/asktom/f?p=100:11:0::::P11_QUESTION_ID:32961403234212

оригинальный ответ

Jairo1010 · Answer 4 · 2020-01-21T12:35:08+08:00

Функция DISTINCTудаляет дубликаты записей, функция GROUP BYреализована для группировки записей.

Функция DISTINCTвыполняется следующим образом:

Скопируйте все business_keyзначения во временную таблицу
Отсортировать временную таблицу
Разбирает временную таблицу, возвращая каждый элемент, отличный от предыдущего

Функция GROUP BYвыполняется как:

Поиск по всей таблице, сохранение каждого business_keyвhashtable
Вернуть ключи кhashtable

Первый оптимизирует память, а второй оптимизирует скорость, но требует большого объема памяти в зависимости от количества ключей.

Привет.

AzidRain · Answer 5 · 2020-01-21T12:23:07+08:00

Первый вариант просто фильтрует строки по мере их нахождения, но для получения результата необходимо просмотреть их все. Когда вы используете group byпервичный возвращаемый результат, он повторно обрабатывается для сортировки в соответствии со значением группировки, в вашем случае, по «категории». Без использования индексов первый вариант быстрее. Однако, если вы поместите индекс в поле «категория», запрос group byбудет почти таким же быстрым. Имейте в виду, что каждая альтернатива используется в соответствии с нужным вам результатом.

Разница в производительности при запросе с помощью SELECT DISTINCT и GROUP BY?

HTML button that sends you to another page

Why do I get the error "Call to undefined function mysql_connect()"?

How to create an HTML button that works as a link?

How to separate a String in Java. How to use split()

Filter by dates in sql server

How to limit the number of decimal places in a double?

For each in JavaScript?

Position footer ALWAYS glued to the footer

Definitive Guide to Type Conversion in Java

How to properly compare Strings (and objects) in Java?