Агрегатные функции

ClickHouse поддерживает все стандартные агрегатные функции SQL (sum, avg, min, max, count), а также широкий набор других агрегатных функций.

Страница	Описание
aggThrow	Эта функция может использоваться для тестирования безопасности работы с исключениями. При создании она будет выбрасывать исключение с указанной вероятностью.
analysisOfVariance	Предоставляет статистический критерий однофакторного дисперсионного анализа (критерий ANOVA). Используется для нескольких групп нормально распределённых наблюдений, чтобы определить, одинаковы ли их средние значения.
any	Возвращает первое встретившееся значение столбца.
anyHeavy	Выбирает часто встречающееся значение с помощью алгоритма «heavy hitters». Если существует значение, которое в каждом потоке выполнения запроса встречается более чем в половине случаев, возвращается именно оно. Как правило, результат недетерминирован.
anyLast	Выбирает последнее встреченное значение в столбце.
approx_top_k	Возвращает массив приблизительно наиболее частых значений и количества их вхождений в указанном столбце.
approx_top_sum	Возвращает массив приблизительно наиболее частых значений и количества их вхождений в указанном столбце.
argMax	Вычисляет значение `arg`, соответствующее максимальному значению `val`.
argMin	Вычисляет значение `arg`, соответствующее минимальному значению `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то, какое именно из соответствующих значений `arg` будет возвращено, не определено.
groupArrayArray	Объединяет массивы в один массив массивов.
argAndMax	Вычисляет значения `arg` и `val` для максимального значения `val`. Если существует несколько строк с одинаковым максимальным значением `val`, то какие именно из соответствующих значений `arg` и `val` будут возвращены, не гарантируется.
argAndMin	Вычисляет значения `arg` и `val` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то какие именно из соответствующих значений `arg` и `val` будут возвращены, не определено.
avg	Вычисляет среднее арифметическое.
avgWeighted	Вычисляет взвешенное арифметическое среднее.
boundingRatio	Агрегатная функция, вычисляющая наклон между крайней левой и крайней правой точками в группе значений.
categoricalInformationValue	Вычисляет значение `(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0)))` для каждой категории.
contingency	Функция `contingency` вычисляет коэффициент сопряжённости — значение, которое измеряет степень связи между двумя столбцами в таблице. Вычисление аналогично функции `cramersV`, но использует другой знаменатель в подкоренном выражении.
corr	Вычисляет коэффициент корреляции Пирсона.
corrMatrix	Вычисляет матрицу корреляции для N переменных.
corrStable	Вычисляет коэффициент корреляции Пирсона, но использует численно устойчивый алгоритм.
count	Считает количество строк или значений, отличных от NULL.
covarPop	Вычисляет ковариацию генеральной совокупности
covarPopMatrix	Возвращает матрицу ковариаций генеральной совокупности для N переменных.
covarPopStable	Вычисляет ковариацию по генеральной совокупности
covarSamp	Вычисляет значение выражения `Σ((x - x̅)(y - y̅)) / (n - 1)`
covarSampMatrix	Возвращает матрицу выборочной ковариации для N переменных.
covarSampStable	Аналогична `covarSamp`, работает медленнее, но обеспечивает меньшую вычислительную погрешность.
cramersV	Результат функции `cramersV` лежит в диапазоне от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только в том случае, если каждое из значений полностью определяется другим. Эту величину можно рассматривать как меру связи между двумя переменными, выраженную в процентах от их максимально возможной вариации.
cramersVBiasCorrected	Вычисляет V Крамера с поправкой на смещение.
deltaSum	Суммирует арифметические разности между последовательными строками.
deltaSumTimestamp	Складывает разности между соседними строками. Отрицательные разности игнорируются.
entropy	Вычисляет энтропию Шеннона для столбца значений.
estimateCompressionRatio	Оценивает коэффициент сжатия для заданного столбца без его фактического сжатия.
exponentialMovingAverage	Вычисляет экспоненциальное скользящее среднее значений на заданном интервале времени.
exponentialTimeDecayedAvg	Возвращает экспоненциально сглаженное взвешенное скользящее среднее значений временного ряда в момент времени `t`.
exponentialTimeDecayedCount	Возвращает накопленное экспоненциальное затухание временного ряда в момент времени с индексом `t`.
exponentialTimeDecayedMax	Возвращает максимум из значений вычисленного экспоненциально сглаженного скользящего среднего в моменты времени с индексами `t` и `t-1`.
exponentialTimeDecayedSum	Возвращает сумму значений экспоненциально сглаженного скользящего среднего временного ряда в момент времени `t`.
first_value	Это псевдоним для any, но он был добавлен для совместимости с Window Functions, где иногда требуется обрабатывать значения `NULL` (по умолчанию все агрегатные функции ClickHouse игнорируют значения `NULL`).
flameGraph	Агрегатная функция, строящая флеймграф по списку трассировок стека.
groupArray	Создаёт массив значений аргументов. Значения могут добавляться в массив в произвольном (неопределённом) порядке.
groupArrayInsertAt	Вставляет значение в массив в указанную позицию.
groupArrayIntersect	Возвращает пересечение заданных массивов (все элементы массивов, которые присутствуют во всех заданных массивах).
groupArrayLast	Создаёт массив значений последнего аргумента.
groupArrayMovingAvg	Вычисляет скользящее среднее входных значений.
groupArrayMovingSum	Вычисляет скользящую сумму для входных значений.
groupArraySample	Создает массив выборочных значений аргумента. Размер результирующего массива ограничен `max_size` элементами. Значения аргумента случайным образом выбираются и добавляются в массив.
timeSeriesGroupArray	Сортирует временные ряды по метке времени в порядке возрастания.
groupArraySorted	Возвращает массив из первых N элементов в порядке возрастания.
groupBitAnd	Применяет побитовую операцию `AND` к последовательности чисел.
groupBitmap	Выполняет bitmap- или агрегатные вычисления по беззнаковому целочисленному столбцу, возвращает кардинальность множества в виде значения типа UInt64; при добавлении суффикса -State возвращает bitmap-объект
groupBitmapAnd	Вычисляет логическое И по битмап-столбцу и возвращает кардинальность типа UInt64; при добавлении суффикса -State возвращает объект битмапа.
groupBitmapOr	Выполняет побитовую операцию OR над bitmap-столбцом, возвращает кардинальность множества в виде значения типа UInt64; если добавить суффикс -State, то возвращает bitmap-объект. Эквивалентна функции `groupBitmapMerge`.
groupBitmapXor	Вычисляет XOR по битмап-столбцу и возвращает кардинальность типа UInt64; при использовании с суффиксом -State возвращает объект битмапа
groupBitOr	Применяет побитовую операцию `OR` к последовательности чисел.
groupBitXor	Применяет побитовую операцию `XOR` к последовательности чисел.
groupUniqArray	Создаёт массив из различных значений аргументов.
intervalLengthSum	Вычисляет общую длину объединения всех интервалов (отрезков на числовой оси).
kolmogorovSmirnovTest	Применяет критерий Колмогорова–Смирнова к выборкам из двух генеральных совокупностей.
kurtPop	Вычисляет эксцесс для последовательности.
kurtSamp	Вычисляет выборочный эксцесс для последовательности.
largestTriangleThreeBuckets	Применяет алгоритм Largest-Triangle-Three-Buckets к входным данным.
last_value	Выбирает последнее встретившееся значение, аналогично `anyLast`, но может принимать значение NULL.
mannWhitneyUTest	Применяет ранговый критерий Манна — Уитни к выборкам из двух генеральных совокупностей.
max	Агрегатная функция, вычисляющая максимум по группе значений.
maxIntersections	Агрегатная функция, вычисляющая максимальное количество пересечений в группе интервалов (при условии, что все интервалы хотя бы раз пересекаются друг с другом).
maxIntersectionsPosition	Агрегатная функция, вычисляющая позиции, в которых достигается результат функции maxIntersections.
maxMap	Вычисляет максимальное значение из массива `value` по ключам, указанным в массиве `key`.
meanZTest	Применяет z‑критерий к выборкам из двух генеральных совокупностей для сравнения их средних.
median	Функции `median` представляют собой псевдонимы соответствующих функций `quantile`. Они вычисляют медиану числовой выборки.
min	Агрегатная функция, вычисляющая минимум по группе значений.
minMap	Вычисляет минимальное значение в массиве `value` по ключам, указанным в массиве `key`.
quantile	Вычисляет приближённый квантиль последовательности числовых данных.
quantileBFloat16	Вычисляет приближённый квантиль выборки чисел типа bfloat16.
quantileDD	Вычисляет приближённый квантиль выборки с гарантированной относительной погрешностью.
quantileDeterministic	Вычисляет приближённый квантиль последовательности числовых данных.
Функции quantileExact	Функции quantileExact, quantileExactLow, quantileExactHigh, quantileExactExclusive, quantileExactInclusive
quantileExactWeighted	Точно вычисляет квантиль последовательности числовых данных с учётом веса каждого значения.
quantileGK	Вычисляет квантиль числовой последовательности данных с использованием алгоритма Гринвальда — Ханны (Greenwald-Khanna).
quantileExactWeightedInterpolated	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
quantileInterpolatedWeighted	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
Функции quantiles	quantiles, quantilesExactExclusive, quantilesExactInclusive, quantilesGK
quantileTDigest	Вычисляет приближённый квантиль последовательности числовых данных с помощью алгоритма t-digest.
quantileTDigestWeighted	Вычисляет приближённый квантиль последовательности числовых данных с помощью алгоритма t-digest.
quantileTiming	Вычисляет квантиль числовой последовательности данных с заданной точностью.
quantileTimingWeighted	С заданной точностью вычисляет квантиль числовой последовательности с учётом веса каждого её элемента.
rankCorr	Вычисляет коэффициент ранговой корреляции.
simpleLinearRegression	Выполняет простую (одномерную) линейную регрессию.
singleValueOrNull	Агрегатная функция `singleValueOrNull` используется для реализации операторов с подзапросами, таких как `x = ALL (SELECT ...)`. Она проверяет, есть ли в данных ровно одно уникальное значение, отличное от NULL.
skewPop	Вычисляет коэффициент асимметрии последовательности.
skewSamp	Вычисляет выборочный коэффициент асимметрии для последовательности.
sparkbar	Функция строит гистограмму частот значений `x` с частотой их повторения `y` на интервале `[min_x, max_x]`.
stddevPop	Результат равен квадратному корню из varPop.
stddevPopStable	Результат равен квадратному корню из varPop. В отличие от stddevPop, эта функция использует численно устойчивый алгоритм.
stddevSamp	Результат равен квадратному корню из varSamp
stddevSampStable	Результат равен квадратному корню из varSamp. В отличие от stddevSamp, эта функция использует численно устойчивый алгоритм.
stochasticLinearRegression	Эта функция реализует стохастическую линейную регрессию. Она поддерживает пользовательские параметры для скорости обучения, коэффициента L2-регуляризации, размера мини-батча и несколько методов обновления весов (Adam, простой SGD, Momentum, Nesterov).
stochasticLogisticRegression	Эта функция реализует стохастическую логистическую регрессию. Она может использоваться для задач бинарной классификации, поддерживает те же настраиваемые параметры, что и stochasticLinearRegression, и работает аналогичным образом.
studentTTest	Применяет t-критерий Стьюдента к выборкам из двух генеральных совокупностей.
sum	Вычисляет сумму. Работает только с числами.
studentTTestOneSample	Применяет одновыборочный t-критерий Стьюдента к выборке и известному среднему значению генеральной совокупности.
sumCount	Вычисляет сумму чисел и одновременно считает количество строк. Функция используется оптимизатором запросов ClickHouse: если в запросе присутствует несколько функций `sum`, `count` или `avg`, их можно заменить одной функцией `sumCount`, чтобы повторно использовать результаты вычислений. Эту функцию редко требуется вызывать явно.
sumKahan	Вычисляет сумму чисел с использованием алгоритма компенсированного суммирования Кахана
sumMap	Суммирует один или несколько массивов `value` в соответствии с ключами из массива `key`. Возвращает кортеж массивов: ключи в отсортированном порядке, далее значения, просуммированные для соответствующих ключей без переполнения.
sumMapWithOverflow	Суммирует массив `value` в соответствии с ключами, указанными в массиве `key`. Возвращает кортеж из двух массивов: ключи в отсортированном порядке и значения, просуммированные для соответствующих ключей. Отличается от функции sumMap тем, что выполняет суммирование с переполнением.
sumWithOverflow	Вычисляет сумму чисел, используя для результата тот же тип данных, что и для входных параметров. Если сумма превышает максимальное значение для этого типа данных, она вычисляется с переполнением.
theilsU	Функция `theilsU` вычисляет коэффициент неопределённости U Тейла — величину, измеряющую степень связи между двумя столбцами в таблице.
topK	Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце. Полученный массив упорядочен по убыванию их приблизительной частоты (а не по самим значениям).
topKWeighted	Возвращает массив примерно наиболее часто встречающихся значений в указанном столбце. Полученный массив отсортирован по убыванию примерной частоты значений (а не по самим значениям). При этом учитывается вес значения.
uniq	Вычисляет примерное количество уникальных значений аргумента.
uniqCombined	Вычисляет приблизительное число различных значений аргумента.
uniqCombined64	Вычисляет приблизительное количество различных значений аргумента. Аналогична uniqCombined, но использует 64-битный хэш для всех типов данных, а не только для String.
uniqExact	Вычисляет точное количество различных значений аргумента.
uniqHLL12	Вычисляет приблизительное количество различных значений аргумента с использованием алгоритма HyperLogLog.
uniqTheta	Вычисляет приблизительное количество различных значений аргумента с использованием фреймворка Theta Sketch.
varPop	Вычисляет генеральную дисперсию.
varPopStable	Возвращает генеральную дисперсию. В отличие от varPop, эта функция использует численно устойчивый алгоритм. Она работает медленнее, но даёт меньшую вычислительную погрешность.
varSamp	Вычисляет выборочную дисперсию набора данных.
varSampStable	Вычисляет выборочную дисперсию набора данных. В отличие от `varSamp`, эта функция использует численно устойчивый алгоритм. Работает медленнее, но обеспечивает меньшую вычислительную погрешность.
welchTTest	Применяет t‑критерий Уэлча к выборкам из двух генеральных совокупностей.
distinctDynamicTypes	Вычисляет список уникальных типов данных, хранящихся в столбце Dynamic.
distinctJSONPaths	Вычисляет список уникальных путей, хранящихся в JSON-столбце.
timeSeriesDeltaToGrid	Агрегатная функция, вычисляющая PromQL‑подобную дельту по данным временных рядов на заданной временной сетке.
timeSeriesInstantDeltaToGrid	Агрегатная функция, вычисляющая PromQL‑подобный idelta для данных временных рядов на заданной временной сетке.
timeSeriesInstantRateToGrid	Агрегатная функция, вычисляющая PromQL‑подобный irate для данных временных рядов на заданной сетке.
timeSeriesLastTwoSamples	Агрегатная функция для ресемплирования данных временных рядов при вычислении PromQL‑подобных irate и idelta
timeSeriesRateToGrid	Агрегатная функция, вычисляющая PromQL‑подобный rate для данных временных рядов на заданной временной сетке.
timeSeriesResampleToGridWithStaleness	Агрегатная функция для ресемплирования данных временных рядов по заданной временной сетке.
timeSeriesDerivToGrid	Агрегатная функция, вычисляющая PromQL‑подобную производную по данным временных рядов на заданной временной сетке.
timeSeriesPredictLinearToGrid	Агрегатная функция, вычисляющая PromQL‑подобный линейный прогноз для данных временных рядов на заданной сетке.
timeSeriesChangesToGrid	Агрегатная функция, вычисляющая изменения по данным временных рядов в стиле PromQL на заданной временной сетке.
timeSeriesResetsToGrid	Агрегатная функция, вычисляющая сбросы в стиле PromQL по данным временных рядов на заданной временной сетке.
groupConcat	Вычисляет строку, полученную путём конкатенации группы строк, с необязательным разделителем и/или ограничением на максимальное число элементов.
quantilePrometheusHistogram	Вычисляет квантиль по гистограмме с помощью линейной интерполяции.