[sql] 집계 함수를 사용한 데이터 분할

15 Dec 2023

데이터베이스에서 집계 함수는 데이터의 요약 정보를 제공하므로 데이터를 효율적으로 분석할 수 있습니다. 특정 기준에 따라 데이터를 그룹으로 묶고, 그룹 단위로 결과를 계산할 수 있습니다. 이번 글에서는 SQL의 집계 함수를 활용하여 데이터를 분할하는 방법을 살펴보겠습니다.

GROUP BY 절을 사용한 데이터 그룹화

GROUP BY 절은 데이터를 특정 열을 기준으로 그룹화할 때 사용합니다. 예를 들어, 주문 테이블에서 고객별 주문 금액의 합계를 구하고 싶다면, 아래와 같은 SQL 문을 사용할 수 있습니다.

SELECT customer_id, SUM(order_amount) as total_order_amount
FROM orders
GROUP BY customer_id;

위의 SQL 문은 주문 테이블을 고객별로 그룹화하고, 각 그룹별 주문 금액의 합계를 계산합니다.

HAVING 절을 사용한 그룹 필터링

HAVING 절은 GROUP BY로 묶은 결과에 조건을 적용하여 원하는 그룹만을 필터링 할 때 사용됩니다. 예를 들어, 주문 테이블에서 100건 이상의 주문을 한 고객들만 조회하고 싶다면, 아래와 같은 SQL 문을 사용할 수 있습니다.

SELECT customer_id, COUNT(*) as order_count
FROM orders
GROUP BY customer_id
HAVING order_count >= 100;

위의 SQL 문은 주문량이 100건 이상인 고객들의 데이터를 조회합니다.

이와 같이 GROUP BY와 HAVING 절을 결합하여 데이터를 그룹화하고 원하는 그룹을 필터링 할 수 있습니다. 집계 함수를 활용하면 데이터를 효과적으로 분할하여 원하는 정보를 얻을 수 있습니다.

이상으로 집계 함수를 사용하여 데이터를 분할하는 방법에 대해 알아보았습니다. 추가적인 정보가 필요하시다면 SQL 집계 함수 도큐먼트를 참고해보세요.