중첩 집계 함수 활용한 데이터 분석 연습문제

데이터 분석은 실제 데이터를 가지고 문제를 해결하는 과정입니다. 중첩 집계 함수는 SQL에서 데이터를 다양한 기준으로 그룹화하고 분석하는 데에 유용한 도구입니다. 이번 연습문제에서는 중첩 집계 함수를 사용하여 데이터를 분석하는 과정을 연습해보겠습니다.

문제 설명

주어진 데이터는 어떤 회사의 판매 데이터입니다. 데이터에는 오늘 판매된 제품에 대한 정보가 포함되어 있습니다. 데이터는 다음과 같은 열로 구성되어 있습니다:

아래의 문제를 풀기 위해 데이터를 사용해보겠습니다.

문제

1) 어떤 날짜에 가장 많이 판매된 제품은 무엇인가요?

2) 제품별로 월 평균 판매량은 어떻게 되나요?

문제 해결 방법

위의 문제를 해결하기 위해 다음의 SQL 쿼리를 사용할 수 있습니다.

1) 어떤 날짜에 가장 많이 판매된 제품은 무엇인가요?

   SELECT Date, Product, SUM(Quantity) AS TotalQuantity
   FROM sales_data
   GROUP BY Date, Product
   ORDER BY TotalQuantity DESC
   LIMIT 1;

이 쿼리는 Date와 Product 열을 기준으로 데이터를 그룹화하고, 각 그룹별로 수량을 합산하여 총 판매량을 계산합니다. 그리고 TotalQuantity를 기준으로 내림차순으로 정렬한 후, 가장 많이 판매된 제품을 찾기 위해 LIMIT을 사용합니다.

2) 제품별로 월 평균 판매량은 어떻게 되나요?

   SELECT EXTRACT(MONTH FROM Date) AS Month, Product, AVG(Quantity) AS AverageQuantity
   FROM sales_data
   GROUP BY Month, Product;

이 쿼리는 날짜에서 월을 추출하여 Month 열을 생성하고, Date와 Product 열을 기준으로 데이터를 그룹화합니다. 그리고 각 그룹별로 수량의 평균을 계산하여 평균 판매량을 구합니다.

결과 확인

위의 쿼리를 데이터베이스에서 실행하여 결과를 확인할 수 있습니다. 데이터베이스의 종류에 따라 문법이 조금씩 다를 수 있으니 주의해야 합니다. 데이터 분석을 위한 데이터베이스 도구를 사용한다면, 도구의 쿼리 실행 환경에서 위의 쿼리를 실행하고 결과를 확인할 수 있습니다.

위의 문제는 중첩 집계 함수를 사용하여 데이터를 분석하는 기본적인 연습문제입니다. 실제 데이터 분석에서는 이보다 훨씬 복잡한 질문과 데이터를 다루게 될 것입니다. 중첩 집계 함수를 활용하여 데이터를 다양한 기준으로 분석하는 방법을 익히는 것은 데이터 분석을 위한 필수적인 능력입니다.

Happy coding! 😊

참고 자료

#데이터분석 #SQL