데이터 분석은 실제 데이터를 가지고 문제를 해결하는 과정입니다. 중첩 집계 함수는 SQL에서 데이터를 다양한 기준으로 그룹화하고 분석하는 데에 유용한 도구입니다. 이번 연습문제에서는 중첩 집계 함수를 사용하여 데이터를 분석하는 과정을 연습해보겠습니다.
문제 설명
주어진 데이터는 어떤 회사의 판매 데이터입니다. 데이터에는 오늘 판매된 제품에 대한 정보가 포함되어 있습니다. 데이터는 다음과 같은 열로 구성되어 있습니다:
- 날짜(Date): 판매된 날짜
- 제품(Product): 판매된 제품의 이름
- 수량(Quantity): 판매된 제품의 수량
아래의 문제를 풀기 위해 데이터를 사용해보겠습니다.
문제
1) 어떤 날짜에 가장 많이 판매된 제품은 무엇인가요?
2) 제품별로 월 평균 판매량은 어떻게 되나요?
문제 해결 방법
위의 문제를 해결하기 위해 다음의 SQL 쿼리를 사용할 수 있습니다.
1) 어떤 날짜에 가장 많이 판매된 제품은 무엇인가요?
SELECT Date, Product, SUM(Quantity) AS TotalQuantity
FROM sales_data
GROUP BY Date, Product
ORDER BY TotalQuantity DESC
LIMIT 1;
이 쿼리는 Date와 Product 열을 기준으로 데이터를 그룹화하고, 각 그룹별로 수량을 합산하여 총 판매량을 계산합니다. 그리고 TotalQuantity를 기준으로 내림차순으로 정렬한 후, 가장 많이 판매된 제품을 찾기 위해 LIMIT을 사용합니다.
2) 제품별로 월 평균 판매량은 어떻게 되나요?
SELECT EXTRACT(MONTH FROM Date) AS Month, Product, AVG(Quantity) AS AverageQuantity
FROM sales_data
GROUP BY Month, Product;
이 쿼리는 날짜에서 월을 추출하여 Month 열을 생성하고, Date와 Product 열을 기준으로 데이터를 그룹화합니다. 그리고 각 그룹별로 수량의 평균을 계산하여 평균 판매량을 구합니다.
결과 확인
위의 쿼리를 데이터베이스에서 실행하여 결과를 확인할 수 있습니다. 데이터베이스의 종류에 따라 문법이 조금씩 다를 수 있으니 주의해야 합니다. 데이터 분석을 위한 데이터베이스 도구를 사용한다면, 도구의 쿼리 실행 환경에서 위의 쿼리를 실행하고 결과를 확인할 수 있습니다.
위의 문제는 중첩 집계 함수를 사용하여 데이터를 분석하는 기본적인 연습문제입니다. 실제 데이터 분석에서는 이보다 훨씬 복잡한 질문과 데이터를 다루게 될 것입니다. 중첩 집계 함수를 활용하여 데이터를 다양한 기준으로 분석하는 방법을 익히는 것은 데이터 분석을 위한 필수적인 능력입니다.
Happy coding! 😊
참고 자료
- SQL 중첩 집계 함수에 대한 자세한 내용은 링크를 참고하세요.
- SQL 문법 및 예제에 대해 더 자세히 알고 싶다면 SQL Tutorial을 참고하세요.
#데이터분석 #SQL