[sql] INTERSECT 연산자를 사용한 두 개 이상의 데이터베이스 간의 공통 데이터 개수 계산 방법

07 Dec 2023

여러 개의 데이터베이스 간에 공통된 레코드를 찾고 싶은 경우, SQL의 INTERSECT 연산자를 사용할 수 있습니다. 이 연산자는 두 개 이상의 SELECT 문 결과에서 공통된 레코드만을 반환하는 역할을 합니다.

먼저, 간단한 예제를 살펴보겠습니다. 아래는 두 개의 테이블, table1과 table2,이 있는 경우의 INTERSECT 연산자 사용 방법입니다.

SELECT column1, column2, ...
FROM table1
INTERSECT
SELECT column1, column2, ...
FROM table2;

위의 쿼리는 table1과 table2에서 공통된 레코드만을 반환합니다. column1, column2 등은 공통 데이터의 컬럼을 나타내며, ...은 나머지 컬럼을 나타냅니다. 반환된 결과는 두 테이블에서 공통으로 존재하는 레코드들입니다.

이제, 더욱 일반적인 경우를 살펴보겠습니다. 삽입하려는 데이터를 가지고 있는 여러 개의 데이터베이스가 있는 경우, INTERSECT 연산자를 사용하여 공통된 데이터 개수를 계산하는 방법은 다음과 같습니다.

SELECT COUNT(*)
FROM (
    SELECT column1, column2, ...
    FROM database1.table
    INTERSECT
    SELECT column1, column2, ...
    FROM database2.table
    INTERSECT
    ...
    SELECT column1, column2, ...
    FROM databaseN.table
) AS common_data;

위의 쿼리는 여러 개의 데이터베이스에서 공통된 레코드의 개수를 계산합니다. COUNT(*) 함수는 공통 데이터의 개수를 반환하며, ...은 각 데이터베이스의 컬럼들을 나타냅니다. 여러 개의 INTERSECT 절을 사용하여 각 데이터베이스의 테이블에서 공통 데이터를 찾습니다. 마지막으로, 이 결과를 서브쿼리로 래핑하여 common_data라는 이름으로 반환합니다.

이렇게 하면 여러 개의 데이터베이스에서 공통된 데이터 개수를 계산할 수 있습니다. 필요에 따라 쿼리를 수정하여 특정 조건에 맞는 데이터를 찾을 수도 있습니다.

참고: INTERSECT 연산자는 모든 SELECT 문의 결과에 중복된 레코드가 없다고 가정합니다. 따라서 중복된 레코드가 있는 경우, UNION 연산자를 사용하여 중복을 제거한 후 INTERSECT 연산을 수행해야 합니다.

참고 문서: PostgreSQL Documentation - SELECT