[sql] 샤딩 알고리즘

15 Dec 2023

이번 포스트에서는 SQL 데이터베이스에서 샤딩을 구현하기 위한 알고리즘에 대해 살펴보겠습니다.

샤딩(Sharding)이란?

샤딩은 대규모 데이터베이스를 여러 서버에 분산하여 저장하는 데이터베이스 분할 기술입니다. 이를 통해 데이터베이스의 성능과 확장성을 향상시킬 수 있습니다.

샤딩 알고리즘

해시 샤딩 (Hash Sharding)

해시 샤딩은 데이터를 해싱하여 특정 범위에 대해 특정 서버에 할당하는 방식입니다. 예를 들어, 데이터의 해시값을 계산한 후 그 값에 따라 여러 서버 중 하나를 선택하여 데이터를 저장합니다.

해시 샤딩은 데이터가 균등하게 분산되어 저장되지만, 범위 기반 쿼리가 어려울 수 있습니다. 또한, 서버가 추가되거나 삭제될 때 해시 함수를 재조정해야 할 수도 있습니다.

범위 샤딩 (Range Sharding)

범위 샤딩은 데이터의 특정 범위에 따라 서버에 할당하는 방식입니다. 예를 들어, 날짜나 알파벳 등의 범위에 따라 데이터를 여러 서버에 나누어 저장합니다.

범위 샤딩은 범위 기반 쿼리에 유리하지만, 데이터의 불균형 문제가 있을 수 있습니다.

결론

샤딩 알고리즘을 선택할 때는 데이터의 특성과 확장성을 고려하여 적절한 알고리즘을 선택해야 합니다. 해시 샤딩은 데이터가 균등하게 분산되지만, 범위 기반 쿼리가 어렵습니다. 범위 샤딩은 범위 기반 쿼리에 유리하지만, 데이터의 불균형 문제가 있을 수 있습니다.

참고 자료: https://medium.com/@hopetambala/sharding-algorithms-for-databases-7126d7424ea2