[java] 자바로 카프카 스케일 아웃 처리하기

카프카(Kafka)는 대용량의 데이터를 신속하게 처리하기 위한 분산 메시지 큐 시스템입니다. 이러한 카프카를 확장하여 더 많은 트래픽을 처리하고자 할 때, 스케일 아웃(scale out) 처리를 수행해야 합니다.

자바(Java)는 카프카와 호환되는 언어이므로, 자바로 카프카 스케일 아웃 처리를 수행할 수 있습니다.

1. 프로듀서(Producer) 개수 증가

카프카는 프로듀서와 컨슈머(Consumer) 간의 병렬 처리를 지원합니다. 따라서 스케일 아웃을 위해 프로듀서의 개수를 증가시킬 수 있습니다.

아래의 코드는 자바로 작성된 간단한 카프카 프로듀서 예제입니다.

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;

import java.util.Properties;

public class KafkaProducerExample {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        KafkaProducer<String, String> producer = new KafkaProducer<>(props);

        try {
            for (int i = 0; i < 10; i++) {
                String message = "Message " + i;
                producer.send(new ProducerRecord<>("my-topic", message));
                System.out.println("Sent message: " + message);
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            producer.close();
        }
    }
}

프로듀서를 여러 개 띄워서 실행하면, 더 많은 메시지를 동시에 카프카로 보낼 수 있습니다.

2. 컨슈머(Consumer) 그룹 구성

카프카는 컨슈머 그룹(Consumer Group)을 통해 여러 컨슈머가 동시에 메시지를 처리할 수 있습니다. 따라서 스케일 아웃을 위해 컨슈머 그룹을 구성할 수 있습니다.

아래의 코드는 자바로 작성된 간단한 카프카 컨슈머(컨슈머 그룹) 예제입니다.

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.util.Collections;
import java.util.Properties;

public class KafkaConsumerExample {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "my-consumer-group");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Collections.singleton("my-topic"));

        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(100);
                for (ConsumerRecord<String, String> record : records) {
                    System.out.println("Received message: " + record.value());
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            consumer.close();
        }
    }
}

컨슈머를 여러 개 띄워서 실행하면, 더 많은 메시지를 동시에 처리할 수 있습니다. 컨슈머 그룹 내에서 메시지를 분산하여 처리합니다.

결론

카프카를 자바로 스케일 아웃 처리하기 위해 프로듀서 개수를 증가시키고, 컨슈머 그룹을 구성할 수 있습니다. 이를테면, 프로듀서와 컨슈머를 여러 대의 서버에 분산해서 배치하여 높은 처리량을 구현할 수 있습니다.