[java] Kafka Streams 애플리케이션의 테스트와 디버깅 방법

16 Nov 2023

java

Kafka Streams는 대용량 실시간 스트리밍 데이터 처리를 위한 분산 프레임워크로, 안정적이고 확장 가능한 애플리케이션을 개발할 수 있게 해줍니다. 하지만 Kafka Streams 애플리케이션을 테스트하고 디버깅하는 것은 조금 복잡할 수 있습니다. 이번 블로그에서는 Kafka Streams 애플리케이션을 테스트하고 디버깅하는 방법에 대해 알아보겠습니다.

1. 단위 테스트 작성하기

Kafka Streams 애플리케이션을 테스트하기 위해 먼저 단위 테스트를 작성해야 합니다. 단위 테스트는 개별 컴포넌트의 동작을 확인하는 것을 목표로 합니다.

예를 들어, Kafka Streams 애플리케이션에서 사용하는 토폴로지를 테스트하려면 TopologyTestDriver를 사용할 수 있습니다. TopologyTestDriver는 실제 Kafka 클러스터 없이도 Kafka Streams 애플리케이션의 토폴로지를 실행하고 결과를 확인할 수 있는 인메모리 드라이버입니다. 이를 통해 테스트 데이터를 입력하고 처리된 결과를 검증할 수 있습니다.

import org.apache.kafka.streams.test.ConsumerRecordFactory;
import org.apache.kafka.streams.test.OutputVerifier;
import org.apache.kafka.streams.test.TestRecord;
import org.apache.kafka.streams.test.junit5.TopologyTestDriver;
import org.junit.jupiter.api.AfterEach;
import org.junit.jupiter.api.BeforeEach;
import org.junit.jupiter.api.Test;

public class MyKafkaStreamsAppTest {

    private TopologyTestDriver testDriver;
    private MyKafkaStreamsApp app;

    @BeforeEach
    public void setUp() {
        app = new MyKafkaStreamsApp();
        testDriver = new TopologyTestDriver(app.buildTopology(), app.getStreamsConfig());
    }

    @AfterEach
    public void tearDown() {
        testDriver.close();
    }

    @Test
    public void testKafkaStreamsApp() {
        // Create test records
        ConsumerRecordFactory<String, String> factory = new ConsumerRecordFactory<>("input-topic", new StringSerializer(), new StringSerializer());
        TestRecord<String, String> inputRecord = factory.create("key", "value");

        // Send test records to input topic
        testDriver.pipeInput(inputRecord);

        // Verify output records
        TestRecord<String, String> outputRecord = testDriver.readOutput("output-topic", new StringDeserializer(), new StringDeserializer());
        OutputVerifier.compareKeyValue(outputRecord, "key", "transformed-value");
    }
}

위의 예제에서는 MyKafkaStreamsApp 클래스에 대한 단위 테스트를 작성하였습니다. setUp() 메소드에서 TopologyTestDriver를 초기화하고, tearDown() 메소드에서는 리소스를 정리합니다. testKafkaStreamsApp() 메소드에서는 테스트 데이터를 생성하고, pipeInput() 메소드를 사용하여 입력 토픽에 데이터를 전송합니다. 그리고 readOutput() 메소드를 사용하여 출력 토픽에서 결과를 읽고 검증합니다.

2. 로깅 설정하기

Kafka Streams 애플리케이션을 디버깅할 때는 로그를 활용하는 것이 유용합니다. 로그는 애플리케이션의 상태와 동작을 추적하고, 문제를 분석하는 데 도움이 됩니다.

Kafka Streams는 SLF4J와 호환되는 로깅 프레임워크를 사용하므로, 로그 설정은 해당 프레임워크에 따라 다를 수 있습니다. Logback을 사용하는 경우, logback.xml 파일을 통해 로깅 설정을 구성할 수 있습니다.

<configuration>
    <appender name="CONSOLE" class="ch.qos.logback.core.ConsoleAppender">
        <encoder>
            <pattern>%date{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%n</pattern>
        </encoder>
    </appender>
    
    <root level="INFO">
        <appender-ref ref="CONSOLE"/>
    </root>
    
    <logger name="com.example.myapp" level="DEBUG"/>
</configuration>

위의 예제에서는 CONSOLE 앱렌더를 통해 로그를 콘솔에 출력하도록 설정하였습니다. 또한 LOGGER 요소를 사용하여 특정 패키지의 로그 레벨을 DEBUG로 설정하였습니다. 이를 통해 특정 컴포넌트의 로그를 자세히 확인할 수 있습니다.

3. 모니터링 및 문제 해결

Kafka Streams 애플리케이션을 운영하면서 발생할 수 있는 문제는 주로 성능 저하, 처리 지연, 예외 발생 등입니다. 이러한 문제를 해결하기 위해 모니터링 및 디버깅 도구를 사용할 수 있습니다.

Apache Kafka에는 Kafka Connect와 같은 다양한 모니터링 및 디버깅 도구가 있습니다. 이러한 도구를 사용하여 프로듀서와 컨슈머의 상태를 모니터링하고, 토픽의 메시지 전달 상태를 확인할 수 있습니다. 또한, Kafka Streams 내부 상태를 확인하기 위해 JMX를 활성화할 수도 있습니다.

또한, 애플리케이션의 성능과 안정성을 향상시키기 위해 Kafka Streams를 튜닝할 수도 있습니다. 이를 위해 설정 값을 조정하고, 파티션과 토픽의 구성을 검토할 수 있습니다. 이러한 작업은 애플리케이션의 특성과 운영 환경에 따라 다를 수 있으므로, 최적의 설정을 찾기 위해 실험과 모니터링이 필요합니다.

결론

Kafka Streams 애플리케이션의 테스트와 디버깅은 단위 테스트를 작성하고, 로깅을 설정하여 진행할 수 있습니다. 또한, 모니터링 및 디버깅 도구를 사용하여 문제를 식별하고 성능을 개선할 수 있습니다. 이러한 방법들을 활용하여 안정적이고 효율적인 Kafka Streams 애플리케이션을 개발하고 운영할 수 있습니다.