[java] 아파치 루신(Apache Lucene)을 사용한 필요한 필드만 로드하는 데이터 전송 방법

28 Nov 2023

java

아파치 루신은 검색 엔진을 구축하기 위해 널리 사용되는 라이브러리입니다. Lucene을 사용하여 데이터를 색인하고 검색할 때, 모든 필드를 로드하면 불필요한 리소스를 낭비할 수 있습니다. 이런 경우, 필요한 필드만 로드하여 데이터 전송 속도를 향상시킬 수 있습니다.

이 자습서에서는 아파치 루신을 사용하여 필요한 필드만 로드하는 데이터 전송 방법을 알아보겠습니다.

1. 필드 선택하기

먼저, 사용할 필드를 선택해야 합니다. 필드는 문서의 속성을 나타내며, 문서의 색인 및 검색에 사용됩니다. 이 예제에서는 ‘title’ 필드와 ‘content’ 필드를 로드하도록 선택하겠습니다.

String[] fields = {"title", "content"};

2. 필드 로드하기

검색 시 필드를 로드하기 위해서는 IndexReader 객체를 사용해야 합니다. IndexReader는 루신 색인을 읽어오는 역할을 수행합니다. 필요한 필드만 로드하기 위해 IndexReader.document() 메서드에 필드 목록을 전달합니다.

Directory indexDirectory = FSDirectory.open(Paths.get("index")); // 인덱스 디렉토리 설정
IndexReader indexReader = DirectoryReader.open(indexDirectory); // 인덱스 리더 초기화

Document document = indexReader.document(docId, new HashSet<>(Arrays.asList(fields)));

위의 코드에서 docId는 로드하려는 문서의 ID입니다.

3. 로드한 필드 사용하기

로드한 필드는 Document 객체에서 get() 메서드를 사용하여 액세스할 수 있습니다. 반환된 값은 필드의 String 표현입니다. 필드 값을 사용하여 원하는 작업을 수행할 수 있습니다.

String title = document.get("title");
String content = document.get("content");

4. 자원 해제하기

검색이 끝난 후에는 사용한 리소스를 해제해야 합니다. IndexReader를 닫아 자원을 정리할 수 있습니다.

indexReader.close();

결론

아파치 루신을 사용하여 필요한 필드만 로드하는 방법에 대해 알아보았습니다. 이를 통해 데이터 전송 속도를 향상시킬 수 있으며, 불필요한 리소스 낭비를 방지할 수 있습니다.

더 자세한 내용은 아파치 루신의 공식 문서를 참조하시기 바랍니다.

참고 문서:

아파치 루신 공식 문서: https://lucene.apache.org/
아파치 루신 API 문서: https://lucene.apache.org/core/8_0_0/