[java] 아파치 루신(Apache Lucene)을 이용한 관련 검색 기능 구현 방법

28 Nov 2023

java

아파치 루신은 오픈 소스 검색 라이브러리로, 검색 기능을 구현하기 위한 강력한 도구입니다. 이 라이브러리를 사용하여 관련 검색 기능을 구현하는 방법은 다음과 같습니다:

1. 아파치 루신 추가하기

먼저, 프로젝트에 아파치 루신을 추가해야 합니다. Maven을 사용한다면, pom.xml 파일에 아파치 루신 의존성을 추가할 수 있습니다:

<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-core</artifactId>
    <version>8.9.0</version>
</dependency>

Gradle을 사용한다면, build.gradle 파일에 아파치 루신 의존성을 추가할 수 있습니다:

dependencies {
    implementation 'org.apache.lucene:lucene-core:8.9.0'
}

2. 색인 인덱스 생성하기

데이터베이스에서 가져온 데이터를 아파치 루신이 이해할 수 있는 형식으로 변환하여 색인 인덱스를 생성해야 합니다. 인덱스는 검색을 빠르게 수행하기 위해 필요한 데이터 구조입니다. 아래는 인덱스 생성 예제입니다:

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.*;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;

import java.io.IOException;

public class SearchEngine {
    private Directory index;
    
    public void createIndex() throws IOException {
        // 인덱스를 만들기 위한 디렉터리 생성
        index = new RAMDirectory();
        
        // 인덱스 작성에 필요한 구성 설정
        IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer());
        
        // 인덱스 작성을 위한 라이터 생성
        IndexWriter writer = new IndexWriter(index, config);
        
        // 데이터베이스에서 가져온 문서들을 인덱스에 추가
        for (Document doc : getDocumentsFromDatabase()) {
            writer.addDocument(doc);
        }
        
        // 작성된 인덱스를 저장
        writer.close();
    }
    
    private List<Document> getDocumentsFromDatabase() {
        // 데이터베이스에서 문서들을 가져와서 Document 객체로 변환하여 반환
        // 이 예제에서는 생략
        
        return documents;
    }
}

3. 관련 검색 수행하기

인덱스가 생성되면, 아파치 루신을 사용하여 관련 검색을 수행할 수 있습니다. 아래는 관련 검색을 수행하는 예제입니다:

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;

import java.io.IOException;

public class SearchEngine {
    private Directory index;
    
    public void search(String queryString) throws IOException {
        // 인덱스에 대한 리더 생성
        IndexReader reader = DirectoryReader.open(index);
        
        // 검색을 수행하기 위해 검색기 생성
        IndexSearcher searcher = new IndexSearcher(reader);
        
        // 검색 쿼리를 작성하기 위한 파서 생성
        QueryParser parser = new QueryParser("content", new StandardAnalyzer());
        
        try {
            // 사용자가 입력한 검색어를 파싱하여 쿼리 객체로 변환
            Query query = parser.parse(queryString);
            
            // 검색 수행
            TopDocs topDocs = searcher.search(query, 10);
            
            // 검색 결과 출력
            for (ScoreDoc scoreDoc : topDocs.scoreDocs) {
                int docId = scoreDoc.doc;
                Document doc = searcher.doc(docId);
                System.out.println(doc.get("title"));
            }
        } catch (ParseException e) {
            e.printStackTrace();
        }
        
        // 리더 닫기
        reader.close();
    }
}

위의 예제는 content 필드를 기준으로 검색을 수행합니다. 필요에 따라 쿼리 파서를 수정하여 원하는 검색 방식으로 변경할 수 있습니다.

결론

아파치 루신을 사용하여 관련 검색 기능을 구현하는 방법에 대해 알아보았습니다. 아파치 루신은 검색 엔진 개발에 유용한 기능을 제공하며, 검색 성능을 향상시킬 수 있습니다. 위의 예제를 참고하여 원하는 검색 기능을 구현해보세요. 더 많은 정보는 아파치 루신 공식 웹사이트에서 확인할 수 있습니다.