CSV(Comma Separated Values) 파일은 데이터를 텍스트 형식으로 저장하는 방법 중 하나입니다. CSV 파일은 주로 데이터 분석 및 처리에 사용되는데, 이러한 파일에서 요약 통계를 생성하는 것은 매우 유용합니다. Java에서는 OpenCSV라이브러리를 사용하여 CSV 파일에 대한 요약 통계를 생성할 수 있습니다.
OpenCSV 라이브러리 추가하기
먼저, OpenCSV 라이브러리를 프로젝트에 추가해야 합니다. Maven을 사용하는 경우 pom.xml 파일에 다음 의존성을 추가합니다:
<dependency>
<groupId>com.opencsv</groupId>
<artifactId>opencsv</artifactId>
<version>5.5.2</version>
</dependency>
Gradle을 사용하는 경우 build.gradle 파일에 다음 의존성을 추가합니다:
implementation 'com.opencsv:opencsv:5.5.2'
CSV 파일에서 요약 통계 생성하기
다음은 OpenCSV를 사용하여 CSV 파일에서 요약 통계를 생성하는 간단한 예제 코드입니다:
import com.opencsv.CSVReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
public class CsvSummaryStatistics {
public static void main(String[] args) {
String csvFilePath = "파일경로.csv";
try (CSVReader reader = new CSVReader(new FileReader(csvFilePath))) {
List<String[]> records = reader.readAll();
// CSV 파일의 모든 레코드를 리스트에 저장
int recordCount = records.size();
int columnCount = records.get(0).length;
System.out.println("총 레코드 수: " + recordCount);
System.out.println("총 컬럼 수: " + columnCount);
// 다른 통계 계산 로직을 추가할 수 있습니다.
} catch (IOException e) {
e.printStackTrace();
}
}
}
위의 예제 코드에서는 CSVReader
클래스를 사용하여 CSV 파일을 읽어옵니다. CSVReader
의 readAll()
메서드를 호출하여 CSV 파일의 모든 레코드를 리스트에 저장한 후, 리스트의 크기를 통해 총 레코드 수와 총 컬럼 수를 계산합니다.
추가로, 다른 통계 계산을 위해 필요한 로직을 코드에 추가할 수 있습니다. 예를 들어, 각 컬럼의 평균값, 최대값, 최소값 등과 같은 통계 정보를 계산하는 로직을 추가할 수 있습니다.
결론
Java에서 OpenCSV를 사용하여 CSV 파일에 대한 요약 통계를 생성하는 방법을 알아보았습니다. 이를 통해 데이터 분석 및 처리 작업에 유용한 정보를 얻을 수 있습니다. OpenCSV를 사용하면 CSV 파일을 쉽게 다룰 수 있으며, 통계 계산을 포함한 다양한 작업을 수행할 수 있습니다.