[python] 파일에서 특정 단어의 빈도수 계산하기

11 Dec 2023

python

파이썬을 사용하여 파일에서 특정 단어의 빈도수를 계산하는 것은 자주 하는 작업입니다. 이를 위해 다음과 같은 방법을 사용할 수 있습니다.

파일 읽기: 먼저, 파일을 읽어서 텍스트 데이터를 가져옵니다.
텍스트 전처리: 가져온 텍스트에서 필요하지 않은 문자(예: 구두점, 특수 문자)를 제거합니다.
단어 빈도수 계산: 남은 단어들 중에서 원하는 단어의 빈도수를 계산합니다.

아래는 파일에서 특정 단어의 빈도수를 계산하는 간단한 파이썬 예제 코드입니다.

# 파일 읽기
with open('파일명.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 텍스트 전처리
text = text.lower()  # 소문자로 변환
text = text.replace('\n', ' ')  # 줄 바꿈 문자 제거
text = ''.join(e for e in text if e.isalnum() or e.isspace())  # 알파벳과 공백만 남기고 제거

# 단어 빈도수 계산
word_list = text.split()
word_count = word_list.count('원하는단어')
print(word_count)

이 예제 코드는 파일을 읽고 특정 단어의 빈도수를 계산하는 가장 기본적인 방법을 보여줍니다. 물론, 더 복잡한 텍스트 처리 기술과 자료 구조를 사용하여 더 정교한 빈도수 분석을 수행할 수 있습니다.

더 많은 정보를 원하시면 이 파이썬 공식 문서를 참조해보세요.