[python] 정규표현식을 이용한 이메일 형식인 문자열 추출하기

이메일 주소는 일반적으로 “아이디@도메인” 형식을 따릅니다. 이때, 아이디와 도메인에는 다양한 조건이 있을 수 있습니다. 이때 정규표현식을 사용하면 이메일 형식인 문자열을 쉽게 추출할 수 있습니다.

Python에서는 re 모듈을 사용하여 정규표현식을 처리할 수 있습니다. 아래는 이메일 형식인 문자열을 추출하는 예제 코드입니다.

import re

def extract_email(text):
    pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b'
    emails = re.findall(pattern, text)
    return emails

# 테스트 문자열
text = "안녕하세요. 이메일 주소는 hello@example.com이고, 다음은 다른 주소입니다. hi@gmail.com입니다."

# 이메일 추출
emails = extract_email(text)

# 결과 출력
for email in emails:
    print(email)

위 코드에서 extract_email 함수는 주어진 텍스트에서 이메일 형식인 문자열을 추출하여 리스트로 반환합니다. re.findall 함수를 사용하여 정규표현식 패턴에 맞는 모든 문자열을 추출합니다.

출력 결과는 아래와 같이 나타납니다:

hello@example.com
hi@gmail.com

이렇게 정규표현식을 이용하여 이메일 형식인 문자열을 추출할 수 있습니다. 참고로, 이메일 형식을 정확히 판단하기 위해서는 더 복잡한 정규표현식을 사용해야 할 수도 있습니다. 참고 자료를 통해 더 자세한 정보를 확인할 수 있습니다.

참고 자료