[DB] 정형, 반정형, 비정형 데이터

정형, 반정형, 비정형 데이터

정형(Structured Data)

Structured, 즉 구조화 돼 있다는 말 그대로 관계형 데이터베이스(RDB), 스프레드시트, CSV등이다.

반정형 데이터 (Semi-Structured Data)

반정형 데이터란 형태(Schema, Meta Data)가 있으며, 연산이 불가능한 데이터를 말한다. 예를들면 XML, HTML, JSON, 로그 형태등이 있다.

비정형 데이터 (Untructured Data)

정형 데이터란 형태가 없으며, 연산도 불가능한 데이터를 말한다. 예를 들면 소셜데이터(트위치, 페이스북), 영상, 이미지, 음성, 텍스트(word, PDF…) 등이 있다.