[R언어] R을 사용한 데이터 시각화 기술
R은 데이터 분석 및 시각화에 널리 사용되는 프로그래밍 언어이다. 이 블로그 포스트에서는 R을 사용하여 데이터 시각화를 하는 기술에 대해 살펴볼 것이다.
데이터 불러오기
우선, R에서는 데이터를 불러와야 한다. 다양한 데이터 파일 형식을 지원하며, read.csv()
나 read.table()
과 같은 함수를 사용하여 데이터를 불러올 수 있다.
# CSV 파일 불러오기
data <- read.csv("data.csv")
기본 시각화
R을 사용하여 가장 기본적인 시각화는 plot()
함수를 사용하는 것이다. 이를 통해 산점도, 선 그래프, 막대 그래프 등 다양한 그래프를 그릴 수 있다.
# 산점도 그리기
plot(data$X, data$Y)
고급 시각화 패키지
R에는 기본 시각화 기능 이외에도 다양한 시각화를 위한 패키지들이 존재한다. 그 중 대표적으로 ggplot2
와 plotly
가 있다. 이러한 패키지들은 더 많은 기능과 옵션을 제공하여 보다 화려하고 전문적인 시각화를 가능케 한다.
# ggplot2를 사용한 산점도 그리기
library(ggplot2)
ggplot(data, aes(x=X, y=Y)) + geom_point()
인터랙티브 시각화
R의 plotly
패키지는 인터랙티브한 시각화를 가능케 한다. 이를 통해 그래프를 드래그하여 확대, 축소하거나 데이터 포인트를 클릭하여 상세 정보를 확인할 수 있다.
# plotly를 사용한 산점도 인터랙티브 그리기
library(plotly)
plot_ly(data, x=~X, y=~Y, mode="markers")
R을 사용하여 데이터를 시각화하는 기술은 매우 다양하며, 이를 통해 데이터 분석 결과를 보다 직관적으로 이해할 수 있다. R의 시각화 패키지들은 이러한 작업을 보다 효과적으로 수행할 수 있도록 도와준다.
참고 자료
- R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
- Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4, URL https://ggplot2.tidyverse.org/.