- ggplot2 패키지 설치 및 불러오기

- ggplot2 실습
- airqaulity data set을 사용한다.
airquality(data set, aes(데이터 속성))
x 축은 day, y 축은 temp로 맵핑

geom_point() 함수를 이용해 산점도로 값을 표시한다.

geom_point의 크기와 색깔을 설정해 가시성을 높인다.

geom_line() 함수를 이용해 꺽은선 그래프로 값을 표시한다.

꺽은선 그래프에 선전도를 추가한다.

그래프에 크기와 색깔을 설정해 가시성을 높인다.

boxplot() 함수를 이용해 상자 그래프로 값을 표시한다.

ggplot(airquality, aes(x= Temp))로 설정하고 geom_histogram()함수를 이용해 히스토그램으로 값을 표시한다.

- mtcars data set을 사용한다.
x 축을 cyl로 맵핑한다.

geom_bar() 함수를 이용해 막대그래프로 값을 표시한다.

막대그래프 넓이를 설정한다.

factor() 함수를 이용하면 비어있는 범주를 제외하고 시각화한다.

geom_bar(aes(fill=factor()))을 사용해 누적 막대그래프로 값을 표시한다.

+coord_polar()를 추가해 선버스트로 표현할 수 있다.

+coord_polar(theta="y")를 추가해 원형그래프 함수로 표현할 수 있다.

economics data set을 사용한다.
ggplot(econmics, aes(x= date, y= psavert))로 설정한다.

geom_line() 함수를 이용해 꺽은선그래프로 표현한다.
회귀분석으로 절편과 기울기를 구한다.

intercept(절편) = 12.4117258 , slope(기울기) = -0.0004925
geom_abline(intercept = , slope = ) 함수를 이용해 사선 그래프 추세를 표현한다.

mean() 함수를 이용해 psarvert 값의 평균을 구한다.

geom_hline() 함수를 이용해 수평선을 표현한다.

min() 함수를 이용해 psarvert 값이 가장 낮은 날짜를 구한다.

geom_vline() 함수를 이용해 수직선을 표현한다.

날짜를 직접 입력할 수 있는데, 문자데이터를 날짜로 바꿀 때는 as.Date()를 사용한다.

텍스트 입력 및 도형 그리기
geom_text(aes(label = 라벨명, vjust = 세로위치, hjust = 가로위치) 함수를 이용해 값을 표현한다.
vjust / hjust 값 0은 데이터 오른쪽 위, + 값은 아래/왼쪽, - 값은 위/오른쪽에 표시한다.

annotate("모양", xmin = x축 시작값, xmax = x축 끝값, ymin = y축 시작값, ymax = y축 끝값) 함수를 이용해 데이터를 강조한다.

alpha와 fill 조건을 추가해 투명도와 색깔을 설정한다.

"segment"를 입력하고 arrow() 함수를 옵션을 추가해 화살표로 선을 표현한다.

"text"를 입력해 label를 표현한다.

제목을 추가하고 디자인 테마 설정
labs(x = "x축 이름", y = "y축 이름", title = "그래프 제목")

theme() 함수를 이용해 테마를 변경할 수 있다.
theme_bw()

theme_gray()

theme_linedraw()

theme_light(), theme_dark(), theme_minimal(), theme_void(), theme_classic() 등 다양한 테마가 있다.
[출처] 처음 시작하는 R데이터 분석, 강전희