[step : 0 ] dplyr 패키지 다운 필요

install.packages("dplyr")
library(dplyr)

[step : 1] my_mpg 에 패키지 로딩

my_mpg <- mpg

* 변수 매칭 잊지 말기~~

(예제 1:) 각 제조사별 평균 고속도로 연비 추출하기 (select, group_by, summarise)

my_mpg %>%
select(manufacturer, hwy) %>%
group_by(manufacturer) %>%
summarise(mean(hwy))

(예제 2:) Ford 사 model 별 평균 hwy 데이터 추출하기

my_ford <- my_mpg %>%
filter(manufacturer == "ford") %>%
group_by(model) %>%
summarise(m_hwy = mean(hwy)) %>%
arrange(m_hwy) // 배열 사용하는 이유? : 연비별로 소팅한다는 뜻. (오름차순)

my_ford

  • select > filter 순으로 데이터를 뽑아 오는 것이 맞지만,
    이 경우에는 my_mpg 에서의 정보 그대로 불러 오면 되는 것이기 때문에
    select 생략하고 filter 를 바로 사용한 것이다.

(예제 3:) 도심연비 (cty) - 배기량(displ)

qplot(data = my_mpg, x=cty, y=displ, col=displ)
// qplot() : quickplot() 산포도(scatter plot), 박스플롯(box plot), 히스토그램(histogram), 막대그래프(bar graph) 등을 그릴 수 있다.

(예제 4:) USA 의 개인 소비 동향 실선 그래프로 나타내기

ggplot(data = economics, aes(x=date, y=pce))++ geom_line()
// ggplot() : initializes a ggplot object.
// aes(): asthetic/ aes(x=,y=,col=,) : 그래프 생성 함수
// geom_line() : 실선 그래프 그리는 함수

(예제 5:) USA 의 개인 저축 동향 실선 그래프로 나타내기

ggplot(data = economics, aes(x=date, y=psavrt)++geom_line())

profile
현지인의 개발새발 개발 스터디

0개의 댓글

Powered by GraphCDN, the GraphQL CDN