R은 통계 분석과 데이터 시각화를 위한 프로그래밍 언어이자 소프트웨어 환경이다. 주로 데이터 과학, 머신러닝, 생물 정보학, 경제학 등의 분야에서 널리 사용되고 있다.
R은 1960년대와 1970년대 Bell 연구소에서 개발된 S라는 데이터 처리 언어에 기반을 두고 있다. 1990년대 중반 뉴질랜드 오클랜드 대학의 로스 이하카와 로버트 젠틀맨에 의해 시작되어 현재는 R의 핵심 기능은 R 코어 팀이, 다양한 추가 기능은 자발적 기여자들에 의해 개발되고 있다. R은 GPL 하에 배포되는 공개 소프트웨어로 누구나 자유롭게 이용할 수 있다.
R은 빅데이터 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계 분석가들 사이에서 통계 소프트웨어 개발에 많이 쓰이고 있다.
[Download] CRAN
클릭.[KOREA]
클릭.https://posit.co/download/rstudio-desktop/
dplyr
, tidyr
등의 패키지 제공ggplot2
패키지를 이용한 고품질 그래프 생성 shiny
패키지 활용)Rcpp
를 통해 C++과 연동 가능reticulate
패키지), SQL 등과 함께 사용 가능Create R Script
or Use Concole
.
#
Command + A
➡️ Command + Enter
# 변수 할당
x <- 10
y <- 20
z <- x + y # [1] 30 출력
# 데이터 프레임 생성
df <- data.frame(
name = c("A", "B", "C"),
score = c(90, 85, 88)
)
# ggplot2를 이용한 그래프 그리기
library(ggplot2)
ggplot(df, aes(x = name, y = score)) + geom_bar(stat = "identity")
nums<-rnorm(10)
hist(nums)
rnorm(n)
는 정규분포를 따르는 숫자 중 랜덤하게 n개의 숫자를 추출한다.
R에서 가장 흔히 사용되는 함수로 분포도나 꺽은선 그래프 등을 그릴 수 있다.
plot(y축 데이터, 옵션)
plot(x축 데이터, y축 데이터, 옵션)
R에서 대부분 데카르트 방식을 이용한다.
데카르트 방식 : plot(x,y)
수식기반 방식 : plot(y~x)
> var1 <- c(1,2,3,4,5)
> plot(var1)
참고,
https://kilhwan.github.io/rprogramming/ch-intro.html
R 그래프 표현 plot() 함수|작성자 1stwook