Day1 - R(1) 22.08.23.화

류소리·2022년 8월 23일
0

R

목록 보기
1/7

R수업 시작: 22.08.23 ~ (1 Week) 강사님:정순진

R은 액셀과 같다. "통계 프로그램에서 다룬다."

  • 액셀탄생, 액셀의 단점: 데이터가 많으면 오류가 발생함.

    ->SPSS탄생,SPSS 단점:

    ->SAS탄생, SAS단점: 비싸다

    ->R탄생

R의 장점:
1.다양한 통계학, 데이터마이닝 분석기법 가능.
2.오픈소스
3.운영체제 영향 받지 않는다.
4.무료

R의 특징:
1.등호, 화살표로 직관적인 설명을 함.

-R과 PYTHON 둘 다 데이터 분야(의료, 생명공학) 사용 많이 한다.

설명


-CLI
-CUI: 그림, Window 검은창, cmd, 콘솔
-딥러닝: 케라스
-R에서 처음 만나는 함수: C(), #Combin():묶어주는 함수
-working derectory: 여기에서만 벌어지는 일.
-library(라이브러리) = 패키지. #install.packages()
-library 보조기억 장치에서 주기억장치로 옮겨옴.

cpu->ram(주기억장치)->하드디스크(보조기억장치)

%Warning messages:주의하시오.(괜찮음)

단축키


-ctrlt+L: 콘솔 깨끗하게 지움.
-ctrlt+R: 편집기 R로 가져옴. #편집기는 파일-새 창에 있음.
-Window+E: 파일 탐색기
-ctrlt+SHIFT+N:RSTUDIO

함수


qplot(): 값을 그림으로 표현해 준다.

ex) a<-("a","s","s","d"), qplot(a):그림으로 표현됨.

-qplot(diamonds$cut): 막대그래프로 표현됨
-ggplot(data=diamonds,aes(x=carat,y=price)) +geom_point():그래픽 표현됨
-ggplot(data=diamonds,aes(x=carat,y=price, color=cut))+geom_point(): 색이 표현됨

RSTUDIO


SHIFT+ENTER(변경가능): 값 콘솔에 보여줌

-숫자열:numeric

-문자열:character

-참과 거짓:logical #(T,F-축약가능)

-두 개 이상 타입 시 문자->숫자->참,거짓 순

벡터(vector):한 줄
vectorise:여러줄을 한줄로 줄 세운다.

비교연산자

-a&&b: a와b 앞에꺼만 비교한다.

-a||b :a와b 앞에꺼만 비교한다.
									
-a==3 :a가3 인지 아닌지 확인한다.

-a!=3 :a가 3같지 않다.

변수이름
-영문자와 숫자 혼합 사용가능.
-앞머리 숫자로 시작하지말라.
-첫 글자로 '_'가 나올 수 없다.
-특정 예약어 사용할 수 없다.(IF)

행렬,메트릭스 만들기


  • nrow:행의 수, ncol:열의 수

matrix(1:12):1부터 12까지

  • matrix(1:12,nrow = 3): 로그의 행 갯수가 3개구나
    [,1][,2] [,3][,4]
    [1,] 1 4 7 10
    [2,] 2 5 8 11
    [3,] 3 6 9 12
  • matrix(1:12,ncol = 3): 로그의 열 갯수가 3개구나
    [,1][,2] [,3][1,] 1 5 9
    [2,] 2 6 10
    [3,] 3 7 11
    [4,] 4 8 12
  • rownames(mat)<-c("국어","영어","수학"): 행이름
    a1 a2 a3 a4
    국어 1 2 3 4
    영어 5 6 7 8
    수학 9 10 11 12
  • colnames(mat)<-c("a1","a2","a3","a4"): 열이름
    a1 a2 a3 a4
    [1,] 1 2 3 4
    [2,] 5 6 7 8
    [3,] 9 10 11 12

행렬,인덱스(indexing)

  • nrow와 ncol 인수는 c()함수로 묶어서 행렬 출력 가능하다.

mat[1,2]
mat[,2]
mat[1,]

  • mat[1,2][1] 2
  • mat[,2]
    국어 영어 수학
    2 6 10
  • mat[1,]
    a1 a2 a3 a4
    1 2 3 4

데이터프레임(Data Frame)

:행과 열로 구성된 사각형 모양의 표처럼 생겼습니다. 가장 많이 사용하는 데이터의 형태

data.frame(x1) #표처럼나옴(세로로)
data.frame(x2)
data.frame(x1,x2)

  • data.frame(x1)
    x1
    1 100
    2 80
    3 60
    4 40
    5 30
  • data.frame(x2)
    x2
    1 a
    2 b
    3 C
    4 a
    5 b
  • data.frame(x1,x2)
    x1 x2
    1 100 a
    2 80 b
    3 60 C
    4 40 a
    5 30 b

df <- data.frame(score=x1,grade=x2)
df[,'score']
df$score

  • df
    score grade
    1 100 a
    2 80 b
    3 60 C
    4 40 a
    5 30 b
  • df[,'score'][1] 100 80 60 40 30
  • df$score
    [1] 100 80 60 40 30

airquality

air <- airquality[1:6,]
sum(air[c(1,4),c(1,5)])
air <- airquality[,3:6]

  • Ozone Solar.R Wind Temp Month Day
    1 41 190 7.4 67 5 1
    2 36 118 8.0 72 5 2
    3 12 149 12.6 74 5 3
    4 18 313 11.5 62 5 4
    5 NA NA 14.3 56 5 5
    6 28 NA 14.9 66 5 6
    air<-6행이 출력 됨.
  • 69,
  • air<-3~6열 출력됨.

install.packages

install.packages("readxl")
library(readxl)

profile
새싹 빅테이터 개발자

0개의 댓글