요인(factor)은 R의 데이터 중에서 하나이며 벡터의 한 종류
벡터와 요인 모두 1차원의 형태로 자료가 되어 있다.
벡터 - 범주형 자료로 인식하지 못한다.
요인 - 범주형 자료로 인식한다.
요인은 주로 집단별로 자료를 분석하고자 할 때에 특정 자료를 범주형 자료로 변경해 준다.
요인을 생성하는 함수는 factor()
ordered
를 사용한다.factor() 함수의 사용
levels() 함수의 사용
labels argument 사용
levels argument 사용
factor() 함수에 ordered=TRUE를 추가
집단으로 할 뿐만 아니라 순서도 의미가 있도록 한다.
통계에서 말하는 질적 자료이면서 순서형 자료가 된다.
행렬(matrix)은 데이터의 형태가 2차원으로 행(row)과 열(column)로 구성
벡터의 확장 개념
벡터와 동일하게 하나의 데이터 유형만 가질 수 있다.
행렬은 수학이나 통계에서 주로 사용
행렬을 생성하는 함수
rbind()
cbind()
matrix()
rbind() : 벡터를 행 방향으로 합치는 방법
cbind() : 벡터를 열 방향으로 합치는 방법
matrix() 함수
배열(array)은 데이터의 형태가 3차원 이상으로 구성될 수 있다.
행렬의 확장 개념
배열은 차원을 어떻게 지정하느냐에 따라
1차원, 2차원, 3차원, 4차원 등으로 구성할 수 있다.
벡터와 행렬처럼 데이터의 유형은 하나만 가질 수 있다.
array() 함수
리스트(list)는 R의 데이터 형태인 벡터(vector), 요인(factor), 행렬(matrix), 배열(array), 데이터 프레임(data frame)과 리스트 자체까지 원소로 가질 수 있다.
리스트 구조로 데이터를 저장해서 분석
많은 경우에는 데이터를 분석한 결과의 형태가 리스트인 경우가 많다.
list() 함수 사용방법
하나의 벡터와 하나의 행렬을 가지는 리스트를 생성
리스트의 원소 중에서 일부를 추출하는 방법 (최종적인 형태의 차이)
[] 사용법
[[]] 사용법