R프로그램 - 기초 Ⅲ

아현·2021년 4월 23일
0

R

목록 보기
3/3

1. 요인


요인의 개념


  • 요인(factor)은 R의 데이터 중에서 하나이며 벡터의 한 종류

  • 벡터와 요인 모두 1차원의 형태로 자료가 되어 있다.

    • 벡터 - 범주형 자료로 인식하지 못한다.

    • 요인 - 범주형 자료로 인식한다.

  • 요인은 주로 집단별로 자료를 분석하고자 할 때에 특정 자료를 범주형 자료로 변경해 준다.



요인을 생성하는 방법


  • 요인을 생성하는 함수는 factor()

    • 질적 자료는 명목형과 순서형으로 나눌 수 있는데 순서가 의미가 있는 자료인 순서형을 만들기 위해서는 ordered를 사용한다.

  • factor() 함수의 사용

    • 6명의 성별 데이터를 gender라는 벡터에 저장, gender라는 벡터를 요인(factor)로 변환


  • levels() 함수의 사용

    • 요인이 가지는 집단이 몇 개 이며, 각 집단의 이름이 무엇인지를 알고자 할 경우 사용


  • labels argument 사용

    • 벡터에 있는 각각의 원소의 값을 다른 문자형 유형으로 변경할 경우
  • levels argument 사용

    • 어느 집단을 먼저 인식할 것인지를 결정


  • factor() 함수에 ordered=TRUE를 추가

    • 집단으로 할 뿐만 아니라 순서도 의미가 있도록 한다.

    • 통계에서 말하는 질적 자료이면서 순서형 자료가 된다.




2. 행렬


행렬의 개념


  • 행렬(matrix)은 데이터의 형태가 2차원으로 행(row)과 열(column)로 구성

  • 벡터의 확장 개념

  • 벡터와 동일하게 하나의 데이터 유형만 가질 수 있다.

  • 행렬은 수학이나 통계에서 주로 사용



행렬을 생성하는 방법


  • 행렬을 생성하는 함수

    • rbind()

    • cbind()

    • matrix()

    • rbind() : 벡터를 행 방향으로 합치는 방법

    • cbind() : 벡터를 열 방향으로 합치는 방법


  • m1은 2(rows) X 3(cols) 행렬, m2는 3 X 2 행렬

  • matrix() 함수





3. 배열


배열의 개념


  • 배열(array)은 데이터의 형태가 3차원 이상으로 구성될 수 있다.

  • 행렬의 확장 개념

    • 벡터 -> 행렬 -> 배열
  • 배열은 차원을 어떻게 지정하느냐에 따라
    1차원, 2차원, 3차원, 4차원 등으로 구성할 수 있다.

  • 벡터와 행렬처럼 데이터의 유형은 하나만 가질 수 있다.



배열을 생성하는 방법


  • array() 함수




4. 리스트


리스트의 개념


  • 리스트(list)는 R의 데이터 형태인 벡터(vector), 요인(factor), 행렬(matrix), 배열(array), 데이터 프레임(data frame)과 리스트 자체까지 원소로 가질 수 있다.

    • 가장 유현한 형태라고 볼 수 있다.
  • 리스트 구조로 데이터를 저장해서 분석

  • 많은 경우에는 데이터를 분석한 결과의 형태가 리스트인 경우가 많다.

    • 초보 단계에서는 데이터 분석의 결과를 저장하는 데이터 형태로 리스트를 기억하는 것이 더 좋다.



리스트를 생성하는 방법


  • list() 함수 사용방법

    • 하나의 벡터와 하나의 행렬을 가지는 리스트를 생성


  • 리스트의 원소 중에서 일부를 추출하는 방법 (최종적인 형태의 차이)

    • [] 사용법

    • [[]] 사용법






profile
For the sake of someone who studies computer science

0개의 댓글