matplotlib으로 데이터를 그래프로 표현하기 - 2월 24일

조준수·2023년 2월 26일
0

CCTV 3

9 이론 - Pandas 데이터 합치기

  1. 상관관계란?
    (1) 상관관계가 있다고 해서 인과관계가 있는 것은 아니다.
    (2) corr( )
    (3) 상관계수를 조사해서 0.2 이상의 데이터를 비교하는 것은 의미가 있다.

10 실습 - Pandas 데이터 합치기 Pandas기초 - merge

  1. Pandas에서 데이터 프레임을 병합하는 방법
    (1) pd.concat( )
    (2) pd.merge( )
    (3) pd.join( )

  2. 딕셔너리 안에 리스트 형태
    (1) 데이터가 열로 들어간다.

  3. 리스트 안에 딕셔너리 형태
    (1) 데이터가 행으로 들어간다.

  4. pd.merge()
    (1) 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법
    (2) 기준이 되는 컬럼이나 인덱스를 키값이라고 한다.
    (3) 기준이 되는 키값은 두 데이터 프레임에 모두 포함되어 있어야 한다.

11 실습 - Pandas 데이터 합치기

  1. 연도별 데이터 컬럼 삭제
    (1) del
    (2) drop( )

  2. 인덱스 변경
    (1) set_index()
    (2) 선택한 컬럼을 데이터 프레임의 인덱스로 지정한다.

  3. 상관계수 구하기
    (1) corr()
    (2) 숫자만 들어가야 한다.

CCTV 4~5

13 실습 - matplotlib 기초 - 1

  1. matplotlib 실행
    (1) 예시
    import matplotlib.pyplot as plt
    from matplotlib import rc

    rc('font', family='Malgun Gothic')
    #%matplotlib inline
    get_ipython().run_line_magic('matplotlib', 'inline')

    plt.rcParams['axes.unicode_minus'] = False

  2. matplotlib 그래프 기본 형태

    plt.figure(figsize=(10, 6))
    plt.plot(x, y)
    plt.show

  3. 삼각함수 그리기
    (1) np.arange(a, b, s): a부터 b까지 s의 간격
    (2) np.sin(value)

14 실습 - matplotlib 기초 - 2

  1. 그래프 커스텀
    (1) 예시
    plt.figure(figsize=(10, 6))
    plt.plot(
    t,
    y,
    color='green',
    linestyle='dashed', # - : 실선, -- : dashed
    marker='o',
    markerfacecolor='blue',
    markersize=15)

    plt.xlim([-0.5, 6.5])
    plt.ylim([0.5, 9.5])
    plt.show()

18 실습 - 데이터 경향을 그려보자

  1. Numpy 를 이용한 1차 직선 만들기
    (1) np.polyfit() : 직선을 구성하기 위한 계수를 계산
    (2) np.poly1d() : polyfit 으로 찾은 계수로 파이썬에서 사용할 수 있는 함수로 만들어주는 기능

  2. 경향선을 그리기 위한 x 데이터 생성
    (1) fx= np.linspace(100000, 700000, 100)
    (2) np.linspace(a, b, n) : a부터 b까지 n개의 등간격 데이터 생성

20 실습 - 경향에서 벗어난 데이터 강조하기

  1. 경향과의 오차 만들기
    (1) 경향(trend)과의 오차를 만들자
    (2) 경향은 f1 함수에 해당 인구를 입력
    (3) f1(data_result['인구수'])
profile
print(‘안녕하세요! 반갑습니다!’)

0개의 댓글