# EDA

[프로그래머스 인공지능 미니 데브코스] 수업 정리 -9- [데이터 씹고 뜯고 맛보고 즐기기 - EDA]
1. 탐색적 데이터 분석 EDA EDA? 데이터 그 자체를 보는 눈 데이터를 분석하는 기술적 접근은 매우 많다. 데이터 그 자체만으로부터 인사이트를 얻어내는 접근법! 통계적 수치나 numpy/pandas등으로 알 수 있다. EDA의 Process 분석의 목적과 변수

[ADsP] 데이터 분석 - 데이터 분석 기법의 이해
데이터 분석에 대한 정의는 매우 다양하고 수준과 복잡성, 목적도 다르다.분석은 일반적으로 조회와 고급분석으로 양분되며 고급분석은 20개 이상의 변수와 수천건 이상의 데이터를 이용해 인사이트를 얻거나 의사결정을 하는데 직접 사용된다.평균과 분산에 대한 이해를 토대로 집단
서울시 범죄 현황 분석 07
데이터 불러오기살인발생 건수 지도 시각화경계 그리기성범죄 발생 건수 지도 시각화5대 범죄 발생 건수 지도 시각화인구 대비 범죄 발생 건수 지도 시각화경찰서별 정보를 범죄발생과 함께 정리정규화 후 검거 컬럼 추가경찰서 위치 마커 표시검거에 값을 곱한 뒤 원의 넓이 적용m
서울시 범죄 현황 분석 06
folium.Map()tuple or list, default None Latitude and Longitude of Map (Northing, Easting).save()tiles option"OpenStreetMap""Mapbox Bright" (Limited
서울시 범죄 현황 분석 05
데이터 확인pairplot을 활용 강도, 살인, 폭력의 상관관계 확인def drawGraph(): sns.pairplot(data=crime_anal_norms, x_vars='인구수', 'CCTV', y_va
Seaborn
sns.set_style()'white', 'whitegird, 'dark', 'darkgrid'whitedarkwhitegrid\-darkgridboxplotswarmplotimplotboxplotboxplot hue, palette optionhue : 카테고리 데
서울시 범죄 현황 분석 04
데이터 불러오기새로운 데이터 프레임을 만들면서, index는 구별로, value는 합계로, 위도와 경도는 삭제검거율 생성하나의 컬럼을 다른 컬럼으로 나누기다수의 컬럼을 다른 컬럼으로 나누기다수의 컬럼을 다수의 컬럼으로 각각 나누기target = '강간검거율', '강도검
서울시 범죄 현황 분석 03
Google Maps API를 통한 데이터 추출print(tmp0.get('geometry').get("location")'lat') print(tmp0.get('geometry').get("location")'lng') tmp0.get('formatted_addres
Python 모듈 설치
Python의 공식 모듈 관리자pip list : 현재 설치된 모듈 리스트 반환pip install module_name : 모듈 설치pip uninstall module_name : 설치된 모듈 제거pip와 다르게 채널 지정이 가능conda list : 설치된 모듈
서울시 범죄 현황 분석 02.
피봇테이블 구성멀티 index 확인crime_station'sum', '건수', '강도', '검거' \`\`\`다중 컬럼에서 특정 컬럼 제거제거된 level 1,2 인덱스피봇테이블 인덱스 확인
pandas pivot table
데이터 불러오기인덱스 설정df.pivot_table(index='Manager', 'Rep', values="Price") \`\`\`컬럼 연산 적용컬럼 설정멀티 index, 멀티 value 설정멀티 aggfunc 설정
서울시 범죄 현황 분석 01.
데이터 개요데이터 정보 확인crime_raw_data\[crime_raw_data'죄종'.isnull()].head() \`\`\`
Jupyter notebook, VScode 기초 05
코드 맨 뒤에 ;을 넣어주면 변수설명문구(<AxesSubplot:ylabel='구별'>)가 사라짐오름차순 정렬인구수와 소계 컬럼으로 scatter plot 그리기Numpy를 이용한 1차 직선 만들기np.polyfit() : 직선을 구성하기 위한 계수를 계산np.p

Jupyter notebook, VScode 기초 04
matplotlib 불러오기 & 한글, 마이너스 깨짐 방지삼각함수 그리기격자무늬 추가그래프 제목 추가x축, y축 제목 추가주황색, 파란색 선 데이터 의미 구분예제2:그래프 커스텀
Jupyter notebook, VScode 기초 03
pandas에서 데이터 프레임을 병합하는 방법pd.concat()pd.merge()pd.join()딕셔러니 안의 리스트 형태 -> key 값에 해당하는 열의 value가 리스트로 기입left = pd.DataFrame({ "key" : "k0", "k4", "k2