# heatmap
Ch3 서울시 범죄 현황 데이터 분석 18-32 (범죄3-6)
seaborn boxplot swarmplot heatmap pairplot : 경향을 보여줌 lmplot 범죄현황 데이터 시각화 Folium 지도 시각화 folium.Map() save("path") tiles option -> 지도 테마 선택 folium.Marker() -> 지도에 마커 생성 folium.Icon() -> 마커 아이콘 모양 설정 folium.ClickForMarker() -> 지도 위에 마우스로 클릭할때마다 마커를 생성해줌 -> popup: str가 있으면 그걸 반환해주고, 없으면 해당 위치의 위도,경도를 반환해줌 folium.LatLngPopup() -> 지도를 마우스로 클릭했을 때 위도 경도 정보를 반환해줌 folium.Circle(), folium.CircleMarker() -> 해당 위치에 동그라미 표시 foliu

제로베이스 데이터취업스쿨 DAY21 EDA 범죄3~6
tips = sns.load_dataset('tips') sns.lmplot(x="total_bill", y="tip", data=tips, size=7) sns.countplot( x=result_mol["mall"], data=result_mol, palette="RdYlGn", order=resultmol["mall"].valuecounts().index ) icon prefix="fa" prefix="glyphicon" 각 종류(fa,glyphicon)에 해당하는 아이콘 다름. (
pandas iterrows 등 - 2월 27일
범죄 1 2 실습 - 강남3구 범죄현황 데이터 개요 및 읽어오기 thousands=',' (1) 숫자값을 문자로 인식할 수 있어서 설정 6 실습 - 서울시 범죄현황 데이터 정리 다중 컬럼에서 특정 컬럼 제거 (1) crimestation.columns = crimestation.columns.droplevel([0, 1]) 7 이론 - pip명령과 conda명령 pip 명령 (1) pip list = get_ipython().system('pip list') (2) pip install module_name (3) pip uninstall module_name conda 명령 (1) conda list (2) conda install module_name (3) conda uninstall module_name (4) conda install -c channelname modulename :

heatmap 시각화 정리
배달요청 픽업 데이터 배달 요청된 가게의 주소지 (라이더 픽업 주소) = 출발지주소 출발지주소 컬럼 전처리 시군구 분포 확인 행정동 분포 확인 log scale 주문 요청이 많이 들어오는 행정동 내림차순 정렬 > 25% - 9건 확인 하위 25% 값 이상인 행정동만 리스트 생
[3주차_데이터분석] 개발일지 (코로나 데이터 분석-지도시각화, 히트맵그리기)
✍️ 지도 시각화 folium은 파이썬 지도 시각화 패키지이다. 지도를 불러와 데이터를 기반으로 그 위에 여러가지 시각화 기능을 제공한다. 특정 지역을 표시하고자 할 때는 Map()함수를 사용해서 지역의 위도와 경도를 입력하면 된다. zoom_start는 처음에 표시할 때 얼마나 확대를 할 지를 결정하는 값이다. tiles값을 지정하면 다양한 지도 표시가 가능하다. ✍️지도와 히트맵 
[3주차 목표] 데이터프레임 사용법을 익힌다. 파이썬을 이용해서 데이터를 각종 차트로 시각화해본다. 👉3. 상관 관계 분석에 대해서 이해한다.👈 [목차] 상관 계수 히트맵 산점도 ○ 상관 계수 상관 분석이란 두 변수 간의 선형적 관계를 상관 계수로 표현하는 것이다. 상관 계수란 2개의 변수 중 하나의 값이 상승하면 다른 값도 상승하는 경향을 수치로 표현하며 이를 1과 -1 사이 값으로 변환한다. 상관 계수가 1과 가깝다면 서로 강한 양의 상관 관계가 있는 것이고, -1에 가깝다면 음의 상관 관계가 있는 것이다. > ✋데이터 시각화에 사용되는 패키지 Matplotlib : 파이썬의 자료를 차트나 플롯으로 시각화하는 패키지 seaborn : Matplotlib을 기반으로 다양한 테마와 기능을 추가한 시각화 패키지 👉상관계수 구하기 `corr =

[Product] 고객님, 언제 처음 오셨어요?
2022.3. 학교앞 워싱턴스퀘어파크의 이름모를 피아니스트. Cohort 분석 이번 포스팅에서는 cohort 분석을 해보겠습니다. 저의 첫번째 데이터 분석 실습입니다. 고객을 cohort별로 구분하면 무엇이 좋을까요? 전체를 놓고 봤을 때는 안보이던 패턴을 찾을 수 있습니다. 고객들은 제품에 온보딩 된 이후 lifecycle에 따라 제품 사용 패턴이 달라집니다. 최초구매일, 최초가입일 등을 기준으로 cohort를 나눈다면 여러 시점에 온보딩한 고객들을 같은 선상에 놓고 비교할 수 있습니다. 가령 온보딩 이후 3개월차에 고객들이 여전히 우리 제품을 사용하는 비율은 얼마인지, 그 비율이 계속 개선되고 있는지 알 수 있습니다. 1. Intro 1. 데이터 소개 오늘 분석할 데이터는 영국 UCI Machine Learning Repository에 공개되어 있는 Online Retail Data Set 입니다. 영국 e-commerce 회사

[Aiffel] 아이펠 8일차 개념 정리 및 회고
리눅스 명령어 pip list | grep 모듈명 모듈명이 들어가는 모든 행을 찾아줌 1. 파이썬 개념정리 파이썬 코딩도장 내용을 읽고 정리한 부분입니다. 1) 클래스 상속 물려받은 기능을 유지한 채로 다른 기능을 추가할 때 사용 기존 기능을 재활용할 수 있어 효율적 연관되면서 동등한 기능을 할 경우 사용 (is-a 관계) > cf) 포함관계 has-a 관계, 동등한 관계가 아니라 한 쪽이 다른 한 쪽에 속하는 관계 파생 클래스: 상속을 받아 새롭게 만드는 클래스 = 자식 클래스, 서브 클래스 기반 클래스: 기능을 물려주는 클래스 = 부모 클래스, 슈퍼 클래스 `super._

Mini EDA Review_part 3
썸네일 이미지 출처: https://www.pinterest.co.kr/pin/299841287687472213/ 05 고찰 & 결론 (1) Heatmap Again 1) copy() 이전 포스트에서 범주를 재구성한 새로운 컬럼들이 있는데, 그 컬럼들의 원래 컬럼을 제거할 것이다. 하지만, 필자는 Heatmap으로 상관계수 비교를 하기 위해 (이전 포스트 마지막에서) 다음과 같은 작업을 하였다. dfn을 복사하여 dfn1에 저장하고 그 뒤에 dfn에서 'mortacc', 'pubrecbankruptcies', 'newsg' 컬럼들을 삭제하였다. 결과적으로 dfn1 에서는 'mortacc', 'pubrecbankruptcies', 'newsg' 세 컬럼이 삭제되지 않고 그대로 있고, df_n은 세 컬럼이 제거 되었다. 2) Helpful HEATMAP 먼저

[Data Science / EDA] 야, 너두 EDA 할 수 있어! (2 - 시각화 코드 작성하기 by Python)
정말 놀랍게도 이전 편이 존재하는 글이다. 블로그의 첫 글에 어떻게 1편이 존재할 수 있는지 궁금하시리라 믿고 확인하실 수 있게 링크를 걸어두도록 하겠다. --- 지난편에서 마저 다루지 못 한 나머지 라이브러리인 seaborn 에 대해서 다뤄보도록 하겠다. 우리가 화려해지기 위해선 갈 길이 멀기에 라이브러리 사용법은 빠르게 정리하고 넘어가야만 한다. 고로 최대한 기본만, 우리가 자주 사용할 만큼만 알고 넘어가려 한다. 더 심화적인 내용은 필요할 때마다 찾아보면서 진행하기로 하자. 라이브러리들을 파고 들기 시작하면 그것만으로도 논문 한 편을 쓸 수 있을테니 말이다... seaborn (API 레퍼런스) seaborn 은 matplotlib 을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능이 추가된 라이브러리