# dataframe
[pandas] 기본 자료 구조
pandas는 기본적으로 Series(시리즈)와 DataFrame(데이터프레임) 이 두 가지가 핵심 자료구조다. >## 1. Series Series는 일련의 객체를 담을 수 있는 1차원 배열 같은 자료구조다. 그리고 index(색인)과 value(정보, 값)을 가
프로젝트1 : 서울시 CCTV 분석 1일차(~06)
Pandaspandas 는 통상 pd로 import하고수치해석적 함수가 많은 numpy(넘파이)는 통상 np로 import한다pandas의 데이터형을 구성하는 기본은 Series이다.index 와 value로 구성한가지 데이터 타입만 가질 수 있다.기본은 int 형 /
[DataFrame] SettingWithCopyWarning: shallow copy vs deep copy
판다스에서 데이터프레임을 전처리하다보면 다음과 같은 경고 메시지가 종종 발생한다.SettingWithCopyWarning:A value is trying to be set on a copy of a slice from a DataFrame.Try using .locro
Ch2 서울시 CCTV 현황 데이터 분석 01-11 (CCTV1-3)
서울시 구별 인구수 대비 CCTV 현황 그래프 그리기 #Python, Pandas 1) 서울시 구별 CCTV 현황 데이터 확보 2) 인구 현황 데이터 확보 3) CCTV 데이터와 인구 현황 데이터 합치기 4) 데이터를 정리하고 정렬하기 #Matplotlib 5) 그
판다스 기초 배우는 중 - 2월 23일
오티 2~3 [EDA/웹 크롤링/파이썬 프로그래밍] 16 이론 - colab 소개 구글 코랩 접속 (1) http://colab.research.google.com (2) 파일 - 새 노트 코드가 입력된 셀 실행 방법 (1) shift + enter (2) 또는 왼쪽 삼각형 모양의 플레이 버튼 선택 런타임 메뉴 이해하기 (1) 각 셀의 실행과 중단,...

📚 [Python] 데이터 전처리
데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조를 제공하는 모듈1차원, 1개의 column 은 Series라고 부름데이터 프레임: 가로축, 세로축이 있는 2차원의 다양한 타입 데이터를 저장하는 자료구조dict 형태의 데이터를 만들어주고 a

[TIL]DataFrame_ValueError: could not convert string to float: 'None' 해결
DataFrame object to numeric! 이 함수 모르는 사람 없게 해주세요

DataFrame 문자열을 구분자로 분리해 여러 칼럼으로 만드는 방법
DataFrame 안에 있는 문자열이 특정 기호를 기준으로 나열된 규칙을 가질 때, 기호를 구분자로 분리하여 여러 개의 칼럼으로 만드는 방법을 알아봅니다.Pandas의 str.split() 함수를 사용하여 각 문자열을 분할하고, expand=True 옵션을 사용하여 분

데이터 프레임 변경
· 딕셔너리로 받아서 처리· data.insert(index위치, column명, 들어갈 값)· data.drop(columns명, axis=, inplace=) axis = 0 행삭제 | axis = 1 열삭제 inplace = True 진짜 삭제 | False

[Dataframe]개수가 다른 list들 dataframe으로 만들기(ValueError : arrays must all be same length)
ValueError : arrays must all be same length 해결하기

005_파이썬 프로그래밍 입문 강의[python programming]
표준라이브러리_ 외부라이브러리 & pandas & numpy & broadcast & 얕은복사_깊은복사 & dataframe & 공공데이터포털

한국전력공사_전기에너지 데이터
한국전력공사에서 월별&법정동별 전기에너지소비량 데이터를 제공하고 있음을 확인하여 test를 진행함법정동주소 column에서 '리'까지 표시되어있음 & 시군구 column에서 공백이 존재함/ 법정동코드로 변환하기 위해 '리'를 제거함 & 공백을 제거함세종특별자치시의 경우
(1) CAN bus 프레임 형식 & 액세스
CAN BUS 장점, 특징 다시보는 CAN BUS 특징 호스트 PC없이 마이크로 컨트롤러나 디바이스들이 서로 통신하기 위해 설계됨 ECU들은 CAN 프로토콜을 사용하여 통신함 메시지 지향적 전송 프로토콜 사용 우선 순위 : 각 ECU는 고유한 ID 값을
[Spark] Spark SQL vs DataFrame API 둘 중 승자는..?
Spark SQL의 query를 통한 데이터 집계와 Dataframe의 API를 활용한 데이터 처리의 차이를 분석하고, 어떤 도구가 더 효율적인지 알아보자

pandas 대괄호 수에 따른 인덱싱 차이 - .loc DataFrame Series
우선 결론: 데이터프레임에서 특정 row를 추출하기 위해 .loc을 사용할 때, 괄호의 수에 따라 반환되는 값의 데이터타입이 달라진다.결과:결과를 보면, 1) 대괄호가 하나인 경우에는 해당 인덱스를 갖는 row의 데이터만 추출되어 Series타입으로 반환되고, 2) 대
Local Database 구축 (유실 데이터 해결)
유실되는 지번주소를 최대한 줄여 map2를 새로 생성함googlemaps API 이용하여 위도 경도 받기 -> kakaomap API 이용하여 hjdcode 받기전체 지번 주소: 4,199,281 개유실 되는 지번 주소: 218 개새로 생성한 map2를 이용하여 유실
[python / Pandas ] 데이터프레임(DataFrame)(0)
판다스(pandas)는 파이썬(python)을 이용한 데이터 분석 및 처리 작업에 필수 오픈소스 라이브러리입니다. 판다스(pandas)는 파이썬으로 실제 데이터 처리를 수행할 때 자주 언급됩니다. 파이썬을 이용하는 데이터 분석 작업에서 필수 라이브러리로 알려져 있습니다