7장 53Boosting Algorithm_ 앙상블 기법 (1) 앙상블은 전통적으로 Voting, Bagging, Boosting, Stacking 등으로 나눔 (2) 보팅과 배깅은 여러 개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방식 (3) 보팅과 배깅의 차이점은 보팅은 각각 다른 분류기, 배깅은 같은 분류기를 사용 (4) 대표적인 배깅 방식...
4장 32수학의 기초 - 함수 2_ 자연상수 e (1) (1 + 1/x) ** x = e (2) 2.7182818로 수렴한다 시그모이드 그래프 (1) 발악을 해도 1과 0을 넘지 않는다. 5장 38Basic of Regression - OLS 실습_ formula formula = "y ~ x" -> y = ax + b 잔차 평가 residue (...
2장 11타이타닉 생존자분석 - EDA 2_ crosstab pd.crosstab(titanic["pclass"], titanic["survived"], margins=True) FacetGrid grid = sns.FacetGrid(titanic, row="pclass", col="sex", height=4, aspect=2) grid.map(plt....
1장 06데이터나누기 - Decision Tree를 이용한 Iris 분류 - 과적합_ 과적합 내가 가진 데이터에 너무 최적합이라서 내가 가진 데이터 이외에 일반적인 데이터에서 원래 성능이 못 나오거나 아예 틀린 값을 내놓는 경우 1장 07데이터나누기 - Decision Tree를 이용한 Iris 분류 - 데이터나누기_ 데이터 분리 과적합 여부 판정을 ...
3장 04퀵 테이블 계산(4) - YTD 총계, 연평균 성장률(CAGR)_ 연평균 성장률 =(최종연도값/최초연도값)^(1/연도간격)-1 3장 05계산된 필드(1) - 연산자_ 필드 데이터 원본에 존재하는 필드를 활용해 새로운 필드를 만듦 연산자 함수, 필드, 매개 변수 등을 연결하고 계산을 판단하는 요소 매개 변수 상수 값을 동적인 값으로 변경해주...
_Part 07. Tableau 1장 01_Digita Transformation 데이터 시각화 데이터에 색상과 모양 그리고 사람들의 시선을 끌 수 있는 요소를 배치해 데이터를 효과적이고 직관적으로 표현하는 것 효과적인 시각화 전달하고자 하는 메시지를 정하고 불필요한 부분은 생략 1장 02 태블로 이해_ 태블로 데이터를 분석 및 시각화하는 BI ...
기초 1~2 Part 08. 통계 01Introduce_ 기술통계학 데이터를 수집하고 수집된 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론 추론통계학 모집단으로부터 추출한 표본 데이터를 분석하여 모집단의 여러가지 특성을 추측하는 방법론 1장 02데이터의 이해_ 변수(Variable) 조사 목적에 따라 관측된 자료값을 변수라고 ...
Git 8~9 9장 03이론 - git tag_ tag 특정 버전(commit)에 tag를 달아놓을 필요가 있을 때 사용 현재 버전에 tag 달기 git tag (마지막 버전에 달린다.) 특정 버전에 tag 달기 git tag tag를 remote repository에 push git push origin tag 목록 보기 git tag tag...
Git 6 7장 03이론 - Git Log_ git log branch별 변경 이력을 볼 수 있음 7장 05이론 - Git Editor 설정, Git Diff_ --wait command line으로 vscode를 실행시켰을 경우 vscode 인스턴스를 닫을 때까지 command를 대기 (1) 예시 git config --global core.edi...
Git 1 Part 06. Git 11장 01이론 - 버전관리_ git (1) 버전관리(vcs, 형상관리) 시스템의 한 종류 버전관리를 하는 이유 (1) source data + history 관리 (2) 협업, 작업 추적, 복구 등이 가능 버전관리 시스템의 종류 (1) 중앙관리형(CVCS) : CVS, SVN (2) 분산관리형(DVCS) : Mer...
SQL 심화 9~10 17장 01Scalar Subquery_ 서브쿼리 (1) 하나의 SQL문 안에 포함되어 있는 또 다른 SQL문을 말한다. (2) 메인쿼리가 서브쿼리를 포함하는 종속적인 관계이다. (3) 서브쿼리는 메인쿼리의 컬럼 사용 가능 (4) 메인쿼리는 서브쿼리의 컬럼 사용 불가 서브쿼리 사용 시 주의점 (1) 서브쿼리는 괄호로 묶어서 사용 ...
SQL 심화 6 14장 07실습 - Foreign Key 예제_ 테이블 내 중복 없이 데이터 수 확인 (1) 예시 select count(distinct name) from police_station; 테이블 내 중복 없이 데이터 확인 (1) 예시 select distinct name from police_station; group by (1) 중복...
심화 1 11장 01이론 - AWS RDS 가입_ AWS RDS (1) AWS에서 제공하는 관계형 데이터베이스 서비스 (2) 클라우드 상에 데이터베이스를 구축해보자! 11장 08실습 - AWS RDS 혼자서 해봅시다(1~3번)_ AWS RDS 접속 (1) 예시 mysql -h "엔드포인트" -P 3306 -u 유저 -p 비밀번호 데이터베이스 만들기...
SQL 기초 10~11 8장 05실습 - UNION 예제3_ union, union all 주의 사항 (1) 컬럼의 수가 같더라도 컬럼명이 다르면 잘못된 데이터가 출력될 수 있으니 컬럼의 수와 이름도 같도록 해주자! 9장 01이론 - 실습환경 만들기_ 데이터 넣기 (1)예시 insert into snl_show...
SQL 기초 8~9 7장 12이론 - IN_ In 문법 (1) 목록 안에 조건이 존재하는 경우 TRUE 7장 15이론 - LIKE_ Like 문법 (1) 조건값이 패턴에 맞으면 TRUE (2) 예시 where column like pettern; 패턴 (1) "%가수", "가수%", "%가수%" (2) "_G%" : 두 번째 글자가 "G"인 데이터...
수요일부터 제로베이스 데이터스쿨에서 실시하는 EDA 테스트 1을 마무리하고 테스트 2를 열심히 하는 중인데, 난이도가 확 올라간 느낌을 받았다.
SQL 기초 4 5장 3 이론 - ORDER BY Oder by (1) Select 문에서 데이터를 특정 컬럼을 기준으로 오름차순 혹은 내림차순 정렬 (2) ASC : 오름차순 정렬 (3) DESC : 내림차순 정렬 (4) 예시 select column1, column2 from tablename order by column1, column2 AS...
인구분석 3 8 실습 - 카르토그램으로 인구현황 시각화하기 - 1 .stack( ) (1) nan값을 제외하고 인덱스별로 데이터를 정리한다. 9 실습 - 카르토그램으로 인구현황 시각화하기 - 2 plt.annotate( ) (1) 주석을 달기 위한 기능 10 ...
Naver API 1~2 3 실습 - Naver API 사용 urllib (1) http 프로토콜에 따라서 서버의 요청/응답을 처리하기 위한 모듈 (2) urllib.request : 클라이언트의 요청을 처리하는 모듈 (3) urllib.parse : url 주소에 대한 분석 5 실습 - Naver API에서 모은 몰스키...
유가분석 3 8 실습 - selenium 기초 - 4 검색어 입력 (1) XPATH (1) //*[@id="main_pack"]/section[2]/div/div[2]/panel-list/div/ul/li[1]/div/div/a (2) '//' : 최상위('query'를 찾기 위한 루트 중 최상위) (3) '*' : 자손 태그 (4) '/' : 자식 태...