https://school.programmers.co.kr/learn/courses/30/lessons/151141길게도 썼다. 처음 생각했던 구성에서 오류난 걸 고치고 고치다보니 이렇게까지 길어졌다.처음엔 7일 이하의 렌트에 대해선 할인이 적용되지 않기 때문
https://school.programmers.co.kr/learn/courses/30/lessons/276036위 문제를 풀다가 난관에 봉착했다.개발자 별로 스킬을 확인해야하기에, group by를 사용해야하는데 그 안에서 등급 지정을 위해 case문을 써
코테 연습을 하다가 갑작스레 궁금해졌다.group by절은 select보다 먼저 실행되는데 어떻게 alias를 사용해도 되지?대답은,, mysql에서 가능한 것이라고 한다. 즉 DBMS가 알아서 처리해준다는 말씀사실 내가 궁금했던건 따로 있는데, 바로 group by
sql에서 재귀를 쓰는 방법이다!나는 해당 문제를 풀 때, 하드코딩(?)을 사용했는데 다른 사람들이 푼 걸 보니 재귀를 사용하길래 찾아봤다.기본 구조는 위와 같다.UNION ALL 윗 부분이 비재귀 부분이며 초기값을 설정한다.UNION ALL을 통해서 위와 아래 쿼리를
RANK 함수는 말 그대로 순위를 매기는 함수이다. RANK() OVER(\[PARTITION BY COLUMN_1] ORDER BY COLUMN_2 \[DESC])위와 같이 사용되는데, 여기서 파티션은 그룹별로 그룹 내에서 랭킹을 매길 때 사용한다.나같은 경우는 해당
딥러닝, CNN, RNN학습을 통해 (사람처럼) 예측을 진행 → 어떻게 학습? (사람의 인지과정)사람의 신경망(사람을 모방)을 기반으로 학습과 추론을 진행하는 학문사람의 신경 구조는 뉴런을 기본 단위로 함 (뉴런 → 신경계)뉴런을 모방한 퍼셉트론을 수학적으로 모델링.
k-means clusteringK-평균 군집화전체 데이터를 K개의 덩어리(클러스터)로 나누는 비지도 학습법각 클러스터의 좌표 값의 평균으로 중심을 정할 수 있음로이드 알고리즘 vs 엘칸 알고리즘(거리 계산시 삼각 부등식 사용)순서초기화K개의 클러스터 중심점(최종 결과
SVM, Decision Tree, 비지도학습각 클래스의 데이터 샘플로부터 거리(마진)가 가장 멀리 위치해있다 → 일반화 성능이 좋다마진을 구성하는 데이터 포인트를 서포트 벡터 라고 함SVM의 경우 마진을 최대화하는 최적 직선(최대 마진 초평면)을 만드는 것이 목적임최
사이킷런사이킷런: 다양한 머신러닝 알고리즘이 구현되어있는 오픈소스 패키지데이터 처리, 파이프라인, 학습 알고리즘, 전/후 처리 등 다양한 기능객체 메소드Estimator: fit()으로 학습 진행Predictor: predict()로 예측 수행Transformer: t
sql 문제를 풀면서 알게된 것들을 정리하는 페이지이다.mysql에선 binary 문자열을 지원하는데, 이를 사용하면 대소문자를 구분할 수 있다.문자가 아닌 바이트 기준으로 비교할 수 있음테이블 생성시 해당 컬럼을 varbinary을 사용BINARY 함수 혹은 BINA
https://school.programmers.co.kr/learn/courses/30/lessons/59041동명의 동물 수 세기 (두 번 이상)이름이 없는 동물은 집계에서 제외설명 그대로 동명의 동물 수를 세기 위해 name으로 group by해 coun
머신러닝, 선형대수, 확률머신러닝이란?데이터에서 지식을 추출. 머신 스스로가 데이터의 특징과 패턴을 찾아냄명시적 프로그래밍의 한계를 극복할 수 있는 기법인공지능: (단순히) 기계가 사람의 지적 능력을 모방하는 것어떻게 할 것이냐? → 학습을 통해 예측을 진행 (머신러닝
데이터 웨어하우스, ETL, ELT, 데이터 파이프라인데이터 웨어하우스고정비용 옵션 (redshift)가변비용 옵션 (bigquery, 스노우 플레이크)데이터 레이크구조화 데이터 + 비구조화 데이터(로그 파일)보통 클라우드 스토리지가 됨데이터 레이크에 있는 정보를 정제
https://school.programmers.co.kr/learn/courses/30/lessons/293261물고기 종류 별 가장 큰 사이즈의 물고기의 ID, FISH_NAME, LENGTH을 조회물고기 종류 별 가장 큰 사이즈를 조회하는 서브쿼리(FIS
평가/분석 방법문 같이 생긴 기호가 productsklearn.naive_bayes의 CaussianNB를 import 해 사용모델을 어떻게 평가할지, 기준을 정해야함회귀 평가 방법MSE (Mean Squared Error)오차 제곱의 평균오차값이 큰 데이터점(outl
데이터 모델링, 회귀분석주어진 데이터에서 사용하고자 하는 x(feature, input, 독립변수), 알고싶은 값 y(label, output, 종속변수)이 있을 때 y=f(x)라는 함수를 통해서 x와 y의 관계를 설명할 수 있다면?y와 x의 관계를 효과적으로 설명하는
데이터분석, 스케일링나스닥 시총 상위 기업을 보면 제조업 → 서비스 기업으로의 경향을 보임아마존 → 구매 예측을 통한 추천데이터를 정리, 변환, 조작, 검사하여 인사이트를 만들어내는 작업의사 결정의 판단 기준이 ‘주관적인 직감’에서 ‘객관적인 데이터’로!단순한 분석보단
문자열 제어, 데이터프레임 재구성, 시계열 제어시리즈와 인덱스에 대한 벡터화 문자열 함수이다.반복문을 사용하지 않고 간단하게 문자열 데이터 처리 가능무조건 str을 사용하고 문자열 메소드를 실행str으로의 형변환 함수가 아니다!대문자, 소문자화pokemons\['Nam
데이터프레임인덱싱 해서 단일 컬럼에 접근한다면 시리즈가 반환됨닷(.)을 이용해서 접근할 수도 있으나 이는 지향되지 않음member_df.shape 과 같은 함수와 혼동될 수 있음 (만약 column명이 shape라면)가로가 인덱스, 세로가 컬럼 명member_df =
데이터 프레임pd.read_csv(”marketing_campaign.csv”, \*\*sep=’\\t’\*\*)디폴트는 쉼표인데 이 데이터셋은 탭으로 구분되어있어 구분자(sep)를 지정해줘야함customer.insert(1, ‘Age’, 2021-customer\[’