데브코스 40일차 - 데이터 웨어하우스 심화

데이터 웨어하우스, ETL, ELT, 데이터 파이프라인데이터 웨어하우스고정비용 옵션 (redshift)가변비용 옵션 (bigquery, 스노우 플레이크)데이터 레이크구조화 데이터 + 비구조화 데이터(로그 파일)보통 클라우드 스토리지가 됨데이터 레이크에 있는 정보를 정제

4일 전
·
0개의 댓글
·

:< [프로그래머스 MySQL] 물고기 종류 별 대어 찾기

https&#x3A;//school.programmers.co.kr/learn/courses/30/lessons/293261물고기 종류 별 가장 큰 사이즈의 물고기의 ID, FISH_NAME, LENGTH을 조회물고기 종류 별 가장 큰 사이즈를 조회하는 서브쿼리(FIS

2024년 4월 5일
·
0개의 댓글
·

데브코스 35일차 - 데이터 모델링(2)

평가/분석 방법문 같이 생긴 기호가 productsklearn.naive_bayes의 CaussianNB를 import 해 사용모델을 어떻게 평가할지, 기준을 정해야함회귀 평가 방법MSE (Mean Squared Error)오차 제곱의 평균오차값이 큰 데이터점(outl

2024년 4월 5일
·
0개의 댓글
·

데브코스 34일차 - 데이터 모델링 (1)

데이터 모델링, 회귀분석주어진 데이터에서 사용하고자 하는 x(feature, input, 독립변수), 알고싶은 값 y(label, output, 종속변수)이 있을 때 y=f(x)라는 함수를 통해서 x와 y의 관계를 설명할 수 있다면?y와 x의 관계를 효과적으로 설명하는

2024년 4월 4일
·
0개의 댓글
·

데브코스 31일차 - 데이터 분석, 스케일링

데이터분석, 스케일링나스닥 시총 상위 기업을 보면 제조업 → 서비스 기업으로의 경향을 보임아마존 → 구매 예측을 통한 추천데이터를 정리, 변환, 조작, 검사하여 인사이트를 만들어내는 작업의사 결정의 판단 기준이 ‘주관적인 직감’에서 ‘객관적인 데이터’로!단순한 분석보단

2024년 4월 1일
·
0개의 댓글
·

데브코스 30일차 - 문자열, 시계열, 데이터프레임 재구성

문자열 제어, 데이터프레임 재구성, 시계열 제어시리즈와 인덱스에 대한 벡터화 문자열 함수이다.반복문을 사용하지 않고 간단하게 문자열 데이터 처리 가능무조건 str을 사용하고 문자열 메소드를 실행str으로의 형변환 함수가 아니다!대문자, 소문자화pokemons\['Nam

2024년 3월 31일
·
0개의 댓글
·

데브코스 28일차 - 데이터프레임 기초, 활용

데이터프레임인덱싱 해서 단일 컬럼에 접근한다면 시리즈가 반환됨닷(.)을 이용해서 접근할 수도 있으나 이는 지향되지 않음member_df.shape 과 같은 함수와 혼동될 수 있음 (만약 column명이 shape라면)가로가 인덱스, 세로가 컬럼 명member_df =

2024년 3월 28일
·
0개의 댓글
·

데브코스 29일차 - 데이터프레임 심화

데이터 프레임pd.read_csv(”marketing_campaign.csv”, \*\*sep=’\\t’\*\*)디폴트는 쉼표인데 이 데이터셋은 탭으로 구분되어있어 구분자(sep)를 지정해줘야함customer.insert(1, ‘Age’, 2021-customer\[’

2024년 3월 28일
·
0개의 댓글
·

SQL 궁금점

이 문제에서 WHERE 절의 좌측에 HOUR() 함수를 사용하지 않고 어떻게 풀 수 있을까??

2024년 3월 8일
·
0개의 댓글
·

데브코스 15일차 - 실제 데이터 분석 사례

실제 데이터에 SQL을 이용해 데이터 분석 해보기인도 내 식당들의 정보식당 이름, 평점, 평균 가격, 패스트푸드 Y/N, 길거리 음식 Y/N 등데이터가 숫자 타입일 땐 히스토그램이 제공됨 (캐글에서)다른 사람들의 EDA(탐색적 데이터 분석)를 확인할 수 있음 → 어떤

2024년 3월 8일
·
0개의 댓글
·

데브코스 14일차 - 쿼리 작성 시 여러가지 팁들

쿼리 작성 시 효율 높이는 방법where로 테이블을 최대한 작게 만들어놓고 JOIN하기❗잘 모르는 테이블 사용시큰 데이터를 조회하거나 연산함으로써 생길 수 있는 비용 문제를 막고자 함임.LIMIT 걸고 조회하기행 수가 엄청난 데이터를 모두 조회하려할 때 비용이 엄청 클

2024년 3월 7일
·
0개의 댓글
·

데브코스 13일차 - 데이터 타입

데이터 타입, 숫자, 문자, 배열, 구조체BIT(M)컴퓨터가 데이터를 저장하는 기본 단위M이 4가 입력되면 비트 4개에 값을 담게됨TINYINIT매우 작은 정수256개만 표현 가능 (-127~127, 0~255(unsigned) → 8비트(2^8이므로) 사용)훨씬 더

2024년 3월 7일
·
0개의 댓글
·

데브코스 12일차 - SQL 문법

JOIN, UNION, WITH, Subquery, 조건절전환율 - 구매 수/클릭 수두 개 이상의 테이블을 특정 key 기준으로 결합하는 것테이블을 처음부터 합쳐놓으면 되는 것 아닌지?테이블을 쪼개두면 관리가 편리변경사항이 생겼을 때 수정 시간을 줄임중복되는 것을 막음

2024년 3월 5일
·
0개의 댓글
·

데브코스 11일차 - SQL, RDBMS

RDBMS, SQL 기초, DDL, DML데이터로 데이터 프로덕트(머신러닝 모델, 데이터 리포트)를 만들고자함데이터 베이스에서 원하는 데이터를 가져올 때 SQL을 사용SQL을 이용하면..원하는 형태로 데이터를 가져올 수 있다.효율적으로 데이터를 가져올 수 있다.간단한

2024년 3월 4일
·
0개의 댓글
·

[프로그래머스 SQL] 업그레이드 할 수 없는 아이템 구하기

https&#x3A;//school.programmers.co.kr/learn/courses/30/lessons/273712더이상 업그레이드 할 수 없는 아이템 조회하기처음엔 이렇게 작성했었다. parent_item_id에 있지 않는 데이터는 더이상 업그레이드를 할 수

2024년 2월 29일
·
0개의 댓글
·

:< [프로그래머스 sql] 조건에 맞는 개발자 찾기

푸념글이니,,, 참고하지 않으시는 걸 추천드립니다..https&#x3A;//school.programmers.co.kr/learn/courses/30/lessons/276034비트 연산을 이용했다.그리고 exists를 사용한다!exists를 여기서 처음봤는데, 너무 헷

2024년 2월 26일
·
0개의 댓글
·

MYSQL 정리

ORDER 내림차순 위와같이 컬럼명 뒤 DESC를 붙여 내림차순으로 정렬이 가능하다. IN 다중 컬럼 OR 위와같이 여러 칼럼에 동일한 문자인 'Python'이 있는지 확인해야한다면, 번거롭게 같은 패턴의 코드를 반복해 OR로 묶을 필요 없이 in을 사용하

2024년 2월 23일
·
0개의 댓글
·

프로그래머스 level 0 정리

range(2,n+1,2)로 짝수만 구할 수 있다.range는 iterable한 객체를 반환하므로 sum에 바로 넣을 수 있다.list.reverse()하면 반환 값 없이 list를 뒤집는다.list\[::-1]와 같이 슬라이싱에서 증가량을 이용한 방법이 있다.stri

2024년 1월 27일
·
0개의 댓글
·

[프로그래머스] 개인정보 수집 유효기간

https&#x3A;//school.programmers.co.kr/learn/courses/30/lessons/150370유효기간이 지났는지 확인하기자세한 설명은 링크에서 확인하세용정말 어떻게 풀어야할지 떠오르지않아서 하드코딩했다.유효기간은 모두 월 단위라니까 유효기

2024년 1월 24일
·
0개의 댓글
·

lambda, map 등

lambda lambda는 위와같이 표현된다. 그래서 함수를 한 줄로 줄여서 쓸 수 있다는 것. 람다는 sort에서 유용하게 사용된다. 1번의 경우엔 list의 각 원소의 길이에 따라 정렬이 가능하며, 2번의 경우 list의 각 원소의 첫번째 원소에 따라 정렬이

2024년 1월 24일
·
0개의 댓글
·