# Data Analysis

111개의 포스트
post-thumbnail

1-1 데이터모델링의 이해

sqld 데이터 모델링의 이해

2023년 5월 14일
·
0개의 댓글
·
post-thumbnail

Amazon review dataset(Shoes Category) 에서 봄(3~6) 시즌 신발 랭킹 분석하기

이번에 Amazon review dataset를 여러가지 방면으로 분석하는 프로젝트를 진행하다가 Pandas 모듈에 대해서 한번 정리하고 가야겠다라는 생각을 하게 되었다. 이번 포스팅에서는 저번에 다운로드한 Amazon_shoes_reviews.tsv 데이터셋에서 20

2023년 4월 4일
·
0개의 댓글
·
post-thumbnail

Python Pandas 로 Amazon review dataset 파싱하기

Before 저번 포스팅에서는 wget을 사용해 amazon dataset tsv 파일을 다운로드하는 것까지 진행했다. 이번에는 Python Pandas를 사용해 amazon review 중 Shoes category에 해당하는 review들을 파싱해보자. 이번에는

2023년 3월 31일
·
0개의 댓글
·

Amazon review dataset 다운로드 방법

대학교 자료구조 수업에서 과제로 Amazon 사에서 제공하는 Amazon review dataset을 파싱해서 데이터를 다루는 프로젝트를 진행했었다. Amazon에서 이런 dataset을 제공하는 줄 모르고 있었는데 data의 column들이 흥미롭고 이를 가지고 Ka

2023년 3월 31일
·
0개의 댓글
·
post-thumbnail

Seaborn 데이터 시각화/histplot

seaborn.histplot 정리

2023년 3월 20일
·
0개의 댓글
·

Seaborn 데이터 시각화 세팅

Seaborn 이용한 데이터 시각화 코드 정리

2023년 3월 15일
·
0개의 댓글
·
post-thumbnail

서울 시내 대중교통 정류장 밀집도 도식화

공공데이터를 이용한 대중교통 정류장의 위치 도식화

2023년 3월 14일
·
0개의 댓글
·
post-thumbnail

Paper Review #7 - A Dual-Path Cross-Modal Network for Video-Music Retrieval

Gu, X., Shen, Y., & Lv, C.,"A Dual-Path Cross-Modal Network for Video-Music Retrieval", Sensors, 23(2), pp.805, 2023 본 논문에서는 감정적인 정보와 컨텐츠 정보를 통합해 du

2023년 3월 12일
·
0개의 댓글
·
post-thumbnail

Data analysis of Titanic survivors and dead people

벌써 2번째 포스팅이 되겠다. 다시 한번더 언급하지만 이 글은 내 자신이 데이터분석 능력을 키우기위해 공부를 하기위해 기초적인 요소를 통해 공부한 기록을 남기기 위해 작성한다.이전글 에서는 식용버섯과 독버섯을 구분할만한 범주(독립변수)를 데이터시각화를 통해서 확인을 해

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

Data analysis of edible mushrooms and poisonous mushrooms. (ft.Pandas,seaborn,matplot.pyplot)

시작하기 앞서 이 포스팅은 데이터 분석에 있어서 가장 기초적인 공부를 다시 복습을 하는 차원에서 작성됨을 알립니다.'''''' pandas와 seaborn은 데이터를 시각화하는데 중요하기 때문에 꼭 분석하기전에 불러오고, numpy는 숫자가 들어가는 데이터에 분석하기에

2023년 2월 27일
·
0개의 댓글
·

Ch 7. 데이터 준비하기: 다듬기, 변형, 병합

python for data analysis 책의 7장을 참고하여 작성하였습니다데이터 만들기중복 제거하기(기본)특정 컬럼을 기준으로 중복 제거하기중복 제거 시 마지막 값을 남기기import pandas as pddata=pd.DataFrame({'food':'bac',

2023년 2월 2일
·
0개의 댓글
·

판매 전략

이미 고른 제품보다 더 비싸고 더 좋은 버전을 사게 하는 것업그레이드의 관점예) 아반떼 풀옵션 살 바엔 그랜드를 사는 게 …관련된 다른 상품을 구매하는 것아예 다른 구매를 유도예) 아이폰을 사려고 봤더니 애플 워치도 있으면 좋을 것 같고.. 에어팟.. 아니 에어맥스?

2023년 1월 31일
·
0개의 댓글
·

퍼널 분석(Funnel Analysis)

서비스를 개선하려할 때 ‘뭐부터 개선해야 하지?’ 의문점이 들 때 사용하면 좋다. 일반적으로 사용자가 서비스를 이용할 때 서비스 진입 후 최종 핵심 기능을 사용하기까지 각 단계를 거치면서 점점 이탈하게 되는데 이 단계를 구분해 서서히 좁아지는 형태구조를 퍼널(funne

2023년 1월 31일
·
0개의 댓글
·

Ch9 데이터 수집과 그룹연산

본 게시물은 python for Data analysis 책을 참고하여 작성하였다.데이터를 'key1', 'key2'로 묶고 각 그룹에서 data1의 평균 구하기unstack:옆으로 펼친다더 자세한 코드: https://github.com/jeonhyolim/

2023년 1월 30일
·
0개의 댓글
·
post-thumbnail

[Python] pandas IF-Else 조건문 5가지 방법

Python pandas 라이브러리의 if-else 조건문을 적용하는 방법을 binary or multiple condition에 따라서 5가지로 정리한 내용입니다.

2023년 1월 21일
·
0개의 댓글
·

데이터 기반 의사결정이 중요해진 이유

비즈니스 의사결정을 잘 내리기 위해 데이터 활용은 필수적이다. 비즈니스 영역에서 데이터의 중요도가 점차 높아지고 있는 이유이다.데이터 기반 의사결정이 중요해진 이유를 알기 위해서는 데잍를 잘 활용하지 않았던 과거의 비즈니스에 대해 먼저 살펴볼 필요가 있다.두 번째 이유

2023년 1월 17일
·
0개의 댓글
·

RFM 분석

매출 기여도의 분산을 최대화 하는 가중치를 계산한다.가중치와 RFM 점수를 이용하여 고객별로 등급을 부여한다.등급별 매출 기여도를 확인한다.RFM 분석은 CRM(고객 관계 관리) 분야에서 고객의 가치를 분석하는데 사용되는 분석방법이다.Recency : 얼마나 최근에 구

2023년 1월 3일
·
0개의 댓글
·
post-thumbnail

12월 TIL

12월 TIL

2022년 12월 13일
·
0개의 댓글
·

Today I Learned(20221114)

SQL 2주차 짱바쁨.. 그래도 퇴근하고 공부하는 뿌듯함..!! Group By & Order By users를 name 기준으로 묶어줘라 group by 안에 카운트를 사용하면 name으로 묶이는 애들의 숫자를 세줘라

2022년 11월 14일
·
0개의 댓글
·

TodayILearne(20221109)

현재 근무중에 SQL사용중이라 큰 어려움은 없었음.그러나 정통으로 배운적이 없어서 정리하는데에는 좋은 경험limitdistinct등의 보조 함수들을 배움

2022년 11월 9일
·
0개의 댓글
·