프로그래머스 MySQL Lv.3 (1)

Journey to Data Analyst·2023년 4월 8일
0

프로그래머스 MySQL

목록 보기
4/7
post-thumbnail

이번주에 프로그래머스 Lv.3을 다 풀었기 때문에
이번에도 2개의 포스팅으로 나누어 업로드 해볼 생각이다.
역시 Lv.3에 들어오니 문제가 ㅎㄷㄷ하게 바뀌는 중인데...

같이 한번 알아보자! Let's Go~

1. 오랜 기간 보호한 동물(2)

문제 설명

ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, 
ANIMAL_IDANIMAL_TYPEDATETIMEINTAKE_CONDITIONNAMESEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.

NAMETYPENULLABLE
ANIMAL_IDVARCHAR(N)FALSE
ANIMAL_TYPEVARCHAR(N)FALSE
DATETIMEDATETIMEFALSE
INTAKE_CONDITIONVARCHAR(N)FALSE
NAMEVARCHAR(N)TRUE
SEX_UPON_INTAKEVARCHAR(N)FALSE

ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. 
ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_IDANIMAL_TYPEDATETIMENAMESEX_UPON_OUTCOME는 각각 동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. 
ANIMAL_OUTS 테이블의 ANIMAL_ID는 ANIMAL_INS의 ANIMAL_ID의 외래 키입니다.

NAMETYPENULLABLE
ANIMAL_IDVARCHAR(N)FALSE
ANIMAL_TYPEVARCHAR(N)FALSE
DATETIMEDATETIMEFALSE
NAMEVARCHAR(N)TRUE
SEX_UPON_OUTCOMEVARCHAR(N)FALSE

문제

입양을 간 동물 중, 보호 기간이 가장 길었던 동물 두 마리의 아이디와 이름을 조회하는 SQL문을 작성해주세요. 이때 결과는 보호 기간이 긴 순으로 조회해야 합니다.


예시

예를 들어, ANIMAL_INS 테이블과 ANIMAL_OUTS 테이블이 다음과 같다면

ANIMAL_INS

ANIMAL_IDANIMAL_TYPEDATETIMEINTAKE_CONDITIONNAMESEX_UPON_INTAKE
A354597Cat2014-05-02 12:16:00NormalArielSpayed Female
A362707Dog2016-01-27 12:27:00SickGirly GirlSpayed Female
A370507Cat2014-10-27 14:43:00NormalEmilySpayed Female
A414513Dog2016-06-07 09:17:00NormalRockyNeutered Male

ANIMAL_OUTS

ANIMAL_IDANIMAL_TYPEDATETIMENAMESEX_UPON_OUTCOME
A354597Cat2014-06-03 12:30:00ArielSpayed Female
A362707Dog2017-01-10 10:44:00Girly GirlSpayed Female
A370507Cat2015-08-15 09:24:00EmilySpayed Female

SQL문을 실행하면 다음과 같이 나와야 합니다.

ANIMAL_IDNAME
A362707Girly Girl
A370507Emily

※ 입양을 간 동물이 2마리 이상인 경우만 입력으로 주어집니다.


본 문제는 Kaggle의 "Austin Animal Center Shelter Intakes and Outcomes"에서 제공하는 데이터를 사용하였으며 ODbL의 적용을 받습니다.

Answer

SELECT B.ANIMAL_ID, B.NAME FROM ANIMAL_INS A
RIGHT JOIN ANIMAL_OUTS B
ON A.ANIMAL_ID = B.ANIMAL_ID
ORDER BY B.DATETIME - A.DATETIME DESC
LIMIT 2;

이번에는 입양을 간 동물 중, 보호기간이 가장 길었던 동물 "두 마리"의 아이디와 이름을 조회해야한다.

두 마리를 조회하는 것은 LIMIT 함수를 이용하여 쉽게 구할 수 있지만
"보호기간이 가장 긴"을 구하는 것이 좀 더 어려웠었다.
일단 위의 조건을 구해도 SELECT 문에 반영이 되지 않기 때문에 다른 방법을 생각해야했다.

그러다 다행히도 MySQL에서의 ORDER BY 함수는 SELECT 문에서 처럼
날짜를 뺄 수도 있다는 사실이 기억났다.
그러려면 2개의 날짜를 동시에 가져와야하기 때문에 JOIN을 하고
ORDER BY 에서 OUT 테이블의 날짜와 IN 테이블의 날짜를 빼주었다.

2. 조회수가 가장 많은 중고거래 게시판의 첨부파일 조회하기

문제 설명

다음은 중고거래 게시판 정보를 담은 USED_GOODS_BOARD 테이블과 중고거래 게시판 첨부파일 정보를 담은 USED_GOODS_FILE 테이블입니다. USED_GOODS_BOARD 테이블은 다음과 같으며 
BOARD_IDWRITER_IDTITLECONTENTSPRICECREATED_DATESTATUSVIEWS은 게시글 ID, 작성자 ID, 게시글 제목, 게시글 내용, 가격, 작성일, 거래상태, 조회수를 의미합니다.

Column nameTypeNullable
BOARD_IDVARCHAR(5)FALSE
WRITER_IDVARCHAR(50)FALSE
TITLEVARCHAR(100)FALSE
CONTENTSVARCHAR(1000)FALSE
PRICENUMBERFALSE
CREATED_DATEDATEFALSE
STATUSVARCHAR(10)FALSE
VIEWSNUMBERFALSE

USED_GOODS_FILE 테이블은 다음과 같으며 
FILE_IDFILE_EXTFILE_NAMEBOARD_ID는 각각 파일 ID, 파일 확장자, 파일 이름, 게시글 ID를 의미합니다.

Column nameTypeNullable
FILE_IDVARCHAR(10)FALSE
FILE_EXTVARCHAR(5)FALSE
FILE_NAMEVARCHAR(256)FALSE
BOARD_IDVARCHAR(10)FALSE

문제

USED_GOODS_BOARD와 USED_GOODS_FILE 테이블에서 조회수가 가장 높은 중고거래 게시물에 대한 첨부파일 경로를 조회하는 SQL문을 작성해주세요. 첨부파일 경로는 FILE ID를 기준으로 내림차순 정렬해주세요.
기본적인 파일경로는 /home/grep/src/ 이며, 게시글 ID를 기준으로 디렉토리가 구분되고, 파일이름은 파일 ID, 파일 이름, 파일 확장자로 구성되도록 출력해주세요. 조회수가 가장 높은 게시물은 하나만 존재합니다.


예시

USED_GOODS_BOARD 테이블이 다음과 같고

BOARD_IDWRITER_IDTITLECONTENTSPRICECREATED_DATESTATUSVIEWS
B0001kwag98반려견 배변패드 팝니다정말 저렴히 판매합니다. 전부 미개봉 새상품입니다.120002022-10-01DONE250
B0002lee871201국내산 볶음참깨직접 농사지은 참깨입니다.30002022-10-02DONE121
B0003goung12배드민턴 라켓사놓고 방치만 해서 팝니다.90002022-10-02SALE212
B0004keel1990디올 귀걸이신세계강남점에서 구입. 정품 아닐시 백퍼센트 환불1300002022-10-02SALE199
B0005haphli01스팸클래식 팔아요유통기한 2025년까지에요100002022-10-02SALE121

USED_GOODS_FILE 테이블이 다음과 같을 때

FILE_IDFILE_EXTFILE_NAMEBOARD_ID
IMG_000001.jpgphoto1B0001
IMG_000002.jpgphoto2B0001
IMG_000003.png사진B0002
IMG_000004.jpg사진B0003
IMG_000005.jpgphotoB0004

SQL을 실행하면 다음과 같이 출력되어야 합니다.

FILE_PATH
/home/grep/src/B0001/IMG_000001photo1.jpg
/home/grep/src/B0001/IMG_000002photo2.jpg

Answer

SELECT 
    CONCAT("/home/grep/src/", b.BOARD_ID, "/", f.FILE_ID, f.FILE_NAME, f.FILE_EXT)
    AS FILE_PATH
FROM USED_GOODS_BOARD b
JOIN USED_GOODS_FILE f
ON b.BOARD_ID = f.BOARD_ID
WHERE b.BOARD_ID = (SELECT b1.BOARD_ID FROM USED_GOODS_BOARD b1
                    ORDER BY b1.VIEWS DESC
                    LIMIT 1)
ORDER BY FILE_ID DESC;

일단 이 문제는 각 테이블에서 조회수가 가장 높은 중고거래 게시물에 대한 첨부파일 경로를 반환해야하는데 이를 반환하려면 드래곤볼 찾기 처럼 CONCAT으로 하나씩 결합해주는 것이 포인트라고 할 수 있겠다.

먼저 기본 경로는 /home/grep/src/라고 하였으니 그것을 입력해 준 다음
차례대로 파일 경로에 해당하는 것을 입력해준 다음
두 개의 테이블을 JOIN 해주었다.

그리고 이제 대망의 WHERE절인데 조회수가 가장 높은 게시물을 찾아야 하기 때문에 BOARD_ID 중에서 VIEWS가 가장 높은 것을 찾기 위해 Sub-Query로
작성해주었다.

3. 조건에 맞는 사용자 정보 조회하기

문제 설명

다음은 중고 거래 게시판 정보를 담은 USED_GOODS_BOARD 테이블과 중고 거래 게시판 첨부파일 정보를 담은 USED_GOODS_FILE 테이블입니다. USED_GOODS_BOARD 테이블은 다음과 같으며 
BOARD_IDWRITER_IDTITLECONTENTSPRICECREATED_DATESTATUSVIEWS는 게시글 ID, 작성자 ID, 게시글 제목, 게시글 내용, 가격, 작성일, 거래상태, 조회수를 의미합니다.

Column nameTypeNullable
BOARD_IDVARCHAR(5)FALSE
WRITER_IDVARCHAR(50)FALSE
TITLEVARCHAR(100)FALSE
CONTENTSVARCHAR(1000)FALSE
PRICENUMBERFALSE
CREATED_DATEDATEFALSE
STATUSVARCHAR(10)FALSE
VIEWSNUMBERFALSE

USED_GOODS_USER 테이블은 다음과 같으며 
USER_IDNICKNAMECITYSTREET_ADDRESS1STREET_ADDRESS2TLNO는 각각 회원 ID, 닉네임, 시, 도로명 주소, 상세 주소, 전화번호를 의미합니다.

Column nameTypeNullable
USER_IDVARCHAR(50)FALSE
NICKANMEVARCHAR(100)FALSE
CITYVARCHAR(100)FALSE
STREET_ADDRESS1VARCHAR(100)FALSE
STREET_ADDRESS2VARCHAR(100)TRUE
TLNOVARCHAR(20)FALSE

문제

USED_GOODS_BOARD와 USED_GOODS_USER 테이블에서 중고 거래 게시물을 3건 이상 등록한 사용자의 사용자 ID, 닉네임, 전체주소, 전화번호를 조회하는 SQL문을 작성해주세요.
이때, 전체 주소는 시, 도로명 주소, 상세 주소가 함께 출력되도록 해주시고, 전화번호의 경우 xxx-xxxx-xxxx 같은 형태로 하이픈 문자열(-)을 삽입하여 출력해주세요.
결과는 회원 ID를 기준으로 내림차순 정렬해주세요.


예시

USED_GOODS_BOARD 테이블이 다음과 같고

BOARD_IDWRITER_IDTITLECONTENTSPRICECREATED_DATESTATUSVIEWS
B0001dhfkzmf09칼라거펠트 코트양모 70%이상 코트입니다.1200002022-10-14DONE104
B0002lee871201국내산 볶음참깨직접 농사지은 참깨입니다.30002022-10-02DONE121
B0003dhfkzmf09나이키 숏패팅사이즈는 M입니다.400002022-10-17DONE98
B0004kwag98반려견 배변패드 팝니다정말 저렴히 판매합니다. 전부 미개봉 새상품입니다.120002022-10-01DONE250
B0005dhfkzmf09PS4PS5 구매로인해 팝니다.2500002022-11-03DONE111

USED_GOODS_USER 테이블이 다음과 같을 때

USER_IDNICKNAMECITYSTREET_ADDRESS1STREET_ADDRESS2TLNO
dhfkzmf09찐찐성남시분당구 수내로 13A동 1107호01053422914
dlPcks90썹썹성남시분당구 수내로 74401호01034573944
cjfwls91점심만금식성남시분당구 내정로 185501호01036344964
dlfghks94희망성남시분당구 내정로 101203동 102호01032634154
rkdhs95용기성남시분당구 수내로 23501호01074564564

SQL을 실행하면 다음과 같이 출력되어야 합니다.

USER_IDNICKNAME전체주소전화번호
dhfkzmf09찐찐성남시 분당구 수내로 13 A동 1107호010-5342-2914

Answer

SELECT USER_ID, NICKNAME, 
       CONCAT(CITY, ' ', STREET_ADDRESS1, ' ', STREET_ADDRESS2) AS 전체주소,
       CONCAT(LEFT(TLNO, 3), '-', SUBSTR(TLNO, 4, 4), '-', RIGHT(TLNO, 4)) AS 전화번호
FROM USED_GOODS_USER
WHERE USER_ID IN (SELECT WRITER_ID FROM USED_GOODS_BOARD
                 GROUP BY 1
                 HAVING COUNT(*) >= 3)
ORDER BY USER_ID DESC;

이번에는 각 테이블에서 중고거래를 3회 진행한 사람의 정보를 반환하는 쿼리를 작성하는 것이었다.
먼저 USER_IDNICKNAME은 동일하게 반환하면 되지만 전체주소 & 전화번호는 역시 CONCAT함수를 사용하여 결합된 텍스트로 반환해야되는 문제였다.

여기서는 전화번호가 관건인데 원래 있던 전화번호 column에서 -를 포함하여 반환해야하기 때문에 문자열 추출에 대한 함수를 모두 사용하였다.
- 문자열을 왼쪽부터 지정한 숫자의 개수만큼 반환하는 LEFT
- 문자열을 지정한 숫자에 해당하는 글자부터 그 다음 지정한 숫자의 갯수만큼 반환하는 SUBSTR
- 문자열을 오른쪽부터 지정한 숫자의 개수만큼 반환하는 RIGHT
이렇게 모두 사용해준 다음 CONCAT으로 결합할 때 중간에 -을 첨가해주었다.

그리고 마지막으로 조건절에서 각 아이디 별로 중고거래를 3번 이상한 사람을 찾아야 하기 때문에 USER_IDWRITER_ID로 그룹핑하였을 때 중고거래를 3번 이상한 사람에 포함되어있는지 알아볼 수 있는 IN 서브쿼리를 활용하였다.

다음에는 Lv.3 2탄으로 돌아오겠다!

profile
성장하는 주니어 데이터 분석가(Tableau, SQL and Python)

0개의 댓글