[Python]해시: 베스트앨범

코드싸개·2021년 1월 13일

programmers

목록 보기

4/20

문제 설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

속한 노래가 많이 재생된 장르를 먼저 수록합니다.
장르 내에서 많이 재생된 노래를 먼저 수록합니다.
장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

genres[i]는 고유번호가 i인 노래의 장르입니다.
plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
장르 종류는 100개 미만입니다.
장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
모든 장르는 재생된 횟수가 다릅니다.

입출력 예

genres	plays	return
["classic", "pop", "classic", "classic", "pop"]	[500, 600, 150, 800, 2500]	[4, 1, 3, 0]

입출력 예 설명

classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.

고유 번호 3: 800회 재생
고유 번호 0: 500회 재생
고유 번호 2: 150회 재생

pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.

고유 번호 4: 2,500회 재생
고유 번호 1: 600회 재생

따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.

내 코드

첫 번째 시도

def solution(genres, plays):
    answer = []
    gen_play_idx = dict()
    total_gen_play = dict()

    for i in range(len(genres)):
        if genres[i] not in gen_play_idx:
            gen_play_idx[genres[i]] = [(plays[i], i)]
            total_gen_play[genres[i]] = plays[i]
        else:
            gen_play_idx[genres[i]].append((plays[i], i))
            total_gen_play[genres[i]] += plays[i]
    sorted_total_gen_play = sorted(total_gen_play.items(), reverse=True)

    for key in sorted_total_gen_play:
        song_list = gen_play_idx[key[0]]
        song_list = sorted(song_list, reverse=True)
        for i in range(len(song_list)):
            if i == 2:
                break
            answer.append(song_list[i][1])
    return answer

테스트 1 〉 실패 (0.01ms, 10.4MB)
테스트 2 〉 실패 (0.01ms, 10.3MB)
테스트 3 〉 통과 (0.01ms, 10.3MB)
테스트 4 〉 통과 (0.01ms, 10.3MB)
테스트 5 〉 실패 (0.08ms, 10.3MB)
테스트 6 〉 실패 (0.08ms, 10.1MB)
테스트 7 〉 실패 (0.04ms, 10.3MB)
테스트 8 〉 실패 (0.04ms, 10.3MB)
테스트 9 〉 실패 (0.02ms, 10.2MB)
테스트 10 〉 실패 (0.08ms, 10.2MB)
테스트 11 〉 실패 (0.02ms, 10.2MB)
테스트 12 〉 실패 (0.05ms, 10.2MB)
테스트 13 〉 실패 (0.08ms, 10.1MB)
테스트 14 〉 실패 (0.08ms, 10.3MB)
테스트 15 〉 실패 (0.02ms, 10.4MB)
정확성: 13.3
합계: 13.3 / 100.0

테스트 케이스를 추가해서 체크해보았다.

genres	plays	return
["classic", "pop", "classic", "classic", "pop"]	[500, 600, 150, 800, 2500]	[4, 1, 3, 0]
["classic", "pop", "classic", "classic", "pop"]	[500, 600, 500, 800, 2500]	[4, 1, 3, 0]

두 번째 테스트 케이스 처럼 같은 장르 내에서 동일한 플레이 횟수가 있으면 3번 조건에 따라 고유 번호가 낮은 노래를 먼저 수록해야하는데, 인덱스 2번 곡이 수록되어 [4, 1, 3, 2]의 결과가 출력되어서 그런 것 같다.
song_list = sorted(song_list, reverse=True)
이 코드를 수정하면 제대로 될 것 같다.

두 번째 시도

~~song_list = sorted(song_list, reverse=True)~~ 를
song_list = sorted(song_list, key=lambda x: (-x[0], x[1])) 로 수정하였다.

def solution(genres, plays):
    answer = []
    gen_play_idx = dict()
    total_gen_play = dict()

    for i in range(len(genres)):
        if genres[i] not in gen_play_idx:
            gen_play_idx[genres[i]] = [(plays[i], i)]
            total_gen_play[genres[i]] = plays[i]
        else:
            gen_play_idx[genres[i]].append((plays[i], i))
            total_gen_play[genres[i]] += plays[i]
    sorted_total_gen_play = sorted(total_gen_play.items(), reverse=True)

    for key in sorted_total_gen_play:
        song_list = gen_play_idx[key[0]]
        song_list = sorted(song_list, key=lambda x: (-x[0], x[1]))
        for i in range(len(song_list)):
            if i == 2:
                break
            answer.append(song_list[i][1])
    return answer

테스트 1 〉 실패 (0.01ms, 10.4MB)
테스트 2 〉 실패 (0.01ms, 10.3MB)
테스트 3 〉 통과 (0.01ms, 10.3MB)
테스트 4 〉 통과 (0.01ms, 10.3MB)
테스트 5 〉 실패 (0.08ms, 10.3MB)
테스트 6 〉 실패 (0.08ms, 10.1MB)
테스트 7 〉 실패 (0.04ms, 10.3MB)
테스트 8 〉 실패 (0.04ms, 10.3MB)
테스트 9 〉 실패 (0.02ms, 10.2MB)
테스트 10 〉 실패 (0.08ms, 10.2MB)
테스트 11 〉 실패 (0.02ms, 10.2MB)
테스트 12 〉 실패 (0.05ms, 10.2MB)
테스트 13 〉 실패 (0.08ms, 10.1MB)
테스트 14 〉 실패 (0.08ms, 10.3MB)
테스트 15 〉 통과 (0.02ms, 10.4MB)
정확성: 20.0
합계: 20.0 / 100.0

하나 더 통과한 것 밖에 차이가 없다...
장르의 종류가 100개 미만이라고 했는데, 어쩌면 장르의 문제일 것 같다.

genres	plays	return
["classic", "pop", "hiphop", "classic", "pop"]	[500, 600, 1400, 800, 2500]	[4, 1, 2, 3, 0]

hiphop장르로 바꾸고 테스트를 돌렸는데 "테스트를 통과하였습니다." ... 이 문제가 아니였다.

세 번째 시도

genres	plays	return
["classic", "pop", "classic", "classic", "pop"]	[500, 500, 500, 500, 500]	[0, 2, 1, 4]

이번에는 모든 play 값을 500으로 놓고 해보았다.
실행한 결괏값 [1,4,0,2]이(가) 기댓값 [0,2,1,4]와(과) 다릅니다. 응? 파이참으로 디버깅을 해보자.

sorted_total_gen_play 에서 'classic'이 1500인데도 pop이 먼저 나와있다. 여기도 위에 했던 것 처럼 lambda를 넣어서 정리해볼 수 있을 것 같다.
~~sorted_total_gen_play = sorted(total_gen_play.items(), reverse=True)~~ 를
sorted_total_gen_play = sorted(total_gen_play.items(), key=lambda x: -x[1]) 로 수정

def solution(genres, plays):
    answer = []
    gen_play_idx = dict()
    total_gen_play = dict()

    for i in range(len(genres)):
        if genres[i] not in gen_play_idx:
            gen_play_idx[genres[i]] = [(plays[i], i)]
            total_gen_play[genres[i]] = plays[i]
        else:
            gen_play_idx[genres[i]].append((plays[i], i))
            total_gen_play[genres[i]] += plays[i]
    sorted_total_gen_play = sorted(total_gen_play.items(), key=lambda x: -x[1])

    for key in sorted_total_gen_play:
        song_list = gen_play_idx[key[0]]
        song_list = sorted(song_list, key=lambda x: (-x[0], x[1]))
        for i in range(len(song_list)):
            if i == 2:
                break
            answer.append(song_list[i][1])
    return answer

드디어 통과...
정확성: 100.0
합계: 100.0 / 100.0

다른 사람의 생각

def solution(genres, plays):
    genres_dict = {}
    genres_list = []
    for i in range(len(genres)):
        if genres[i] not in genres_dict:
            genres_dict[genres[i]] = []
        genres_dict[genres[i]].append([i, plays[i]])

    for g in genres_dict:
        genres_dict[g].sort(key=lambda x: x[1], reverse=True)
        genres_list.append([g, sum([play for _, play in genres_dict[g]])])

    genres_list.sort(key=lambda x: x[1], reverse=True)
    answer = []
    for g, _ in genres_list:
        answer.extend([x[0] for x in genres_dict[g][:2]])
    return answer

나는 튜플로 만들어서 딕셔너리에 넣었는데 이 코드는 리스트를 딕셔너리에 넣는다. 위에 첫 번째 for 문에서 장르를 키로 두고 밸류에 인덱스와 플레이 수로 이루어진 리스트를 넣는다. 두 번째 for 문에서 genres_list에 각 장르당 합계를 구해서 넣는다. 그리고 마지막 for 문에서 상위 2개의 인덱스 값을 넣는다.