[프로그래머스] 베스트앨범(Python)

jisoolee·2023년 3월 29일
0

코딩 테스트

목록 보기
8/10
post-thumbnail

문제

문제 설명
스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

속한 노래가 많이 재생된 장르를 먼저 수록합니다.
장르 내에서 많이 재생된 노래를 먼저 수록합니다.
장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.
노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.

해결 과정

해시 테이블을 이용했습니다.

1트(성공)

속한 노래가 많이 재생된 장르 -> 장르 내에서 많이 재생된 노래 -> 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래 순으로 정렬 한 후 한 장르 내에서 최대 2개씩 만을 뽑아 최종 리스트에 모두 넣은 후 고유 번호만을 반환하도록 하는 방법을 생각했습니다.

  1. 장르의 재생된 수를 해시 테이블로 정리합니다.(key: 장르, value: 재생된 수)
  2. value를 기준으로 내림차순 정리하여 많이 재생된 장르의 순서대로 리스트에 담습니다.
  3. 각각의 고유번호, 장르, 플레이 수를 담은 리스트를 만듭니다.
  4. 많이 재생된 장르의 순서 리스트를 순차적으로 실행하며 각각의 고유번호, 장르, 플레이 수를 담은 리스트 에서 해당 장르를 가진 것만 추출합니다.
  5. 추출 값의 길이가 2보다 작거나 같으면 추출 값 모두를 최종 리스트에 넣습니다.
  6. 2보다 크다면 장르 내에서 많이 재생된 노래 -> 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래순으로 정렬 후 제일 앞 2개의 값만 최종 리스트에 넣습니다.
  7. 최종 리스트엣 고유 번호만을 추출하여 반환합니다.

Code

def solution(genres, plays):
    g_p_cnt = {}
    for g, p in zip(genres, plays):
        if g not in g_p_cnt:
            g_p_cnt[g] = p
        else:
            g_p_cnt[g] += p
            
    g_p_cnt_list = sorted(g_p_cnt.items(), key = lambda x: x[1], reverse=True)
    
    g_p = []
    for i, (g, p) in enumerate(zip(genres, plays)):
        g_p.append((i, g, p))
    
    result = []
    for genre, play in g_p_cnt_list:
        g_list = []
        for g in g_p:
            if g[1] == genre:
                g_list.append(g)
        g_list.sort(key = lambda x: (-x[2], x[0]))
        if len(g_list) <= 2:
            result.extend(g_list)
        else:
            result.extend(g_list[:2])
        
    ans = [r[0] for r in result]
        
    return ans

주의사항

g_p_cnt_list에서 정렬되는 값은 g_p_cnt.items()입니다. g_p_cnt를 정렬한다면 key값 문자열[1] 기준으로 정렬됩니다.(문제에서는 value를 기준으로 정렬해야 함)

위 코드의 시간복잡도는 O(nlogn) 입니다.

0개의 댓글