문제 설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.제한사항
- 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
- 논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
def solution(citations):
citations.sort(reverse=True)
answer=0
for i in range(len(citations)):
answer=max(answer, min(i+1, citations[i]))
return answer
# 6 5 3 1 0
# 6, i1
# 5, i2
# 3, i3
# 1, i4
class Solution {
public int solution(int[] citations) {
int[] count=new int[10001];
int start=0;
int end=0;
int answer=0;
for(int i:citations){
end=Math.max(end, i);
count[i]++;
}
for(int i=1; i<count.length; i++)
count[i]+=count[i-1];
while(start<end){
int mid=(start+end)/2;
int upper=count[10000]-count[mid-1];
if(mid>upper)
end=mid;
else if(mid==upper){
answer=mid;
break;
}
else{
answer=mid;
start=mid+1;
}
}
return answer;
}
}
자바로 먼저 풀었는데, H의 수에 대해 H번 이상 인용된 논문의 수를 얻기 위해 Counting Sort를 했다. H번 이상이면 전체 논문 수에서 h-1 인덱스의 수를 빼면 된다. 그 후 0부터 주어진 최대 인용 횟수까지 Binary Search를 했다. O(n+m) + O(log n)이 걸렸으므로 메모리를 좀더 써서 시간을 적게 사용했다.
사실 그냥 내림차순 정렬해놓고 현재 인덱스 논문의 인용된 횟수와 현재의 인덱스를 비교하면 O(nlog n) + O(n) 으로도 되는 문제였다...