똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다. 재사용은 빠르고 세련되다.
//불필요한 객체 생성을 하는 극단적인 예
String name1=new String("beobsik");
String name2=new String("beobsik");
//객체 비교
System.out.println(name1==name2);
//객체 내용 비교
System.out.println(name1.equals(name2));
false
true
위의 코드의 출력결과를 보면 같은 문자열을 가지는데 name1
객체와 name2
객체가 서로 다른 String
인스턴스인 것을 알 수 있다. 즉, 위와 같이 코딩을 하면 해당 코드가 실행될 때마다 새로운 객체를 만들어내는 것이다. 완전히 쓸데없는 행위이다.
//올바른 예
String name3="beobsik";
String name4="beobsik";
//객체 비교
System.out.println(name3==name4);
//객체 내용 비교
System.out.println(name3.equals(name4));
true
true
위의 코드의 출력결과를 보면 같은 문자열을 가지는 name3
객체와 name4
객체가 서로 같은 String
인스턴스인 것을 알 수 있다. 이 방식을 사용한다면 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.
Boolean true1=Boolean.valueOf("true");
Boolean true2=Boolean.valueOf("true");
//객체 비교
System.out.println(true1==true2);
//객체 내용 비교
System.out.println(true1.equals(true2));
true
true
위 코드의 출력결과를 보면 Boolean
클래스에서 제공하는 valueOf()
정적 팩터리 메소드를 사용해서 생성한 객체는 서로 같은 객체들인 것을 알 수 있다. 생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 전혀 그렇지 않다. 불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 않다면 재사용하면 된다.
생성 비용이 아주 비싼 객체가 더러 있다. 비싼 객체가 반복해서 필요하다면 캐싱하여 재사용하는 것을 권장한다.
static boolean isRomanNumeral(String s) {
return s.matches("^(?=.)M*(C[MD]|D?C{0,3})(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}
위 코드는 주어진 문자열이 유효한 로마 숫자인지를 확인하는 메서드이다. 위 코드의 문제는 String.matches
메서드를 사용하는 데 있다. String.matcheds
는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해서 사용하기엔 적합하지 않다. 이 메서드가 내부에서 만드는 정규표현식용 Pattern
인스턴스는, 한 번 쓰고 버려져서 곧바로 가비지 컬렉션 대상이 된다. Pattern
은 입력받은 정규표현식에 해당하는 유한 상태 머신을 만들기 때문에 인스턴스 생성비용이 높다.
public class RomanNumber {
private static final Pattern ROMAN = Pattern.compile("^(?=.)M*(C[MD]|D?C{0,3})(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
static boolean isRomanNumeral(String s) {
return ROMAN.matcher(s).matches();
}
}
성능을 개선하려면 필요한 정규표현식을 불변인 Pattern
인스턴스를 클래스 초기화 과정에서 직접 생성해 캐싱해두고, 나중에 isRomanNumeral
메서드가 호출될 때마다 이 인스턴스를 재사용한다.
어탭터는 실제 작업은 뒷단 객체에 위임하고, 자신은 제 2의 인터페이스 역할을 해주는 객체다. 어댑터는 뒷단 객체만 관리하면 된다. 즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 충분하다.
Map<String, Integer> menu=new HashMap<>();
menu.put("Burger", 8);
menu.put("Pizza", 9);
Set<String> keySet1=menu.keySet();
Set<String> keySet2=menu.keySet();
keySet1.remove("Burger");
System.out.println(keySet2.size());
System.out.println(menu.size());
1
1
Map
인터페이스의 keySet
메서드는 Map
객체 안의 키 전부를 담은 Set
뷰를 반환한다. keySet
을 호출할 때마다 새로운 Set
인스턴스가 만들어지라고 생각할 수 있지만, 실제로는 같은 Set
인스턴스가 반환된다. 위 코드를 보면 반환된 Set
인스턴스에 remove
라는 수정을 가하니까 Map
인스턴스와 반환된 모든 객체가 변경된 것을 출력결과를 통해 알 수 있다. 뷰 객체를 여러 개 만들어도 상관은 없지만, 그럴 필요도 없고 이득도 없다.
오토박싱은 프로그래머가 기본 타입과 박싱된 기본 타입을 섞어 쓸 때 자동으로 상호 변환해주는 기술이다. 오토방식은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다. 의미상으로는 별다를 것이 없지만 성능에서는 그렇지 않다.
long start1=System.currentTimeMillis();
Long sum1=0l;
for(long i=0; i<=Integer.MAX_VALUE; i++){
sum1+=i;
}
System.out.println(sum1);
System.out.println(System.currentTimeMillis()-start1+"ms");
2305843008139952128
5385ms
위 코드는 정확한 답을내기는 하지만 엄청 느리다. sum1
변수를 long
이 아닌 Long
으로 선언해서 불필요한 Long
인스턴스가 약 231개나 만들어진 것이다. 아래에서 성능 개선을 해보겠다.
long start2=System.currentTimeMillis();
long sum2=0l;
for(long i=0; i<=Integer.MAX_VALUE; i++){
sum2+=i;
}
System.out.println(sum2);
System.out.println(System.currentTimeMillis()-start2+"ms");
2305843008139952128
502ms
sum2
의 타입을 long
으로 선언하고 출력결과를 확인했다. 약 5.4초에서 약 0.5초로 빨라진 것을 알 수 있다. 박싱된 기본 타입보다는 기본 타입을사용하고, 의도하지 않은 오토박싱이 숨어들지 않도록 주의하자.
이번 아이템을 "객체 생성은 비싸니 피해야 한다."로 오해하면 안 된다. 특히나 요즘의 JVM
에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않는다. 프로그램의 명확성, 간결성, 기능을 위해서 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일이다.
거꾸로, 아주 무거운 객체가 아닌 다음에야 단순히 객체 생성을 파하고자 우리만의 객체 풀을 만들지는 않는게 좋다. 데이터베이스 연결 같은 경우는 생성 비용이 워낙 비싸니 풀을 만들어 재사용하는 편이 낫다. 하지만 일반적으로는 자체 객체 풀은 코드를 헷갈리게 만들고 메모리 사용량을 늘리고 성능을 떨어뜨린다. 요즘 JVM
의 가비지 컬렉터는 상당히 잘 최적화되어서 가벼운 객체용을 다룰 때는 직접 만든 객체 풀보다 훨씬 빠르다.
이번 아이템은 방어적 복사(defensive copy)를 다루는 아이템 50과 대조적이다. 이번 아이템이 "기존 객체를 재사용해야 한다면 새로운 객체를 만들지 마라"라면, 아이템 50은 "새로운 객체를 만들어야 한다면 기존 객체를 재사용하지 마라"다. 방어적 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가, 필요 없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다는 사실을 기억해야 한다. 방어적 복사에 실패하면 언제 터져 나올지 모르는 버그와 보안 구멍으로 이어지지만, 불피요한 객체 생성은 그저 코드 형태와 성능에만 영향을 준다.