readLine()의 한글 자소분리문제

Wongbing·2022년 3월 9일
0

커맨드라인 툴로 입력값을 readLine()으로 받아줄 때, 한글로 입력 시 자소가 분리되어 원하는 값을 얻지 못하였다
ex) “한글” -> ㅎㅏㄴㄱㅡㄹ
“언어” -> ㅇㅓㄴㅇㅓ
대략의 검색결과 mac 운영체제에서는 한글 입력을 받을 때 NFD방식을 이용하고 윈도우에선 NFC방식을 이용한다고 한다
맥에서 입력받는 한글은 조합형, 윈도우에서는 완성형이다
애플 개발문서를 들어가보니 해결방법인 것 같은
conjoinning jamo behavior 라는 문서에서 Java로 작성된 코드를 올려놓았지만 자바언어를 할 줄 몰라 쓰지 못하는 상황..
계속 서칭하며 결과를 기록해 둘 것이다

서칭 결과 precomposedStringWithCompatibilityMapping 이라는 것이 Normalizing Form KC에 해당하는 명령인 것 같다
하지만 초성 + 중성 까지만 결합이 된다.. [

https://www.unicode.org/versions/Unicode14.0.0/ch03.pdf#G24646
위 링크에서 "3.12 conjoining jamo behavior" 파트를 보면 java로 작성이 된 코드를 볼 수 있다

profile
IOS 앱개발 공부

0개의 댓글