배너는 godori님의 velog를 참고하여 만들었습니다.
부동산 데이터를 수집 및 정제하다 보면 지역 코드가 서로 잘 맞지 않는 경우가 많다. 서로 다른 지역코드 체계를 사용하기 때문이다. 특히 시도나 시군구 단위는 지역 코드가 다르더라도 명칭은 대부분 동일하지만, 읍면동 단위에서는 코드뿐만 아니라 명칭마저 상이하다.
이는 우리 일상 생활에서도 경험하는 바이다. 특정 경우에는 행정동과 법정동이 일치하지만, 서로 다른 경우가 있다. 예를 들어 현재 나의 거주지는 행정동으로는 신촌동이지만, 법정동으로는 창천동인 것이 그 사례가 될 것이다.
부동산 데이터를 수집하면서 마주하는 지역 관련 코드는 크게 네 가지이다. 1)행정동코드
, 2)법정동코드
, 3)한국행정구역분류
, 4)국가기초구역번호(우편번호)
, 5)기타 코드
. 각각의 코드에 대한 설명과 수집 방법에 대해 정리할 것이다. 각 코드 정의는 한국행정구역분류 해설서를 참고하여 작성하였으며, 특징의 경우 해설서와 개인적 경험을 결합하여 작성하였다.
정의
법정동은 법으로 지정된 동이라는 뜻으로, 정부의 토지 구획, 지적도, 재산권 행사와 같은 법률 행위에서 일반적으로 사용되는 주소지 개념이다.
기존의 지번 주소의 경우 법정동으로 표기하며, 도로명 주소에서 괄호 안에 병기하는 동의 명칭이나, 부동산 등기 등 부동산 관련 토지표기 등에도 쓰인다.
특징
법정동은 고유 지명을 그 명칭으로 하며 행정동과 비교하여 변동이 제한적인 편이다. 변동 사항은 대부분 세종시, 창원시 등의 굵직한 사건에서 일어난다. 때문에 가장 기본이 되는 코드로 보고 있다. 후에 사용할 PNU 코드의 기본이 되며, 법정 서류의 기본이 될 뿐 아니라 변동 사항도 적기 때문이다.
필지고유번호(PNU)란 각 필지를 서로 구별하기 위하여 필지마다 붙이는 고유한 번호로, 10자리의 법정동리코드 + 산 여부(대지 = 1, 산 = 2) + 지번(본번 4자리, 부번 4자리)의 합으로 총 19자리로 이루어진 코드다.
법정동코드는 국토교통부 주택토지실 국토정보정책관 공간정보제도과에서 담당한다.
수집
법정동코드는 두 가지 방식을 통해 받을 수 있다.
1) 행정표준코드관리시스템에서 법정동을 검색하면 구할 수 있다.
현존하는 코드뿐만 아니라 폐지된 코드까지 제공한다.
2) 행정안정부 주민등록,인감,행정사에서도 자료를 받을 수 있다.
접근 방법은 행정안전부페이지에서 상단의 업무안내 배너를 클릭한 후, 지방자치분권실 내의 주민등록 인감 행정사를 통해 접근 가능하다.
해당 게시판에는 주민등록 담당 행정기관 및 관할구역 변경내역이 올라오는데, 변경내역뿐만 아니라 전체 내역을 받을 수 있다. 현존 코드와 말소 코드가 존재하며, 말소 코드의 경우 말소일자까지 작성되어 있다. 또한 행정기관과 관할 법정동의 연결내용 파일(mix)이 존재한다.
정의
기초자치단체의 하부행정구역으로 법정동을 행정상으로 관리하는 행정구역, 행정복지센터(동사무소, 주민센터)와 동일한 개념이다. 일반적으로 흔히 말하는 동의 개념에 해당된다.
행정동코드와 주민등록 행정기관코드(행정기관코드)는 동일한 용어이다.
특징
행정동은 행정기관들이 주민 수, 면적 등을 고려해 단순히 행정 편의를 위해 설정한 행정구역이다. 인구 면적 행적 수요 등을 고려하여 행정효율을 목적으로 지방자치단체 조례에 따라 수시로 변경된다. 예를 들어 2021년 1월 1일에 강원도 양구군 남면(4280031000)은 국토정중앙면(4280031500)으로 변경되었으며, 경상북도 군위군 고로면(4772037000)은 삼국유사면(4772038000)으로 변경되었다. 통상 행정복지센터로 불리는 행정기관이 행정동마다 1곳씩 설치돼 있다.
행정동과 법정동은 1:1로 매핑되기도 하지만, 대부분 M:N 관계, 즉 하나의 행정동이 여러 개 법정동의 일부분으로 구성되어 있거나, 하나의 법종동이 여러 개의 행정동으로 나뉘어 관할된다. 또한 행정동과 법정동의 명칭이 동일해도 경계가 다를 수 있다.
행정안전부 주민과, 또는 관할 기초자치단체에서 담당한다.
수집
행정동코드는 법정동 코드에서 설명한
행정안정부 주민등록,인감,행정사에서 자료를 받을 수 있다.
정의
통계청에서 통계작성을 목적으로 전국의 행정구역을 일정한 수서에 따라 부호화한 자료이다.
특징
행정구역분류는 행정동과 그 명칭과 관할구역이 동일하다. 다만 행정동의 경우 출장소에 부호가 부여되어있으나, 행정구역분류는 출장소에 부호가 부여되어있지 않다.
지방자치단체 조례에 따라 행정목적으로 수시로 변동되는 행정동과 달리 행정구역분류는 3개월마다 공고(1.1, 4.1, 7.1, 10.1)된다. 공고 때마다 행정동 변경 사항(폐지, 설치, 분할, 통합, 명칭변경, 승격)에 따라 새로운 코드가 부여된다.
과거에는 7자리였으나 8자리로 변경되었다. 자료에는 두 가지 코드가 모두 첨부되어있다.
통계청 통계서비스정책관 공간정보서비스과에서 담당한다.
수집
통계청 통계분류포털 자료실에서 수집 가능하다. 해당 페이지의 사회분류배너를 클릭 후 일반분류-한국행정분류로 들어간 후 자료실에 3개월마다 게시글이 올라온다. 해당 자료실에서 제공하는 엑셀 파일은 여러 시트가 존재하며, 행정구역분류뿐만 아니라 법정동코드, 행정동코드, 행정구역분류를 매핑하는 테이블 또한 제공하고 있어 가용하기 좋다.
정의
국가기초구역번호는 도로명주소 기반으로, 도로나 철도 등 잘 변하지 않는 시설이나 지형에 의해 구역을 정하여 번호를 부여한 것이다.
위키백과
특징
가장 익숙한 국가기초구역번호 사용처는 우편번호이다. 대한민국의 우편번호는 2015년 8월 1일 기존의 6자리 번호에서 5자리 구역번호로 바뀌었는데, 해당 번호가 바로 국가기초구역번호이다. 이 외에도 소방서나 학교배정구역 관할경계 등의 기준이 된다.
수집
다양한 수집 방법이 있겠지만, 가장 일반적으로 우체국의 우편번호 DB내 우편번호 내려받기에서 받을 수 있다. txt 파일로 되어 있으며, |
구분자로 구분된다. 우편번호, 행정동코드, 법정동코드, 도로명 코드 등이 매핑되어 있기 때문에 사용이 용이하다.
정의
지역을 나타내는 코드 중에는 위 세 분류에 속하지 않는 코드들을 가끔 발견할 수 있다. 예시로 공공데이터포털 중 한국부동산원 관련 API를 사용하다 보면 지역코드를 아규먼트로 받는 경우가 있다. 다만 그 기준을 모르겟다.
특징
기타에 속하는만큼 그 양상이 다양하다. 또한 법적, 행정적 바탕에 속하지 않고 개념적 분류에 따라 코드가 부여된 경우가 많다. 예를들어 한국부동산원 API에서 사용하는 지역코드의 경우 시군구 단위까지만 제공한다. 대신 전국, 수도권, 대도시, 시지역 군지역, 서울 남부 등 법정동코드나 행정구역코드에는 존재하지 않는 개념에도 코드가 부여되어있다.
수집
수집 방법 역시 다양하다. 예시로 사용한 한국부동산원 API에서 사용하는 지역코드는 여기에서 획득 가능하다. 또한 한국부동산원 상업용 임대동향 코드는 여기에서 획득 가능하다.
부동산 데이터는 결국 공간 상에 위치하기 때문에 지역 데이터를 처리하는 것이 중요하다. 그리고 지역 코드는 지역 데이터를 처리하는 바탕이 된다. 그렇지만 본 포스트에서 밝힌바와 같이 지역 코드는 일반적인 인식과 달리 동일한 위치더라도 다양한 코드를 통해 관리된다. 이러한 점이 진입장벽으로써 작용하며, 매핑 과정 또한 쉽지 않다. 특히 본 포스트에서는 상세히 밝히지 않았지만, 완전히 매핑되지는 않으며, 사용하기 위해서는 약간의 전처리 과정이 필요하다. 본 포스트에서 정리한 바가 지역 데이터를 다루는 진입장벽을 낮추는데 도움이 되었으면 한다.
지역 데이터 처리 및 활용은 VWL 대표 김승범 소장님의 블로그와 github을 보면서 많이 배우고 있다.
연계 방법은 abouttabs님의 블로그에서 잘 정리하였다.