01.03.화(Parser, Parsing)

유희선·2023년 1월 2일
0

TIL

목록 보기
14/29

1. Parsing (파싱)
1) 개념
-구문 분석
-데이터들을 다루기 쉬운 형태로 바꿔주는 역할을 하는 함수나 프로그램 과정
=> 일련의 문자열을 의미있는 token으로 분석하고
그것으로 이루어진 (문법적 의미와 구조를 반영한) Parse tree로 만드는 과정

*token(토큰)
-언어가 사용하는 기본 '단어'

*Parse tree(파스트리)
어떤 문장을 트리구조로 나타낸 것을 의미
트리 => 자료구조의 하나로서 일종의 그래프

2) 예시
(1) 프로그램을 compile 하는 과정에서
특정 프로그래밍 언어가 제시하는 문법을 잘 지켜서 작성하였는지
compiler가 검사하는 것
XML parser
-XML 문서를 읽고 해석하여 태그명, 속성값 및 element 내용을 분리해 주는 프로그램
(2) 인터넷에 주어진 정보를 내가 원하는대로 가공하여
서버에서 원할 때 불러올 수 있도록 하는 것
① 웹 브라우저인 explorer 또한 하나의 응용프로그램으로
XML parser가 parsing(해석)한 결과를 이용해 display 하도록 programming 되어있음
(3) 어떤 data를 원하는 form으로 만들어 내는 것
-특정 문서(XML, HTML 등)을 읽어 다른 프로그램이나 서브루틴이
사용할 수 있는 내부의 표현 방식으로 변환해주는 것
① 학교 홈페이지의 공지사항(태그 안의 text 내용이 있는 것)을 읽어와서
그 중 텍스트 내용만 따로 저장하는 등의 다른 프로그램이나 서브루틴이 사용할 수 있는 표현방식으로 변경
[의미를 파악하면서 읽는다 - 값이 얼마인지 id 태그의 이름이 무엇인지 등 파악]
(4) <>와 같은 태그를 사용자가 입력하면
컴퓨터가 알아볼 수 있도록 바꿔주는 과정
① 컴파일러의 일부로 원시 프로그램의 명령문이나 온라인 명령문,
HTML 문서 등에서 Markup Tag 등을 입력으로 받아들려 구문을 해석할 수 있는 단위로 여러부분을 분할해주는 역할

3) 기법
*XML 파싱 기법
(1) DOM
(2) SAX / JSON 파싱 기법

4) 간단하게 정리
*무엇을 파싱한다
-어떤 문장 혹은 코드를 해석한다
-어떤 문장 혹은 코드를 분석한다.

2. Parser (파서)
-구문 해석기
-데이터들을 다루기 쉬운 형태로 바꿔주는 역할을 하는 함수나 프로그램
-Parsing을 수행하는 프로그램
= parsing을 하는 processor = parser가 parsing 하는 것

1) 개념 설명
(1) parse
-interpreter나 compiler의 구성 요소 가운데 하나,
입력 token에 내제된 자료 구조를 빌드하고 문법 검사
-일련의 입문 문자로부터 token을 만들기 위해 별도의 낱말 분석기 이용
(2) parser
-수작업으로 프로그래밍되며 도구에 의해 (반)자동적으로 생성

2) 예시
-원시 프로그램(기계어로 번역되기 전의 프로그램)의 명령문이나 온라인 명령문, HTML 문서 등에서 Markup Tag 등을 입력으로 받아들여 구문을 해석할 수 있는 단위로 여러 부분으로 분할해주는 역할
-Compiler나 Interpreter에서 원시 프로그램을 읽어 들여 그 문장의 구조를 알아내는 구문분석(parsing)을 행하는 프로그램

0개의 댓글