😁 grep 명령어를 이용한 Html Tag제거
여기서 grep을 이용하는데 사용할 옵션은 -E
옵션
-E
옵션은 확장 정규표현식 사용으로 복잡하게 사용해야할 정규표현식을 단순하게 만들어준다는 장점이 있다.
빠르게 예제로 확인해보자!
파일명: test.html
<topic id="test">
<title>
<body>
<p>
<p>
여기서는 이해하기 쉽게 닫히는 태그 없는 내용으로 테스트를 진행!
이제 쉘에서 grep과 sed를 이용해서 tag명을 파싱 진행!
grep -Eo '<[_a-zA-Z][^>]*[$>]' test.html | sort | uniq | sed 's/^<//;s/ id=\".*\"//;s/>$// '
body
p
title
topic