[bash] grep을 이용해먹기

최지영·2022년 5월 18일
0

😁 grep 명령어를 이용한 Html Tag제거

grep을 이용해서 간단하게 Html 태그 파싱해보기

여기서 grep을 이용하는데 사용할 옵션은 -E 옵션
-E 옵션은 확장 정규표현식 사용으로 복잡하게 사용해야할 정규표현식을 단순하게 만들어준다는 장점이 있다.

빠르게 예제로 확인해보자!

우선 간단하게 예제로 html 파일 한개 만들어봅시다!

파일명: test.html

  <topic id="test">
  <title>
  <body>
  <p>
  <p>
    

여기서는 이해하기 쉽게 닫히는 태그 없는 내용으로 테스트를 진행!


이제 쉘에서 grep과 sed를 이용해서 tag명을 파싱 진행!

📜 bash shell command

grep -Eo '<[_a-zA-Z][^>]*[$>]' test.html | sort | uniq | sed 's/^<//;s/ id=\".*\"//;s/>$// '

📜 결과

body
p
title
topic

0개의 댓글