1일 1로그 100일 완성 IT 지식 #60~61

minkyung·2022년 6월 15일
0
post-thumbnail

060. ZIP 파일로 압축할 때

압축의 종류, 각 미디어 별 압축 방법과 그 차이

압축의 목표 ➜ 같은 정보를 더 적은 비트로 인코딩하는 것
어떤 형태의 압축 기술이던 나중에 사용될 가능성이 있는 정보를 전달하지 않는 비트를 줄이거나 없애는 것임.
그래서 일부 사용될 가능성이 있는 정보들의 입력은 크기가 줄어들지 않는데, 더이상 압축할 수 없는데 거듭 압축하게 되면 불필요한 정보가 추가되어 오히려 크기가 더 커질 수도있다.

무손실 압축 & 손실 압축

무손실 압축 ➜ 압축해도 정보가 소실되지 않으므로 압축을 풀면 원본 소스가 정확하게 복원됨.
손실 압축 ➜ 원본 입력을 정확히 재현하지 않아도 되는 상황, 원본에 근접한 형태여도 충분함.

무손실 압축 (lossless compression)

  1. 영어 텍스트: 가장 흔히 나타나는 문자에는 더 적은 비트를 사용하고, 자주 사용되지 않는 문자에는 더 많은 비트를 사용하면 총 비트 수를 대폭 줄일 수 있음. 모스 부호처럼.
    📎 Huffman Coding Tree (허프만 코딩 트리)

  1. ZIP 압축 알고리즘
    📎 압축 알고리즘 궁금하시지 않으세요? 알집 알고리즘 연구하던 1人 이 들려 드립니다.

  1. 이미지 중 GIF(Graphics Interchange Format), PNG(Portable Network Graphics)
    둘 다 주로 텍스트, 선 그림, 또는 단색 블록으로 구성된 이미지에 사용하려고 만들어진 포맷이다.
    사진 이미지용은 아님 ➜ 웹에 적합하다.
    📎 다양한 이미지 타입


손실 압축 (lossy compression)

인간이 보거나 듣는 컨텐츠를 압축하는 데 가장 흔히 사용됨.
1. 이미지 중 JPG : JPEG 압축 알고리즘을 사용해서 원본 이미지를 10분의 1 이하로 압축하는데, 육안으로 큰 품질 저하는 알아챌 수 없음.
2. 영화와 TV를 압축하기 위한 MPEG계열의 압축 알고리즘 : 또한 사람의 인지능력의 한계를 이용한 기법.
3. MPEG계열의 오디오 부분인 MP3, AAC : 음향을 압축하기 위한 지각 부호화 알고리즘 기술임



061. 오류를 검출하고 수정하는 알고리즘

오류 검출, 수정 알고리즘 종류

압축이 군더더기 정보를 제거하는 과정이라면, 오류 검출과 수정은 오류를 검출하고 수정까지 할 수 있게 하는, 신중하게 제어된 여분의 정보를 추가하는 과정임.
오류 검출과 수정은 컴퓨팅과 통신 분야에서 폭 넓게 사용됨.

📎 Error detection and correction

체크섬 알고리즘
오류 검출 수정 알고리즘 중에 중복 검사에 해당함. 단일 숫자 오류와 자리 바뀜 오류를 대부분 검출함.

  1. 가장 오른쪽 숫자에서 시작하여 왼쪽으로 가면서 각 숫자에 1과 2를 번갈아 곱한다.
  2. 만약 곱해서 나온 값이 9보다 크면 거기에서 9를 뺀다.
  3. 그렇게 계산된 각 자리 숫자들을 더했을 때 합계가 10으로 나누어 떨어져야한다.


패리티 코드 (패리티 비트)
비트에 적용되는 범용 오류 검출 기법의 가장 간단한 예
1. 하나의 부가적인 패리티 비트가 각 비트 그룹에 붙는다.
2. 가령 패리티 비트의 값은 그룹 내에서 값이 1인 비트의 총 개수가 짝수가 되도록 선택된다.
3. 그런 식으로 해서, 단일 비트 오류가 발생하면 수신자는 1인 비트가 홀수 개인 것을 보고 무언가 손상되었음을 알게 된다.
4. 어느 비트에 오류가 있는지는 식별하지 못하며,
5. 두 개의 오류가 발생하면 검출할 수 없다.

profile
프론트엔드 개발자

1개의 댓글

comment-user-thumbnail
2022년 6월 21일

ㅁㄴㅇㅁㄴㅇ

답글 달기