기술(Tech, IT)/etc.

[Tech, etc.] CRC32 (Cyclic Redundancy Check 32-bit)

Daniel803 2024. 2. 28. 02:30

CRC32는 순환 중복 검사 32비트의 약자다. 디지털 네트워크 및 저장 장치에서 원시 데이터의 우발적인 변경을 감지하기 위해 일반적으로 사용되는 오류 감지 코드의 한 유형이다. CRC32의 "32"는 알고리즘이 입력 데이터에서 32비트 해시값(32비트의 고정 크기 문자열)을 생성한다는 것을 나타낸다.

 

CRC 알고리즘은 다항식 나누기를 기반으로 하며, 여기서 나눗셈은 입력 데이터, 제수는 미리 정해진 다항식, 몫은 버려진다. 이 나눗셈의 나머지는 오류를 감지하기 위한 checksum으로 사용되는 CRC 값이다. CRC의 구체적인 공식은 아래와 같은 단계를 포함한다.

 

  1. 초기화
    : CRC 레지스터가 모두 1 (0xFFFFFFFF)로 초기화된다. 이는 데이터의 선행 0이 checksum에 영향을 미치지 않도록 하기 위해 수행된다.
  2. 다향식 표현
    : CRC32에 사용되는 표준 다항식은 0x04C11DB7로, 이 다항식은 비트 패턴 1000110000010001101101110111에 해당하며, 여기서 가장 높은 비트 (MSB)는 암시적이며 코드에 표시되지 않는다.
  3. 처리
    : 입력 데이터의 각 비트는 한 번에 하나씩 처리된다. 각 비트에 대해 CRC 레지스터가 1비트씩 왼쪽으로 시프트되고 입력 비트는 시프트된 CRC의 MSB와 XOR된다. 결과가 1이면(MSB 위치의 캐리 아웃을 나타냄), CRC 레지스터는 다항식으로 XOR된다.
  4. 최종 XOR 값
    : 모든 입력 데이터 비트가 처리된 후 CRC 레지스터는 최종 값(일반적으로 0xFFFFFFFF)으로 XOR된다. 이 단계를 통해 0으로만 구성된 데이터 스트림이 0의 checksum을 생성하지 않도록 한다.

이 단계를 거친 후 얻은 CRC 값은 데이터에 추가할 수 있는 32비트 체크섬이다. 데이터(checksum 포함)을 확인할 때도 동일한 프로세스가 적용된다. 일반적으로 checksum 계산 결과 값이 0이면 오류가 없음을 나타낸다.

 

CRC32는 단일 비트 오류, 버스트 오류 및 일부 다중 오류 패턴가 같은 일반적인 유형의 오류를 탐지하는 데 효과적이지만 완벽하지는 않다는 점에 유의해야 한다. 특히 대규모 데이터 세트나 특정 오류 패턴의 경우 오류가 감지되지 않을 약간의 가능성이 있다.