블록 부호

수학과 컴퓨터 과학에서 블록 부호(block符號, 영어: block code 블록 코드^[*])는 데이터를 중복해서 “블록”으로 부호화하되, 각 비트 또는 블록의 성분이 전송 과정에서 노이즈를 겪어 바뀌는 것을 일부 경우 교정할 수 있게 하는 부호화 체계이다.^[1]^[2]^[3]^[4]

정의

해밍 결합 도식 속의 블록 부호

블록 부호 $(\Sigma ,n,k,C)$ 는 다음과 같은 데이터로 구성된다.

유한 집합 $\Sigma$ . 이를 알파벳(영어: alphabet)이라고 한다.
양의 정수 $n\in \mathbb {Z} ^{+}$ . 이를 블록 길이(영어: block length)라고 하고, $\Sigma ^{n}$ 의 원소를 블록(영어: block)이라고 한다.
부분 집합 $C\colon \Sigma ^{k}\to \Sigma ^{n}$ . $C$ 의 원소인 블록을 부호어(符號語, 영어: codeword)라고 한다.

블록 부호 $(\Sigma ,n,C)$ 의 전송률(電送率, 영어: rate)은

R={\frac {1}{n}}\log _{|\Sigma }/n

이며, 항상 $0\leq R\leq 1$ 이다. 블록 부호 $(\Sigma ,n,C)$ 의 상대 길이(相對-, 영어: relative distance)는 유리수 $\delta =d/n$ 이며, 마찬가지로 1 이하의 양의 유리수이다.

$\Sigma ^{n}$ 위에 해밍 거리

\operatorname {d_{H}} (s,t)=|\{i\in \{1,\dotsc ,n\}\colon s_{i}\neq t_{i}\}|

를 정의하면, 이는 거리 공간을 이룬다. 블록 부호 $(\Sigma ,n,C)$ 의 최소 거리(最小距離, 영어: minimum distance)는 다음과 같다.

d=\min _{a,b\in \Sigma ^{k},\;a\neq b}\operatorname {d_{H}} (C(a),C(b))

최소 거리가 $d$ 인 블록 부호 $(\Sigma ,n,C)$ 는 흔히 $[n,\log _{\Sigma }|C|,d]_{|\Sigma |}$ -블록 부호라고 불린다.

일반 결합 도식 속의 블록 부호

위 정의는 결합 도식의 개념을 통해 일반화된다.^[5]^[6]^{:2483–2486, §Ⅲ}

구체적으로, 다음이 주어졌다고 하자.

결합 도식 $(X,\partial \colon X^{2}\to D)$
$D$ 의 부분 집합 $E\subseteq D$

이 경우, $X$ 의 부분 집합 $C\subseteq X$ 가 다음 조건을 만족시킬 경우, $E$ -블록 부호(영어: $E$ -block code)라고 한다.^[6]^{:2483, Definition 5}

임의의 $x,y\in C$ 에 대하여, $\partial (x,y)\not \in E$

$X$ 속의 블록 부호란 $\varnothing$ -블록 부호를 뜻한다.

만약 $X=\Sigma ^{n}$ 이 $\Sigma$ 위의 $n$ 차원 해밍 결합 도식일 경우, $\partial =\operatorname {d_{H}}$ 는 해밍 거리가 되며, 이 경우 위의 기초적 정의로 귀결된다.

결합 도식 $X$ 속의 블록 부호 $C\subseteq X$ 에 대하여,

$X$ 의 원소를 블록이라고 한다.
$C$ 의 원소를 부호어라고 한다.
$C$ 의 전송률은 $R=\ln C/\ln X$ 이다. 이는 $0\leq R\leq 1$ 인 실수이다.
$X$ 의 이항 관계가 $(R_{i}\subseteq X^{2})_{i\in I}$ 라고 할 때, $C$ 의 내부 분포(內部分布, 영어: inner distribution)는 다음과 같은 유리수열이다.^[6]^{:2483, Definition 4}
$\alpha _{i}={\frac {|C^{2}\cap R_{i}|}{|C|}}$

특히,

\sum _{i}\alpha _{i}=|C|

가 성립한다.

만약 거리 함수의 공역 $D$ 가 전순서 집합일 때, 마찬가지로 최소 거리

d=\min _{x,y\in C}\partial (x,y)

를 정의할 수 있다.

성질

블록 부호를 사용한 데이터의 전송

$[n,k,d]_{q}$ -블록 부호 $C\subseteq \Sigma ^{n}$ 이 주어졌다고 하고, 편의상 $k$ 가 정수라고 하자. 이 경우, 임의의 전단사 함수

f\colon \Sigma ^{k}\to C\subseteq \Sigma ^{c}

를 고르자. 이를 부호화 함수(符號化函數, 영어: coding function)라고 한다.

이제, $\Sigma ^{k}$ 의 한 원소를 노이즈가 있는 채널로 전송한다고 하자. 즉, 전송 도중 벡터 $v\in \Sigma ^{n}$ 의 $n$ 개의 성분 가운데 일부가 다른 값으로 바뀔 수 있다.

만약 문자열 $v\in \Sigma ^{n}$ 를 수신하였을 때, 다음과 같은 알고리즘을 사용하여 데이터를 교정한다고 하자.

만약 $\min _{c\in C}\operatorname {d_{H}} (v,c)<d/2$ 라면, $v$ 를 $\operatorname {d_{H}} (v,f(c))<d/2$ 인 유일한 원소 $c\in \Sigma ^{k}$ 로 교정한다.
만약 $\min _{c\in C}\operatorname {d_{H}} (v,c)\geq d/2$ 라면, 데이터의 교정은 실패한다.

이 경우,

만약 $n$ 개의 성분 가운데 $\lceil d/2-1\rceil$ 개 이하가 잘못되었다고 가정하면, 수신된 데이터를 오류 없이 교정할 수 있다.
만약 $n$ 개의 성분 가운데 $d-1$ 개 이하가 잘못되었다고 가정하면, 데이터의 송신 도중 오류가 발생하였는지 여부를 항상 확인할 수 있다. (그러나 이 오류를 항상 교정할 수 있지는 않다.)