QRコードの概要

符号化（エンコード）

エラー訂正の概要

エラー訂正に必要な「行列」の解説

「行列」を使ってエラー訂正をしよう

リード・ソロモン符号とエラー訂正の方法

多項式の割り算

リード・ソロモン符号の作り方

ガロア理論と体

QRコードを作ろう

QRコードメーカー

QRコードメーカー(javascript)

独極・QRコード担当の「あじな」です。
リード・ソロモン符号の復号の方法について解説したところで、いよいよリード・ソロモン符号の作り方について！
という勢いにのったところ、非常に申し訳ないのですが、ちょっとだけ寄り道させてください。
そのテーマは「割り算」でございます。

これまでの復習 [表示する]

QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
白黒の四角を使うのは、コンピュータにわかりやすくさせるため
QRコードは「機能パターン」と「符号化領域」で出来上がっている
「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「$4 \times 8=32$」種類のパターンがある
「型番情報」は「QRコードのバージョンによって決まり、40種類ある
「データ領域」は「データ」と「エラー訂正情報」で出来上がる
QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)$ \times $4$ + $17」
「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
どの「エンコード」方式でも、データは「モード指示子」＋「文字数指示子」＋「データ」＋「終端パターン」＋「埋め草ビット」＋「埋め草ワード」となる
QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
使える「単語」を制限すると「最小距離」は大きくなる
「最小距離」の半分までのエラーであれば訂正することができる
「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
「行列」の「掛け算」は順番を変えると結果も変わる
「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
「列」で計算しても、「行」で計算しても結果は同じ
「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
「$(-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) $」を「余因子行列」と呼ぶ
「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
「逆行列」は「(元の「行列」の「行列式」の逆数)$\times$(x行・y列目の要素が＜元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」＞となる「行列」)」
「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
「符号」のサイズが1行n列、「エラー訂正付符号」のサイズが1行m列のとき、「生成行列」はn行m列になる
「QRコード」で利用される「エラー訂正機能付符号」は「リード・ソロモン符号」と呼ばれるもの
「検査行列」を「エラー訂正機能付符号」に「掛け算」すると結果は「ゼロ行列」になる。逆に「ゼロ行列」にならないと、読み取った「エラー訂正機能付符号」が間違っている
エラー訂正機能のスペックは「n(「エラー訂正機能付符号」の「長さ」)」、「k(実質的に単語を表現する桁数)」、「d(「エラー訂正機能付符号」の間の「最小距離」)」の3つ
エラー訂正機能のスペックの「n(「エラー訂正機能付符号」の「長さ」)」は「検査行列」の行数と同じ
エラー訂正機能のスペックの「k(「実質的に単語を表現する桁数)」は「検査行列」をn行m列だとすると、「n-(検査行列のランク)」となる
同じ仲間の「エラー訂正機能付符号」を2つ用意すると、それらを「引き算」した結果も同じ仲間の「エラー訂正機能付符号」の1つになる
「エラー訂正機能付符号」軍団の中の「最小距離」は、その「エラー訂正機能付符号」軍団の中で最も小さい「ハミング重み」と同じになる
エラー訂正機能のスペックの「d(「エラー訂正機能付符号」の間の「最小距離」)」は「(「検査行列」の「ランク」)+1」以上となる
「シングルトン限界式」は「d(「エラー訂正機能付符号」の間の「最小距離」)」が「n(「エラー訂正機能付符号」の「長さ」)-k(実質的に単語を表現する桁数)+1」以下になること
リード・ソロモンの「検査行列」は、x行y列の要素が$\alpha^{(x-1)(y-1)}$で、xはn行まで、yは2t列までの「行列」
リード・ソロモンの「検査行列」のランクは2t
リード・ソロモンの「検査行列」の特徴は、「エラー訂正機能付符号」の「長さ」はn、実質的に単語を表現する桁数)はn-2t、「エラー訂正機能付符号」の間の「最小距離」は2t+1
「ヴァンデルモンド行列」の行列式は、行列の要素に同じ値のものがなければ「0」にはならない。
受信符号に検査行列を掛け算した結果は、発生したエラーに検査行列を掛けたものと同じになる、「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」
「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」を展開すると、方程式の数がn個、未知数が2t個の連立方程式になる
リード・ソロモン符号の解き方は、「01.エラーの発生個数」「02.エラーの発生位置」「03.エラーの内容」の3ステップ
$\begin{vmatrix} S_0 & S_1 & \ldots & S_{j-1} \\ S_1 & S_2 & \ldots & S_{j} \\ \vdots & \vdots & \ddots & \vdots \\ S_{j-1} & S_{j} & \ldots & S_{ 2j-2 } \\ \end{vmatrix}$という行列式の$j$の値を$t$から1つずつ減らしていき、初めて行列式の値が「0」以外になった時の$j$がエラーの発生個数になる。
エラーが発生している位置に対応する$\alpha$の「逆数」(つまり、$\alpha^{-p_0},\alpha^{-p_1},\cdots ,\alpha^{-p_{j-2}},\alpha^{-p_{j-1}}$を入力したときだけ「0]を出力する関数を、$\boldsymbol{Y} $と$\boldsymbol{H}$の情報から作ることができ、エラーの位置を求めることができる
エラーの位置が分かった状態であれば、元の「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」を普通の連立方程式のように解くことができ、「エラーの内容」を求めることができる
多項式を多項式で割り算することができ、割り算した商を$Q(x)$、余りを$R(x)$とすると、「$f(x) = g(x)Q(x) + R(x)$」と書ける

多項式の割り算からわかること

前回、多項式の割り算の方法について解説しました。
多項式$f(x)$を多項式$g(x)$で割り算すると「$f(x) = g(x)Q(x) + R(x)$」って書けるんでしたね。

次数もありますよ！

ちなみに、多項式にも普通の方程式と同様次数という特徴があります。それは、多項式の中にある未知数($f(x)$だったら、$x$が未知数)の最も大きい累乗のことを指します。
何言っているかわかりづらいですが、例えば$(3x^3 -4x^2 +2x -1)$であれば、$(3x^3)$が最も多い累乗ですので、個の方程式の次数は「$3$」ということになります。
そして、先ほどの多項式の割り算に戻ってこの次数を考えてみます。 $$ f(x) = g(x)Q(x) + R(x) $$ このとき、$f(x)$の次数を$f$として、$g(x)$の次数を$g$とすると、商$(Q(x))$の次数は大きくても$(f-g)$以下となり、余りの$R(x)$の次数は$g$よりも小さくなります。
これは「多項式に対する除法の原理」と呼ばれるものですが、まぁ、直感的にも「$x^10$が最も大きい累乗の項として含まれる多項式を、$x^7$が最も大きい累乗の項として含まれる多項式割り算した結果の商は$x^3$の累乗の項をもつ気はしますよね。
(それに、もし「余り」の多項式部分に割り算する多項式よりも大きい次数が含まれていたら、まだ割り算ができてしまう気がしますしね。本当は証明があるのですが、当たり前すぎて面白くないので記載しておりません・・・)

剰余の定理

そして、多項式の割り算にはもう一つ重要な性質が。
例えば、$f(x)=x^4-14x^2-32$という多項式があったとします。
この多項式に$x=4$を入れると結果は0になります。(計算してみてくださいね)つまり、$f(4)=0$です。
このとき、この多項式「$f(x)=x^4-14x^2-32$」を「$g(x)=x-4$」で割り算するとどうなるでしょうか？
いきなり計算をする前に、$f(x)$を$g(x)$で割り算したときの結果を見てみましょう。結果はつぎのようになるのでした。
$$ f(x) = g(x)Q(x) + R(x) $$ このとき、$g(x)$は今の場合だと$x-4$なので、上の式は次のように書けます。
$$ f(x) = (x-4)Q(x) + R(x) $$ この式は$x$にどんな数字を入れたときにも成り立たなくてはなりません。ここで、おもむろに$x=4$として上の式を計算してみましょう。
$$ f(4) = (4-4)Q(x) + R(x) $$ ちなみに、$f(4)=0$だったので、上の式は次のようになります。
$$ 0 = R(x) $$ つまり余りは0にならなければいけないのです。だから、$f(x)$は$(x-4)Q(x)$と書くことができるのです。
以上のことからもし、ある数字$a$を$f(x)$に入れたときに結果が0になる($f(a)=0$ならば、$f(x)$は次のように書けます
$$ f(x) = (x-a)Q(x) $$ $f(x)$の解がわかれば、その数字を使って因数分解ができるのですね。このことを「剰余の定理」と呼びます。
(なんか響きがよくないですか？「じょうよのていり」)

もう少しよくばって、特徴を紹介！

ちなみに、多項式の性質でもう一つ。
もし、$f(a_1)=0$となる$a_1$があれば、$f(x) = (x-a_1)Q_1(x) $と書けるといいました。
このとき、$f(x)$の次数を$n$とすると、$(x-a_1)$の次数が$1$なので、$Q_1(x)$の次数は$(n-1)$となります。
そして、もし$Q(a_2)=0$となる$a_2$があれば、$Q(x) = (x-a_2)Q_2(x) $と書けます。
すると、$f(x) = (x-a_1)(x-a_2)Q_2(x) $となります。
このとき、$Q_2(x)$の次数は$(n-2)$となります。これを繰り返していくと、次のような式になります。
$$ f(x) = (x-a_1)(x-a_2)(x-a_3) \cdots (x-a_{(n-2)})(x-a_{(n-1)})(x-a_{n}) $$ これは、$f(x)$に$a_1,a_2,a_3, \cdots ,a_{(n-2)},a_{(n-1)},a_{n}$を代入すると、答えは0になるということを表しています。
つまり、$a_1,a_2,a_3, \cdots ,a_{(n-2)},a_{(n-1)},a_{n}$は$f(x)$の解になるということです。
ということは、次数が$n$の$f(x)$の解は最大でも$n$個となるということです。
(「最大でも」と書いたのは、例えば$a_1$と$a_2$が偶然同じ値になったとすると、解は$n$個より少なくなるからです。このような同じ解のことを「重解」と呼びます)

このことは「代数学の基本定理」という立派な名前がついております。
(ちなみに、上の解説は$f(a_1)=0$とか$Q_1(a_2)=0$となるような$a_1$や$a_2$が必ずあるという前提で書いております。でも本当にあるかどうかは証明が必要です。代数学の基本定理ではこのことがきちんと証明されているのですが、複素数のお話になってしまうので、ここでは「まぁ解はあるでしょ。なんか」ぐらいのゆるーい気持ちでいきます)
さて、これで多項式の割り算についての解説はひと段落しました。
次回からは、いよいよリード・ソロモン符号の作り方についてです。