QRコードの概要

符号化（エンコード）

エラー訂正の概要

エラー訂正に必要な「行列」の解説

「行列」を使ってエラー訂正をしよう

リード・ソロモン符号とエラー訂正の方法

多項式の割り算

リード・ソロモン符号の作り方

ガロア理論と体

QRコードを作ろう

QRコードメーカー

QRコードメーカー(javascript)

独極・QRコード担当の「あじな」です。
QRコードでは、途中まで私たちが普通に使っている数字を使いつつも、エラー訂正の段階になって独自の「体」を使った計算になります。
使っているのが普通の数字なのか、独自の「体」なのかがわかりづらいので、戸惑ってしまいまますよね・・。

これまでの復習 [表示する]

QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
白黒の四角を使うのは、コンピュータにわかりやすくさせるため
QRコードは「機能パターン」と「符号化領域」で出来上がっている
「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「$4 \times 8=32$」種類のパターンがある
「型番情報」は「QRコードのバージョンによって決まり、40種類ある
「データ領域」は「データ」と「エラー訂正情報」で出来上がる
QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)$ \times $4$ + $17」
「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
どの「エンコード」方式でも、データは「モード指示子」＋「文字数指示子」＋「データ」＋「終端パターン」＋「埋め草ビット」＋「埋め草ワード」となる
QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
使える「単語」を制限すると「最小距離」は大きくなる
「最小距離」の半分までのエラーであれば訂正することができる
「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
「行列」の「掛け算」は順番を変えると結果も変わる
「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
「列」で計算しても、「行」で計算しても結果は同じ
「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
「$(-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) $」を「余因子行列」と呼ぶ
「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
「逆行列」は「(元の「行列」の「行列式」の逆数)$\times$(x行・y列目の要素が＜元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」＞となる「行列」)」
「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
「符号」のサイズが1行n列、「エラー訂正付符号」のサイズが1行m列のとき、「生成行列」はn行m列になる
「QRコード」で利用される「エラー訂正機能付符号」は「リード・ソロモン符号」と呼ばれるもの
「検査行列」を「エラー訂正機能付符号」に「掛け算」すると結果は「ゼロ行列」になる。逆に「ゼロ行列」にならないと、読み取った「エラー訂正機能付符号」が間違っている
エラー訂正機能のスペックは「n(「エラー訂正機能付符号」の「長さ」)」、「k(実質的に単語を表現する桁数)」、「d(「エラー訂正機能付符号」の間の「最小距離」)」の3つ
エラー訂正機能のスペックの「n(「エラー訂正機能付符号」の「長さ」)」は「検査行列」の行数と同じ
エラー訂正機能のスペックの「k(「実質的に単語を表現する桁数)」は「検査行列」をn行m列だとすると、「n-(検査行列のランク)」となる
同じ仲間の「エラー訂正機能付符号」を2つ用意すると、それらを「引き算」した結果も同じ仲間の「エラー訂正機能付符号」の1つになる
「エラー訂正機能付符号」軍団の中の「最小距離」は、その「エラー訂正機能付符号」軍団の中で最も小さい「ハミング重み」と同じになる
エラー訂正機能のスペックの「d(「エラー訂正機能付符号」の間の「最小距離」)」は「(「検査行列」の「ランク」)+1」以上となる
「シングルトン限界式」は「d(「エラー訂正機能付符号」の間の「最小距離」)」が「n(「エラー訂正機能付符号」の「長さ」)-k(実質的に単語を表現する桁数)+1」以下になること
リード・ソロモンの「検査行列」は、x行y列の要素が$\alpha^{(x-1)(y-1)}$で、xはn行まで、yは2t列までの「行列」
リード・ソロモンの「検査行列」のランクは2t
リード・ソロモンの「検査行列」の特徴は、「エラー訂正機能付符号」の「長さ」はn、実質的に単語を表現する桁数)はn-2t、「エラー訂正機能付符号」の間の「最小距離」は2t+1
「ヴァンデルモンド行列」の行列式は、行列の要素に同じ値のものがなければ「0」にはならない。
受信符号に検査行列を掛け算した結果は、発生したエラーに検査行列を掛けたものと同じになる、「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」
「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」を展開すると、方程式の数がn個、未知数が2t個の連立方程式になる
リード・ソロモン符号の解き方は、「01.エラーの発生個数」「02.エラーの発生位置」「03.エラーの内容」の3ステップ
$\begin{vmatrix} S_0 & S_1 & \ldots & S_{j-1} \\ S_1 & S_2 & \ldots & S_{j} \\ \vdots & \vdots & \ddots & \vdots \\ S_{j-1} & S_{j} & \ldots & S_{ 2j-2 } \\ \end{vmatrix}$という行列式の$j$の値を$t$から1つずつ減らしていき、初めて行列式の値が「0」以外になった時の$j$がエラーの発生個数になる。
エラーが発生している位置に対応する$\alpha$の「逆数」(つまり、$\alpha^{-p_0},\alpha^{-p_1},\cdots ,\alpha^{-p_{j-2}},\alpha^{-p_{j-1}}$を入力したときだけ「0]を出力する関数を、$\boldsymbol{Y} $と$\boldsymbol{H}$の情報から作ることができ、エラーの位置を求めることができる
エラーの位置が分かった状態であれば、元の「$\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}$」を普通の連立方程式のように解くことができ、「エラーの内容」を求めることができる
多項式を多項式で割り算することができ、割り算した商を$Q(x)$、余りを$R(x)$とすると、「$f(x) = g(x)Q(x) + R(x)$」と書ける
次数が$f$の多項式を次数が$g$の多項式で割り算すると余りの多項式の次数は$g$未満になる
多項式$f(x)$の解($f(a)=0$となる$a$の値）を使うと、$f(x)=(x-a)R(x)$と因数分解できる（剰余の定理）
多項式$f(x)$は$f(x) = (x-a_1)(x-a_2)(x-a_3) \cdots (x-a_{(n-2)})(x-a_{(n-1)})(x-a_{n})$と因数分解できる（ただし、$a$は複素数になることもある）
$x_0$〜$x_{(n-1)}$を係数にもつ$n-1$次の多項式$f(z)$($f(z)=z^0 x_0 + z^1 x_1 + z^2 x_2 + \cdots + z^{(n-3)} x_{(n-3)} + z^{(n-2)} x_{n-2} + z^{(n-1)}x_{(n-1)})を\((z-\alpha^0)(z-\alpha^1)(z-\alpha^2) \cdots (z-\alpha^{(2t-3)})(z-\alpha^{(2t-2)})(z-\alpha^{(2t-1)})$で割り切ることができれば、$x_0$〜$x_{(n-1)}$はリード・ソロモン符号
メッセージ多項式$(m(z)=z^0 m_0 + z^1 m_1 + z^2 m_2 + \cdots + z^{(k-3)} m_{(k-3)} + z^{(k-2)} m_{(k-2)} + z^{(k-1)}m_{(k-1)})$に$z^{2t}$を掛けて、$(z-\alpha^0)(z-\alpha^1)(z-\alpha^2) \cdots (z-\alpha^{(2t-3)})(z-\alpha^{(2t-2)})(z-\alpha^{(2t-1)})$で割り算した余り$R(z)$の多項式の係数を、元のメッセージ符号に付け加えると、リード・ソロモン符号になる
「01.加法と乗法が定義されている」「02.演算が閉じている」「03.結合法則が成り立つ」「04.単位元がある」「05.逆元がある」「06.可換である」の6個のルールを満たす集合を「体」と呼ぶ
「体」であれば、その集合はここで解説している符号化やエラー訂正の理論がそのまま適用できる

QRコードではどんな「体」を使っているの？

これまで解説した符号化やエラー訂正に関する数学の理論は、「数字」を使わなくても、「体」のルールを守った集合であれば適用できるということを見てきました。
では、QRコードではどうしているのでしょうか？
もうずいぶんと昔の解説なので、忘れてしまった人もいるかもしれませんが、QRコードでは表したい文字を「数字モード」「英数字モード」「漢字モード」「8bitモード」のどれかを使って、「1」と「0」の並びに「符号化」しました。
そのあと、生成した「符号」を、リード・ソロモンの方法を使って、「エラー訂正機能付符号(リード・ソロモン符号)」に変換するのでした。
先に結論を書いておくと、QRコードでは、この「符号」を「エラー訂正機能付符号」に変換する際に「1」「0」の並びを独自の「体」に変換します。
具体的には、「1」と「0」の並びを8桁ずつ区切って、8桁ずつQRコードの「体」に含まれている要素を割り当てます。
イメージとしては、「1 0 1 0 0 1 1 0」であれば「パンダ」、「0 0 0 0 0 1 1 1」であれば「キリン」といった感じです。8桁の1,0で表すことができるパターンは$2^8=256$パターンあるので、QRコードで使う「体」も$256$個の要素をもっています。

えっ！まじで！？途中までは普通に符号化を進めていて、途中から「体」に変換するの！？わかりづらい！！

まじです。QRコードでは「256」種類の要素がある特殊な「体」を使っています。ここから、それを見ていきましょう。
前回の解説では、「体」の作り方の1つとして、「素数」で割り算した余りを使うというものがありました。では、QRコードはどんな素数で割り算した結果を使っているのでしょうか？
256に一番近い素数は・・・257がありますので、257で割り算した結果でしょうか？

いいえ。素数で割り算する以外の「体」を作るスペシャルな技をQRコードは使っているんです。
QRコードは「多項式」を「体」の要素としているんです。

・・・・。皆さんの中で「？」が飛び交ってますよね。順を追ってみていきましょう。

多項式で「体」を作る

まず、好きな数字は1,0の並びで表すことができることを想い出してください。
単純に、2進数で表せばよいのです。
例えば、10ならば(00001010)であったり、220ならば(11011100)です。
(大人の都合で、全部で8桁になるように先頭に「0」をつけておりますが、この0は省略することも可能です)

次に、2進数で表した数を多項式($ax^7+bx^6+cx^5+dx^4+ex^3+fx^2+gx+h$を使って無理やり表現してみます。
(この$a,b,c,d,e,f,g,h$に、2進数で表現した$1,0$を当てはめていきます) 例えば220(11011100)ならばこんな風です。
$$ 1x^7+1x^6+0x^5+1x^4+1x^3+1x^2+0x^1+0 $$ さて、こうすることで何がいいことがあるのでしょうか？実は、この多項式で「体」を作ることができるんです。

まず、体の要素ですが(00000000),(00000001),(00000010),$\cdots$,(11111110),(11111111)までで、$2^8=256$個あります。
ということは、多項式もこれにあわせて256個あります。

さて、この256個ある要素に「足し算」と「掛け算」を定義してみましょう。
私たちの普通の常識にある「足し算」と「掛け算」では体にならないことはすぐにわかります。
というのも、例えば次の足し算を見てください。
$$ (1x^7+1x^6+0x^5+1x^4+1x^3+1x^2+0x^1+0) + (0x^7+1x^6+1x^5+1x^4+1x^3+0x^2+0x^1+1) = 1x^7+2x^6+1x^5+2x^4+2x^3+1x^2+0x^1+1 $$ 結果として出てきた$1x^7+2x^6+1x^5+2x^4+2x^3+1x^2+0x^1+1$は、先ほどの256個の要素の中にはありません。
(係数は1か0で、2になるような要素はなかったですよね)

ということは、体のルールその02(演算が閉じている)を破ってしまいます。これでは「体」になりません。

ということで、普通の「足し算」とはルールを少し変えてしまいましょう。
「足し算」の場合、私たちの常識の「足し算」をした後に、各係数を2で割った余りを最終的な係数とする。というルールにします。
各係数を2で割った余りに置き換えるので、係数は必ず「1」か「0」になります。
ということは、256個の要素のどれかになるということです。
先ほどの計算の場合は、係数が「2」のところは2で割ると余りが「0」になり、係数が「1」のところは2で割ると余りが「1」になります。
ということは、こんな感じです。
$$ (1x^7+1x^6+0x^5+1x^4+1x^3+1x^2+0x^1+0) + (0x^7+1x^6+1x^5+1x^4+1x^3+0x^2+0x^1+1) = 1x^7+0x^6+1x^5+0x^4+0x^3+1x^2+0x^1+1 $$ こうすると、足し算においては体のルールその02(演算が閉じている)を守っていることになります。

次に、掛け算について、体のルールその02を見てみましょう。
まず、私たちの普通の常識の掛け算をするとつぎのようになります。
$$ (1x^7+1x^6+0x^5+1x^4+1x^3+1x^2+0x^1+0) \times (0x^7+1x^6+1x^5+1x^4+1x^3+0x^2+0x^1+1) = x^13+2x^12+2x^11+3x^10+3x^9+3x^8+4x^7+3x^6+x^5+x^4+x^3+x^2 $$ ・・・大変です。とても、閉じているどころではありません。。
そもそも、今考えている体の要素は8桁だったのに、掛け算をすると$x^13$なんてものがでてきて、桁数が14桁になってしまいました。
当然、この掛け算の結果は今考えている体の要素に含まれていません。ということは「掛け算」は体のルール02(演算が閉じている)が守れていません。
「掛け算」も私たちの常識のルールを変える必要がありそうです。
そこで、次のように掛け算のルールを変えます。
「掛け算」の場合、私たちの常識の「掛け算」をした後に、「$x^8+x^4+x^3+x^2+1$」で割り算し、その余りを掛け算の結果とする。
(ただし、「余り」の係数は2で割り算した余りとする)

ここで、一度「$x^8+x^4+x^3+x^2+1$」って何者？という疑問はおいといてください。おいおい解説しますが、「既約多項式（きやくたこうしき）」と呼ばれるものです。
掛け算を先ほどのルールにすると、掛け算の結果は、必ず考えている体の要素に落ち着きます。
というのも、普通に掛け算した結果がどんなものになったとしても「$x^8+x^4+x^3+x^2+1$」で割ると、その余りは「$x^7$」より次数の小さい項しかもちません。
さらに、各係数を2で割った余りにするので、結局8桁の1,0に落ち着きます。
これで、掛け算においても体のルールその02をクリアすることがわかりました。

ちなみに、ルールその01「「加法$(+)$」と「乗法$(\times)$」が定義されている」は足し算、掛け算を導入した時点で自然にクリアしております。
ルール03の「結合法則」はどうでしょうか？
足し算の場合、最後の最後で係数を2で割った余りに置き換えることになります。
つまり、置き換える直前までは私たちが知っている常識の多項式の足し算をしているだけです。
そのため、「(多項式A+多項式B)+多項式C」の結果の係数を2で割った余りに置き換えたものと、「多項式A+(多項式B+多項式C)」の結果の係数を2で割った余りに置き換えたものは同じなのです。
つまり、結合法則が成り立っています。
掛け算も同様に、最後の最後で「$x^8+x^4+x^3+x^2+1$」で割り算する前までは通常の多項式の掛け算と同じです。
そのため、「(多項式A$\times$多項式B)$\times$多項式C」の結果を「$x^8+x^4+x^3+x^2+1$」で割り算した余りと、「多項式A$\times$(多項式B$\times$多項式C)」の結果を「$x^8+x^4+x^3+x^2+1$」で割り算した余りとは同じなのです。ここでも結合法則が成り立っています。

さぁ、続けてルール04(単位元がある)です。
これは、簡単です。足し算の場合は「$0x^7+0x^6+0x^5+0x^4+0x^3+0x^2+0x^1+0$(つまり0)」です。これを足しても何の変化も与えませんね。
掛け算の場合は「$0x^7+0x^6+0x^5+0x^4+0x^3+0x^2+0x^1+1$(つまり1です)」です。これを掛けても何の変化も与えませんね。

どんどんいきましょう。ルールその06(可換)です。
(あれ、ルール05を飛ばした？気にしないでください。大人の事情です。後で解説します。)
これも、結合法則のときに説明したのと同じです。足し算の場合、最後の最後で係数を2で割った余りに置き換えることになります。つまり、置き換える直前までは私たちが知っている常識の多項式の足し算をしているだけです。
そのため、「多項式A+多項式B」の結果の係数を2で割った余りに置き換えたものと、「多項式B+多項式A」の結果の係数を2で割った余りに置き換えたものは同じなのです。
つまり、可換になっています。

掛け算も同様に、最後の最後で「$x^8+x^4+x^3+x^2+1$」で割り算する前までは通常の多項式の掛け算と同じです。
そのため、「多項式A$\times$多項式B」の結果を「$x^8+x^4+x^3+x^2+1$」で割り算した余りと、「多項式B$\times$多項式B」の結果を「$x^8+x^4+x^3+x^2+1$」で割り算した余りとは同じなのですここでも可換になっています。
さて、ここまででルール5(逆元がある）以外については、多項式は「体」のルールをクリアすることがわかりました。
あとは、逆元があることさえ示せれば「多項式」をQRコードのエラー訂正の計算に使ってもよさそうです。
このことは、次回からじっくり見ていきましょう。