QRコードの概要
符号化(エンコード)
エラー訂正の概要
エラー訂正に必要な「行列」の解説
「行列」を使ってエラー訂正をしよう
リード・ソロモン符号とエラー訂正の方法
多項式の割り算
リード・ソロモン符号の作り方
ガロア理論と体
QRコードを作ろう
QRコードメーカー
独極・QRコード担当の「あじな」です。
やっと、リード・ソロモン符号の解説が終わったと思ったのに・・・。
次から次へと新しいことが出てきて、もぉ!!
でも、ご安心ください。この「ガロア編」が終われば、やっとQRコードの具体的な説明に戻ることができます!

これまでの復習 [表示する]

  1. QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
  2. QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
  3. 白黒の四角を使うのは、コンピュータにわかりやすくさせるため
  4. QRコードは「機能パターン」と「符号化領域」で出来上がっている
  5. 「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
  6. 「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
  7. 「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「\(4 \times 8=32\)」種類のパターンがある
  8. 「型番情報」は「QRコードのバージョンによって決まり、40種類ある
  9. 「データ領域」は「データ」と「エラー訂正情報」で出来上がる
  10. QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)\( \times \)4\( + \)17」
  11. 「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
  12. 「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
  13. 「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
  14. 日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
  15. QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
  16. どの「エンコード」方式でも、データは「モード指示子」+「文字数指示子」+「データ」+「終端パターン」+「埋め草ビット」+「埋め草ワード」となる
  17. QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
  18. 「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
  19. 「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
  20. 1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
  21. 使える「単語」を制限すると「最小距離」は大きくなる
  22. 「最小距離」の半分までのエラーであれば訂正することができる
  23. 「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
  24. 「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
  25. 「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
  26. 「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
  27. 「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
  28. 「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
  29. 左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
  30. 「行列」の「掛け算」は順番を変えると結果も変わる
  31. 「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
  32. 「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
  33. 「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
  34. 「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
  35. 「列」で計算しても、「行」で計算しても結果は同じ
  36. 「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
  37. 「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
  38. 全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
  39. ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
  40. ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
  41. ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
  42. 2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
  43. 「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
  44. 「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
  45. 「\((-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) \)」を「余因子行列」と呼ぶ
  46. 「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
  47. 「逆行列」は「(元の「行列」の「行列式」の逆数)\(\times\)(x行・y列目の要素が<元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」>となる「行列」)」
  48. 「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
  49. 「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
  50. 「符号」のサイズが1行n列、「エラー訂正付符号」のサイズが1行m列のとき、「生成行列」はn行m列になる
  51. 「QRコード」で利用される「エラー訂正機能付符号」は「リード・ソロモン符号」と呼ばれるもの
  52. 「検査行列」を「エラー訂正機能付符号」に「掛け算」すると結果は「ゼロ行列」になる。逆に「ゼロ行列」にならないと、読み取った「エラー訂正機能付符号」が間違っている
  53. エラー訂正機能のスペックは「n(「エラー訂正機能付符号」の「長さ」)」、「k(実質的に単語を表現する桁数)」、「d(「エラー訂正機能付符号」の間の「最小距離」)」の3つ
  54. エラー訂正機能のスペックの「n(「エラー訂正機能付符号」の「長さ」)」は「検査行列」の行数と同じ
  55. エラー訂正機能のスペックの「k(「実質的に単語を表現する桁数)」は「検査行列」をn行m列だとすると、「n-(検査行列のランク)」となる
  56. 同じ仲間の「エラー訂正機能付符号」を2つ用意すると、それらを「引き算」した結果も同じ仲間の「エラー訂正機能付符号」の1つになる
  57. 「エラー訂正機能付符号」軍団の中の「最小距離」は、その「エラー訂正機能付符号」軍団の中で最も小さい「ハミング重み」と同じになる
  58. エラー訂正機能のスペックの「d(「エラー訂正機能付符号」の間の「最小距離」)」は「(「検査行列」の「ランク」)+1」以上となる
  59. 「シングルトン限界式」は「d(「エラー訂正機能付符号」の間の「最小距離」)」が「n(「エラー訂正機能付符号」の「長さ」)-k(実質的に単語を表現する桁数)+1」以下になること
  60. リード・ソロモンの「検査行列」は、x行y列の要素が\(\alpha^{(x-1)(y-1)}\)で、xはn行まで、yは2t列までの「行列」
  61. リード・ソロモンの「検査行列」のランクは2t
  62. リード・ソロモンの「検査行列」の特徴は、「エラー訂正機能付符号」の「長さ」はn、実質的に単語を表現する桁数)はn-2t、「エラー訂正機能付符号」の間の「最小距離」は2t+1
  63. 「ヴァンデルモンド行列」の行列式は、行列の要素に同じ値のものがなければ「0」にはならない。
  64. 受信符号に検査行列を掛け算した結果は、発生したエラーに検査行列を掛けたものと同じになる、「\(\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}\)」
  65. 「\(\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}\)」を展開すると、方程式の数がn個、未知数が2t個の連立方程式になる
  66. リード・ソロモン符号の解き方は、「01.エラーの発生個数」「02.エラーの発生位置」「03.エラーの内容」の3ステップ
  67. \(\begin{vmatrix} S_0 & S_1 & \ldots & S_{j-1} \\ S_1 & S_2 & \ldots & S_{j} \\ \vdots & \vdots & \ddots & \vdots \\ S_{j-1} & S_{j} & \ldots & S_{ 2j-2 } \\ \end{vmatrix}\)という行列式の\(j\)の値を\(t\)から1つずつ減らしていき、初めて行列式の値が「0」以外になった時の\(j\)がエラーの発生個数になる。
  68. エラーが発生している位置に対応する\(\alpha\)の「逆数」(つまり、\(\alpha^{-p_0},\alpha^{-p_1},\cdots ,\alpha^{-p_{j-2}},\alpha^{-p_{j-1}}\)を入力したときだけ「0]を出力する関数を、\(\boldsymbol{Y} \)と\(\boldsymbol{H}\)の情報から作ることができ、エラーの位置を求めることができる
  69. エラーの位置が分かった状態であれば、元の「\(\boldsymbol{Y} \times \boldsymbol{H} = \boldsymbol{E} \times \boldsymbol{H}\)」を普通の連立方程式のように解くことができ、「エラーの内容」を求めることができる
  70. 多項式を多項式で割り算することができ、割り算した商を\(Q(x)\)、余りを\(R(x)\)とすると、「\(f(x) = g(x)Q(x) + R(x)\)」と書ける
  71. 次数が\(f\)の多項式を次数が\(g\)の多項式で割り算すると余りの多項式の次数は\(g\)未満になる
  72. 多項式\(f(x)\)の解(\(f(a)=0\)となる\(a\)の値)を使うと、\(f(x)=(x-a)R(x)\)と因数分解できる(剰余の定理)
  73. 多項式\(f(x)\)は\(f(x) = (x-a_1)(x-a_2)(x-a_3) \cdots (x-a_{(n-2)})(x-a_{(n-1)})(x-a_{n})\)と因数分解できる(ただし、\(a\)は複素数になることもある)
  74. \(x_0\)〜\(x_{(n-1)}\)を係数にもつ\(n-1\)次の多項式\(f(z)\)(\(f(z)=z^0 x_0 + z^1 x_1 + z^2 x_2 + \cdots + z^{(n-3)} x_{(n-3)} + z^{(n-2)} x_{n-2} + z^{(n-1)}x_{(n-1)})を\((z-\alpha^0)(z-\alpha^1)(z-\alpha^2) \cdots (z-\alpha^{(2t-3)})(z-\alpha^{(2t-2)})(z-\alpha^{(2t-1)})\)で割り切ることができれば、\(x_0\)〜\(x_{(n-1)}\)はリード・ソロモン符号
  75. メッセージ多項式\((m(z)=z^0 m_0 + z^1 m_1 + z^2 m_2 + \cdots + z^{(k-3)} m_{(k-3)} + z^{(k-2)} m_{(k-2)} + z^{(k-1)}m_{(k-1)})\)に\(z^{2t}\)を掛けて、\((z-\alpha^0)(z-\alpha^1)(z-\alpha^2) \cdots (z-\alpha^{(2t-3)})(z-\alpha^{(2t-2)})(z-\alpha^{(2t-1)})\)で割り算した余り\(R(z)\)の多項式の係数を、元のメッセージ符号に付け加えると、リード・ソロモン符号になる

大きな数字の計算は・・・大変だよね

皆さんはこの解説に、\(\alpha^{(2t-1)}\)といった記号がでてきますが、これを本気で計算しようとしたことはありますでしょうか?
例えば、\(\alpha=3,t=10\)だとすれば、\(\alpha^{(2t-1)}=3^19=1,162,261,467\)となります。11億6千2百26万千4百67って・・・・・大きいですよね。
でも、エラー訂正コードの中にはこんなやつがさらっとでてきます。さすがにこれじゃ計算が大変です。もっとなにか良い方法ないものでしょうか?

そこで、利用されるのが「ガロア」という数学者が編み出した「体」という考え方です。
ガロアさんは「5次方程式以上は方程式の係数を利用した解の公式はない!」というなんだかすごそうな理論を編み出した人なのですが、その過程で「群」や「体」という考え方を導入しました。
QRコードで利用しているリード・ソロモン符号ではこのガロアさんの「体」という考え方を利用して、大きな数字を使わなくても計算ができる仕組みを利用しています。

小学校から勉強したことを、いっかいぜーーんぶ忘れてみよう

ところで、\(3 \times 4 =12 \)という数式を考えてみてください。
この数式の3を「パンダ」、4を「ゴリラ」、12を「キツネ」と置き換えると何か問題がおきるのでしょうか?
パンダ \(\times\) ゴリラ \(=\) キツネ
うーん。3や4、12というのはただの記号ですから別にパンダやキツネに置き換えても(なんか不思議な感じはしますが)問題なさそうです。
でも、例えば「キツネ \(\div\) ゴリラ \(=\) サル」という数式がでてきたらどうでしょうか?
これはダメです。だって、\(12 \div 4 = 3 \)なので、キツネ \(\div\) ゴリラ \(=\) はパンダにならなければいけません。

なんで、突然こんなことを言い出したのかというと、実は私たちが小学校から習ってきた数字についていったん忘れてみようと思うからです。
そして、これまで勉強してきた数字以外を使って足し算・掛け算を1から定義していこうと思っています。

えっ!?連載記事を書きすぎておかしくなったのかって?いやいや、私たちの常識では数字は無限にあって、足し算や掛け算をするにはその無限の数字を自由に使えないといけない「気がしています」が、実はそうじゃないんですよ。それが「体」の考え方の神髄です。ここでは、一度小学校で学んだことを忘れて、まっさらな目で読んでみてください。

ちょっと例を出して考えてみましょう

皆さんの私に向けられた疑いの眼差しを少しでも和らげるために、ちょっと例を出しましょうか。
例えば、「整数」を考えてみてください。
整数というのは、1とか-3とか、小数点がつかない数のことですよね。この整数では足し算・掛け算をした結果は、絶対に整数になります。
でも、私たちは1.1とか0.33といった小数点がつく数(実数とか有理数とかですよね)が整数以外にあることを知っています。整数の世界を考えているときには、これらの数はなかったことにして、整数だけを使い続けていいんでしょうか?
もちろん、「いいんです」。整数だけの世界を考えていたら、実数とか有理数なんてものはなくてもいいんです。

おなじ理屈で、「パンダ」「ゴリラ」「ウサギ」という3つの動物の集まりを考えてみてもよいのではないでしょうか?
この動物の世界だけを考えるのならば、整数や実数、有理数を忘れても掛け算と割り算はできるのではないでしょうか?

何のメリットがあるの?

実数や有理数とか、ありとあらゆる数を使わなくても、その一部だけ(整数だけ)とか、まったく別の集まりを使ってもいいことはわかったけど、それってどんないいことがあるの?
そりゃ、そう思いますわね。
私たちが今まで勉強した数字を使わない理由はいろいろあるのですが、QRコードに限って言えば「計算を簡単にするため」です。
例えば、QRコードでは、0〜255までの256個の数字しか使いません!と宣言したとします。
そうすると、どんな複雑な計算をしたとしても、結果として出てくるのは0〜255までの数字です。冒頭に紹介したような「1,162,261,467」なんて数字はでてきません。だからとっても計算がシンプルにできるメリットがあるんです。

そんな勝手が通用すると思ってるのか!

お父さんみたいな怒り方しなくても・・・・。
もちろん、勝手に一部の数字しか使わない(もしくは、動物の集合をつかうとか)ということをするのは勝手ですが、これまで学んできたQRコードの内容が意味がなくなりはしないでしょうか?
例えば、リード・ソロモン符号のときに勉強した、エラーの数を特定する方法については、足し算や掛け算といった今までの算数で学んだことをふんだんに使っています。
新たに導入した「数字」でこれまで学んだことが使えなくなったら、いくら計算がシンプルになっても意味がないですよね。
そこで、「体」において考え出されたのが6個のルールです。このルールさえ守っていれば、これまで学んだ内容をそのまま新しい「数字」の集合に使うことができるんです。
ここでは、そのルールを紹介しましょう。

ルールその01

集合の要素同士に演算(「加法\((+)\)」と「乗法\((\times)\)」)が定義されている。
(使う記号は\((+)\)や\((\times)\)じゃなくて、\((\heartsuit)\)や\((\clubsuit)\)でもなんでもよいです)
さらに、「加法」といったって、私たちが知っている足し算に縛られる必要はありません。「パンダ」と「ライオン」を加法で結ぶと、「ペンギン」になるといった意味不明な関係でも全然OKです。

ルールその02

演算が閉じている。
何言ってるかちょっと・・・。意味が分からないですよね。
例えば、先ほどの3を「パンダ」、4を「ゴリラ」、12を「キツネ」の例だと、「パンダ \(\times\) ゴリラ \(=\) キツネ」は問題なく計算できます。
でも「パンダ \(\times\) キツネ」はどうなるでしょうか?元の置き換えを知っている人は「36!」と答えたくなるかもしれませんが、36に相当する動物は定義されていません。
つまり、計算の結果が定義している記号以外が必要になってしまいます。
数字で計算しているうえでは、どんなに大きな計算をしてもそんなことはおこりませんが、数字の代わりに新たな記号を使うときには、十分に定義されていることに気をつける必要があるのです。
ちなみに、このことを数学では「演算が閉じている」といいます。閉じた世界からはみ出さないという感じでしょうか。

ルールその03

結合法則が成り立つ
結合法則というのは「\((2+3)+4 = 2+(3+4)\)」といったやつです。掛け算のバージョンを書くと、「\((2 \times 3) \times 4 = 2 \times (3 \times 4)\)」ですね。
当たり前のような気もしますが、「\(2+3\)」を「みかん」、「みかん \(+4\)」を「パイナップル」と定義し、「\(3+4\)」を「メロン」、「\(2+\)メロン」を「りんご」と定義すると結合法則の左辺は「パイナップル」になり、右辺は「りんご」になってしまうので、計算の結果が違う(つまり、結合法則が成り立たない)ということが起こりえます。
適当に記号を決めてはいけないのです。

ルールその04

単位元がある
単位元とは計算しても結果を変えないようなものです。
例えば、数の世界では「足し算」の単位元は「0」ですし、「掛け算」の単位元は「1」です。
(「足し算」と「掛け算」で単位元が違っても問題ありません)

ルールその05

逆元がある
逆元とは、計算した結果が「単位元」となるような要素のことです。
例えば、「足し算」の「単位元」を「0」とすると、「5」の逆元は「-5」になります。
また、「掛け算」の「単位元」を「1」とすると、「5」の逆元は「0.2」になります。
このように、数字の世界では当たり前のようにある逆元ですが、新たな記号を決めたときにも用意しておかなければなりません。

ルールその06

演算が可換である
可換というのは、交換しても大丈夫ということです。
例えば、「足し算」の場合、数字の世界で考えると「\(5+2\)」も「\(2+5\)」も同じですね。
「掛け算」の場合も「\(5 \times 2\)」と「\(2 \times 5\)」は同じです。
新しい記号を決めるときには、こんなことまで気を使わないといけないのです。

「からだ」じゃないよ「たい」だよ

いやー。たくさんのルールがありますね。
でも、逆に言えばこの8個のルールさえ満たす集団であれば、普通は考えられないような計算だって(例えば、「\(5 \times 6 = 2\)」なんて不思議な計算式が成り立つようにだって)大丈夫なんです。

こういったルールを満たす集団を「体(たい)」と呼びます。
もちろん、私たちが普段扱っている整数(1,2,3とか-1ってやつです)や有理数(1/3とか72/101とかです)、実数(1とか0.5とか12.3とか)、虚数(1+2iとか0.4-2/3iとか)なんていうのも「体」の一つです。

ここで肝心なのは(そして不思議な感じがするのが)、体であればこれまで解説してきた様々な事象(行列の計算や行列式等)がそのまま使えるということです。
(ただし、「掛け算」や「足し算」はそれぞれの体で決められているルールを守る必要があります。例えば、これまで私たちが常識で思っていた「\(5 \times 6 = 30\)」も、別の体では「\(5 \times 6 = 2\)」となることがあります。それでも、その体のルールに従っている以上、これまで解説してきたことはそのまま成り立つのです)

この「体」については具体的な例がないとよくわからないですよね。
次回はこの「体」の具体例についてみていきます。