気づけば、この記事を書き出して数か月がたちました・・・。
独極・QRコード担当の「あじな」です。ようやく、こつこつと作り上げていく楽しみを感じることができるようになりました。
今回から、本格的に「生成行列」について解説していきます。
「生成行列」は、他にもこんなのがあります。
$$ \begin{pmatrix} 1 & 0 & 0 & 0 & 1 & 0 & 1\\ 0 & 1 & 0 & 0 & 1 & 1 & 1\\ 0 & 0 & 1 & 0 & 1 & 1 & 0\\ 0 & 0 & 0 & 1 & 0 & 1 & 1\\ \end{pmatrix} $$ これは、「1行4列(つまり、数字が4個ならんだ行列)」を左から「掛け算」すると、「1行7列」の「エラー訂正機能付符号」を生み出す「生成行列」です。
この「行列」は「誤り訂正」においていろんな能力をもっているので「ハミング符号」という特別な名前がついています。
他にも様々な「生成行列」が考えられておりますが、「QRコード」で使用される「生成行列」は「リード・ソロモン符号」と呼ばれるものです。
そうすると、生み出される「行列」は「1行m列」になり、「m桁」の「符号」が生み出されることになります。
そのときに、前にもでてきた次のような生成行列を使うと、「元の符号の形がそのまま入った符号」が生成されます。
$$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ ポイントははじめの3列で、はじめの3列がのような「単位行列」でできている場合は、必ず「生成される符号」に元の「符号」の形が残ります。
$$ \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{pmatrix} $$ もし、元の符号が1行4列の場合は、生成行列の左側が次にようになっていれば、生成される符号に元の符号が残ります。
$$ \begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\\ \end{pmatrix} $$ このように、「生成符号」の左側が「n行n列(nは元の符号の桁数(列数)と同じ)」である場合、元の「符号」の形を「生成後の符号」にも残すことができます。
このような「生成行列」を「組織的な生成行列」といいます。
さて、次は、「QRコード」で使われている「リード・ソロモン」の前に、寄り道をして、「エラー訂正機能付符号」を検査する役割をもつ「検査行列」について解説いたします。
独極・QRコード担当の「あじな」です。ようやく、こつこつと作り上げていく楽しみを感じることができるようになりました。
今回から、本格的に「生成行列」について解説していきます。
これまでの復習 [表示する]
- QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
- QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
- 白黒の四角を使うのは、コンピュータにわかりやすくさせるため
- QRコードは「機能パターン」と「符号化領域」で出来上がっている
- 「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
- 「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
- 「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「\(4 \times 8=32\)」種類のパターンがある
- 「型番情報」は「QRコードのバージョンによって決まり、40種類ある
- 「データ領域」は「データ」と「エラー訂正情報」で出来上がる
- QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)\( \times \)4\( + \)17」
- 「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
- 「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
- 「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
- 日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
- QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
- どの「エンコード」方式でも、データは「モード指示子」+「文字数指示子」+「データ」+「終端パターン」+「埋め草ビット」+「埋め草ワード」となる
- QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
- 「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
- 「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
- 1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
- 使える「単語」を制限すると「最小距離」は大きくなる
- 「最小距離」の半分までのエラーであれば訂正することができる
- 「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
- 「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
- 「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
- 「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
- 「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
- 「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
- 左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
- 「行列」の「掛け算」は順番を変えると結果も変わる
- 「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
- 「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
- 「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
- 「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
- 「列」で計算しても、「行」で計算しても結果は同じ
- 「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
- 「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
- 全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
- ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
- ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
- ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
- 2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
- 「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
- 「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
- 「\((-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) \)」を「余因子行列」と呼ぶ
- 「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
- 「逆行列」は「(元の「行列」の「行列式」の逆数)\(\times\)(x行・y列目の要素が<元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」>となる「行列」)」
- 「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
- 「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
「生成行列」の種類
前回は、次のような「行列」を「生成行列」として使いました。 $$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ これは、元の「符号」を、同じ符号を3回繰り返す「符号」に変換する「生成行列」でした。「生成行列」は、他にもこんなのがあります。
$$ \begin{pmatrix} 1 & 0 & 0 & 0 & 1 & 0 & 1\\ 0 & 1 & 0 & 0 & 1 & 1 & 1\\ 0 & 0 & 1 & 0 & 1 & 1 & 0\\ 0 & 0 & 0 & 1 & 0 & 1 & 1\\ \end{pmatrix} $$ これは、「1行4列(つまり、数字が4個ならんだ行列)」を左から「掛け算」すると、「1行7列」の「エラー訂正機能付符号」を生み出す「生成行列」です。
この「行列」は「誤り訂正」においていろんな能力をもっているので「ハミング符号」という特別な名前がついています。
他にも様々な「生成行列」が考えられておりますが、「QRコード」で使用される「生成行列」は「リード・ソロモン符号」と呼ばれるものです。
「生成行列」の制約
元の「符号」が「1行n列」でできている場合「生成行列」は「行列」の「掛け算」の制約上、「n行m列」になる必要があります。(mはなんでもよい数字です)そうすると、生み出される「行列」は「1行m列」になり、「m桁」の「符号」が生み出されることになります。
「エラー訂正機能付符号」の中に、元の「符号」がわかりやすく入っているといいよね
何をいっているかというと、例えば、元の「符号」が1行3列だったとします。そのときに、前にもでてきた次のような生成行列を使うと、「元の符号の形がそのまま入った符号」が生成されます。
$$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ ポイントははじめの3列で、はじめの3列がのような「単位行列」でできている場合は、必ず「生成される符号」に元の「符号」の形が残ります。
$$ \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{pmatrix} $$ もし、元の符号が1行4列の場合は、生成行列の左側が次にようになっていれば、生成される符号に元の符号が残ります。
$$ \begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\\ \end{pmatrix} $$ このように、「生成符号」の左側が「n行n列(nは元の符号の桁数(列数)と同じ)」である場合、元の「符号」の形を「生成後の符号」にも残すことができます。
このような「生成行列」を「組織的な生成行列」といいます。
さて、次は、「QRコード」で使われている「リード・ソロモン」の前に、寄り道をして、「エラー訂正機能付符号」を検査する役割をもつ「検査行列」について解説いたします。