えっと・・・・・・。そうだ!「QRコード」の解説をしていたんだった!
独極・QRコード担当の「あじな」です。
昨日食べたごはんも思い出せないのに、長いこと「行列」の解説をしてたので本来の目的を忘れてしまいました。。
元はといえば、数字やアルファベット・漢字等を「QRコード」のモードのルールにそって「符号化」した後、適当な1や0をつけることにより「最小距離」を大きくしたいという想いから「行列」を解説し始めました。
「最小距離」を大きくする方法として、「符号」に「生成行列」を「掛け算」するというものがありました。すると、「最小距離」が大きい「エラー訂正機能付符号」ができあがるのでした。
なんで「最小距離」を大きくするかって?「最小距離」が大きいと、エラー訂正できるエラーの個数が多くなるからでしたね。
まず、3桁の1,0の並びを考えます。3桁なので\(2^{3}=8\)種類の文字に対応させることができます。例えば、次のようにしましょう。
000・・・愛
001・・・恋
010・・・好
011・・・求
100・・・抱
101・・・美
110・・・麗
111・・・秀
例えが変だって?例だからなんでもいいんです。愛とか恋とか明るい言葉のほうがいいでしょ。
さて、この「符号化」は全部のパターンに文字を当てはめています。こうすると、例えば「001」の「恋」という符号を1桁でも間違ると違う意味になります(例えば、「000」としてしいまうと「愛」になってしまいます)
これは、全符号に意味を割り当てているので、「エラー訂正」ができない符号ですね。
そこで、各々の「符号」に次の「行列(←皆さん、これが生成行列ですよ!)」を「掛け算」してみましょう。
$$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ 例えば、「恋の」「符号」「001」にこの行列をかけてみましょう。
$$ \begin{pmatrix} 0 & 0 & 1 \\ \end{pmatrix} \times \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} = \begin{pmatrix} 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 \\ \end{pmatrix} $$ となります。0や1の「掛け算」なので簡単ですね。同じように、他の「符号」にも「行列」をかけると次のようになります。
000000000・・・愛 001001001・・・恋 010010010・・・好 011011011・・・求 100100100・・・抱 101101101・・・美 110110110・・・麗 111111111・・・秀 よくみると、元の「符号」を3つ並べたものになってますね。ここで、先ほどのエラー(「恋」の「符号」が1桁よごれてしまった場合)を考えてみましょう。
例えば、「恋」の「符号」を読み取る際にエラーが発生して「000001001」と読み取ったとします。
まず、機械的に「000001001」を探してみると、8文字のどれにも当てはまらないので「何かエラーがおこったな!」と気づくことができます。
次に、8文字の各符号と「000001001」の「距離」を計算してみてください。
000000000・・・愛 との距離は「2」 001001001・・・恋 との距離は「1」 010010010・・・好 との距離は「5」 011011011・・・求 との距離は「4」 100100100・・・抱 との距離は「5」 101101101・・・美 との距離は「4」 110110110・・・麗 との距離は「8」 111111111・・・秀 との距離は「7」 となります。 この中で、距離が最も小さいのは「恋」ということになり、読み取った文字は「恋」だったと推測することができます。
このように「生成行列」を「符号」に「掛け算」すると「エラー訂正機能付符号」に変身することがわかっていただけたでしょうか?
「256」個の意味を表せるのにもかかわらず、「8」個しか表現しないから、1つ1つの「符号」の間の「距離」が大きくなるので、多少エラーが発生しても近くの「符号」を推測することができるのです。
でも、この「生成行列」で生まれる「エラー訂正機能付符号」は確かに「エラー訂正能力」はあるのですが、512種類中8種類しか使わないのはちょっと贅沢すぎる気がします・・・
この「生成符号」の形によって、もっと効率のよい「エラー訂正機能付符号」を生み出す方法が考えられています。
絶妙な「生成行列」はより少ない桁数で、もっとたくさんの誤りを訂正できる能力を秘めているのです・・・・。
次回からは「QRコード」で使われる「生成行列」についてみていきましょう!。
これまでの復習 [表示する]
- QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
- QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
- 白黒の四角を使うのは、コンピュータにわかりやすくさせるため
- QRコードは「機能パターン」と「符号化領域」で出来上がっている
- 「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
- 「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
- 「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「\(4 \times 8=32\)」種類のパターンがある
- 「型番情報」は「QRコードのバージョンによって決まり、40種類ある
- 「データ領域」は「データ」と「エラー訂正情報」で出来上がる
- QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)\( \times \)4\( + \)17」
- 「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
- 「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
- 「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
- 日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
- QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
- どの「エンコード」方式でも、データは「モード指示子」+「文字数指示子」+「データ」+「終端パターン」+「埋め草ビット」+「埋め草ワード」となる
- QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
- 「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
- 「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
- 1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
- 使える「単語」を制限すると「最小距離」は大きくなる
- 「最小距離」の半分までのエラーであれば訂正することができる
- 「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
- 「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
- 「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
- 「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
- 「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
- 「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
- 左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
- 「行列」の「掛け算」は順番を変えると結果も変わる
- 「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
- 「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
- 「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
- 「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
- 「列」で計算しても、「行」で計算しても結果は同じ
- 「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
- 「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
- 全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
- ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
- ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
- ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
- 2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
- 「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
- 「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
- 「\((-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) \)」を「余因子行列」と呼ぶ
- 「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
- 「逆行列」は「(元の「行列」の「行列式」の逆数)\(\times\)(x行・y列目の要素が<元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」>となる「行列」)」
- 「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
- 「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
なんで「行列」をやってたんだっけ?
いやぁ、すっかり当初の目的を忘れてしまいましたね・・・・元はといえば、数字やアルファベット・漢字等を「QRコード」のモードのルールにそって「符号化」した後、適当な1や0をつけることにより「最小距離」を大きくしたいという想いから「行列」を解説し始めました。
「最小距離」を大きくする方法として、「符号」に「生成行列」を「掛け算」するというものがありました。すると、「最小距離」が大きい「エラー訂正機能付符号」ができあがるのでした。
なんで「最小距離」を大きくするかって?「最小距離」が大きいと、エラー訂正できるエラーの個数が多くなるからでしたね。
本当に「エラー訂正機能付符号」ができるの?
せっかく「行列」を学んだので、本当に「行列」を「掛け算」してみる実験をしましょう。まず、3桁の1,0の並びを考えます。3桁なので\(2^{3}=8\)種類の文字に対応させることができます。例えば、次のようにしましょう。
000・・・愛
001・・・恋
010・・・好
011・・・求
100・・・抱
101・・・美
110・・・麗
111・・・秀
例えが変だって?例だからなんでもいいんです。愛とか恋とか明るい言葉のほうがいいでしょ。
さて、この「符号化」は全部のパターンに文字を当てはめています。こうすると、例えば「001」の「恋」という符号を1桁でも間違ると違う意味になります(例えば、「000」としてしいまうと「愛」になってしまいます)
これは、全符号に意味を割り当てているので、「エラー訂正」ができない符号ですね。
そこで、各々の「符号」に次の「行列(←皆さん、これが生成行列ですよ!)」を「掛け算」してみましょう。
$$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ 例えば、「恋の」「符号」「001」にこの行列をかけてみましょう。
$$ \begin{pmatrix} 0 & 0 & 1 \\ \end{pmatrix} \times \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} = \begin{pmatrix} 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 \\ \end{pmatrix} $$ となります。0や1の「掛け算」なので簡単ですね。同じように、他の「符号」にも「行列」をかけると次のようになります。
000000000・・・愛 001001001・・・恋 010010010・・・好 011011011・・・求 100100100・・・抱 101101101・・・美 110110110・・・麗 111111111・・・秀 よくみると、元の「符号」を3つ並べたものになってますね。ここで、先ほどのエラー(「恋」の「符号」が1桁よごれてしまった場合)を考えてみましょう。
例えば、「恋」の「符号」を読み取る際にエラーが発生して「000001001」と読み取ったとします。
まず、機械的に「000001001」を探してみると、8文字のどれにも当てはまらないので「何かエラーがおこったな!」と気づくことができます。
次に、8文字の各符号と「000001001」の「距離」を計算してみてください。
000000000・・・愛 との距離は「2」 001001001・・・恋 との距離は「1」 010010010・・・好 との距離は「5」 011011011・・・求 との距離は「4」 100100100・・・抱 との距離は「5」 101101101・・・美 との距離は「4」 110110110・・・麗 との距離は「8」 111111111・・・秀 との距離は「7」 となります。 この中で、距離が最も小さいのは「恋」ということになり、読み取った文字は「恋」だったと推測することができます。
このように「生成行列」を「符号」に「掛け算」すると「エラー訂正機能付符号」に変身することがわかっていただけたでしょうか?
「生成行列」が肝!
先ほどの例では次の「生成行列」を「掛け算」しました。 $$ \begin{pmatrix} 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0\\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1 & 0\\ 0 & 0 & 1 & 0 & 0 & 1 & 0 & 0 & 1\\ \end{pmatrix} $$ この「生成行列」は3桁の「符号」を「掛け算」することで8桁の「エラー訂正機能付符号」を生み出します。8桁というと本当なら「\(2^8=256\)」個の意味を表すことができます。「256」個の意味を表せるのにもかかわらず、「8」個しか表現しないから、1つ1つの「符号」の間の「距離」が大きくなるので、多少エラーが発生しても近くの「符号」を推測することができるのです。
でも、この「生成行列」で生まれる「エラー訂正機能付符号」は確かに「エラー訂正能力」はあるのですが、512種類中8種類しか使わないのはちょっと贅沢すぎる気がします・・・
この「生成符号」の形によって、もっと効率のよい「エラー訂正機能付符号」を生み出す方法が考えられています。
絶妙な「生成行列」はより少ない桁数で、もっとたくさんの誤りを訂正できる能力を秘めているのです・・・・。
次回からは「QRコード」で使われる「生成行列」についてみていきましょう!。