独極・QRコード担当の「あじな」です。
「行列編」では退屈だなぁと思いながら学んでいた内容がふんだんに出てきます。
学んだことが生きるっていいですね。
「\(d\)」はこれまでの「\(n\)」や「\(k\)」のように「検査行列」からピタッと決めることはできません。
実は「\(d\)」は「検査行列」の特徴から、「○○以上のはず」ということしかわからないのです。
そして、「検査行列」の特徴以外の手がかりを使って、「\(d\)」は▲▲以下のはずという条件を導き出し、結局「\(d\)」は○○以上・▲▲以下という幅をもった決め方しかできないのです。
(とはいえ、○○と▲▲が同じ場合、結果的に「\(d\)」の値が決まることがありますが)
まずは、符号間の「最小距離」の特徴についてじっくり見ていきましょう。
はい。2つの符号の要素を順番に見ていって「要素が違う箇所の個数」が符号の距離になるんでした。
例えば、符号1\(\begin{pmatrix} 4 & 3 & 3 & 1 & 0 \end{pmatrix}\)と符号2\(\begin{pmatrix} 4 & 2 & 3 & 2 & 1 \end{pmatrix}\)の距離は「3」となります。(3箇所違う箇所があるので)
ここまでは、これまで解説した通りですね。
では、先ほどの例で、符号1と符号2を「引き算」したらどうなるでしょうか?これも、行列の四則演算をマスターした皆さんなら簡単な話ですね。
$$ \begin{pmatrix} 4 & 3 & 3 & 1 & 0 \end{pmatrix} - \begin{pmatrix} 4 & 2 & 3 & 2 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 0 & -1 & -1 \end{pmatrix} $$ となります。
このとき、「引き算」した結果の\(\begin{pmatrix} 0 & 1 & 0 & -1 & 1 \end{pmatrix}\)の「ハミング重み」を見てみましょう。
「ハミング重」みは、その符号の「0」ではない要素の個数でした。はい、これも符号1と符号2の距離と同じ「3」になりますね。
よく考えれば、これは当然です。だって、符号間の距離は「二つの符号で異なる要素の数」です。
一方、片方の符号からもう片方の符号を引き算した場合に、「二つの符号で異なる要素」の部分は0以外になりますし、「二つの符号で同じ要素」の部分は0になるので、その「ハミング重み」をみると、元の二つの符号の距離と同じになるのです。
さぁ、ここからがポイントです!
では、もともと符号1と符号2がありましたが、この符号1から符号2を「引き算」した新たな「行列」は「符号」として認められるものなのでしょうか?
つまり、\(\begin{pmatrix} 0 & 1 & 0 & -1 & 1 \end{pmatrix}\)は「符号」として認めてもよいものなのでしょうか?
あっさり答えをいうと、「いいんです」
そもそも、「符号\(\times\)検査行列\(=\)ゼロ行列」となるものを「符号」と認めていいのでした。
では、「(符号1\(-\)符号2)\(\times\)検査行列」はどうなるでしょうか?
「行列」の「掛け算」は「分配法則」が使えるので、上の式は結局「符号1\(\times\)検査行列\(-\)符号2\(\times\)検査行列」となります。
そして「符号1\(\times\)検査行列」も「符号2\(\times\)検査行列」もともにゼロ行列のため、それらの「引き算」もゼロ行列となります。
結局、「(符号1\(-\)符号2)\(\times\)検査行列\(=\)ゼロ行列」が成り立つので、符号1から符号2を「引き算」した新たな「行列」を「符号」と認めてもよいのです。
このことは、適当な2つの符号を取り出して「引き算」しても(ちなみに、「足し算」しても問題ないです)、「引き算」の結果も「符号」となっているということであり、ということは、その2つの符号の距離と同じハミング重みをもつ「符号」が存在するということになります。
以上のことをちょっと真剣に考えると、「最小距離」を実現する2つの「符号」の差も「符号」であり、その最小のハミング重みが最小距離と一致することがわかります。
ふーーーん。で、何が楽しいの。
そんなこと言わないでよー。実は、符号間の距離で最小のものを見つけるのってとっても大変なんです。
例えば全部で10個符号がある場合、その中から2つの符号をとってくる組み合わせは\(10 \times 9 \div 2 = 45\)通りもあります。
(2つの符号を10個の中から選ぶ際、1つ目の符号の選び方は10通りあり、2つ目の符号の選び方は(1つ目に選んだものを除いた9個から選ぶから9通りあり、1つ目と2つ目のパターンの組み合わせは\(10 \times 9\)個あります。ただし1つ目にaを選んで、2つ目にbを選ぶ場合と、1つ目にbを選んで、2つ目にaを選んだ場合の距離は同じなので、2重カウントしないように2で割ってあります)
45個の組み合わせを選んで、それぞれの距離を計算し、最も小さいものを選ぶと最小距離が出ます。
ところが、先ほど見たように必ず最小距離と同じ重みをもつ符号があるならば、10個の符号のうち最も重みが小さいものを見つければそれが最小距離になるはずです。
(すべての要素が0の符号も、「検査行列」と掛け算した結果はゼロ行列になります。ということは、すべての要素が0の「符号」は「符号」として認めてもよいこととなります。そのため、各符号のハミング重みはすべての要素が0の符号との「距離」とみなすこともできます)
この場合だと、たった10個の重みを調べれば最小距離がわかることになります。45個を調べるより、簡単ですね。
さあ、これで最小距離を調べるには、最もハミング重みが小さい符号を見つければよいことがわかりました!
次回はこの事実を利用して、「検査行列」と「最小距離」の関係についてみていきます。
「行列編」では退屈だなぁと思いながら学んでいた内容がふんだんに出てきます。
学んだことが生きるっていいですね。
これまでの復習 [表示する]
- QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
- QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
- 白黒の四角を使うのは、コンピュータにわかりやすくさせるため
- QRコードは「機能パターン」と「符号化領域」で出来上がっている
- 「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
- 「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
- 「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「\(4 \times 8=32\)」種類のパターンがある
- 「型番情報」は「QRコードのバージョンによって決まり、40種類ある
- 「データ領域」は「データ」と「エラー訂正情報」で出来上がる
- QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)\( \times \)4\( + \)17」
- 「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
- 「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
- 「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
- 日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
- QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
- どの「エンコード」方式でも、データは「モード指示子」+「文字数指示子」+「データ」+「終端パターン」+「埋め草ビット」+「埋め草ワード」となる
- QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
- 「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
- 「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
- 1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
- 使える「単語」を制限すると「最小距離」は大きくなる
- 「最小距離」の半分までのエラーであれば訂正することができる
- 「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
- 「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
- 「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
- 「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
- 「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
- 「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
- 左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
- 「行列」の「掛け算」は順番を変えると結果も変わる
- 「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
- 「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
- 「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
- 「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
- 「列」で計算しても、「行」で計算しても結果は同じ
- 「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
- 「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
- 全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
- ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
- ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
- ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
- 2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
- 「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
- 「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
- 「\((-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) \)」を「余因子行列」と呼ぶ
- 「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
- 「逆行列」は「(元の「行列」の「行列式」の逆数)\(\times\)(x行・y列目の要素が<元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」>となる「行列」)」
- 「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
- 「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
- 「符号」のサイズが1行n列、「エラー訂正付符号」のサイズが1行m列のとき、「生成行列」はn行m列になる
- 「QRコード」で利用される「エラー訂正機能付符号」は「リード・ソロモン符号」と呼ばれるもの
- 「検査行列」を「エラー訂正機能付符号」に「掛け算」すると結果は「ゼロ行列」になる。逆に「ゼロ行列」にならないと、読み取った「エラー訂正機能付符号」が間違っている
- エラー訂正機能のスペックは「n(「エラー訂正機能付符号」の「長さ」)」、「k(実質的に単語を表現する桁数)」、「d(「エラー訂正付符号」の間の「最小距離」)」の3つ
- エラー訂正機能のスペックの「n(「エラー訂正機能付符号」の「長さ」)」は「検査行列」の行数と同じ
- エラー訂正機能のスペックの「k(「実質的に単語を表現する桁数)」は「検査行列」をn行m列だとすると、「n-(検査行列のランク)」となる
最後は「d」と「検査行列」の関係
「\(d\)」は符号間の「最小距離」を表すスペックでしたね。「\(d\)」はこれまでの「\(n\)」や「\(k\)」のように「検査行列」からピタッと決めることはできません。
実は「\(d\)」は「検査行列」の特徴から、「○○以上のはず」ということしかわからないのです。
そして、「検査行列」の特徴以外の手がかりを使って、「\(d\)」は▲▲以下のはずという条件を導き出し、結局「\(d\)」は○○以上・▲▲以下という幅をもった決め方しかできないのです。
(とはいえ、○○と▲▲が同じ場合、結果的に「\(d\)」の値が決まることがありますが)
まずは、符号間の「最小距離」の特徴についてじっくり見ていきましょう。
「最小距離」は「最小符号」?
早速ですが、ある符号とある符号の間の距離はどうやって計算するか覚えていますか?はい。2つの符号の要素を順番に見ていって「要素が違う箇所の個数」が符号の距離になるんでした。
例えば、符号1\(\begin{pmatrix} 4 & 3 & 3 & 1 & 0 \end{pmatrix}\)と符号2\(\begin{pmatrix} 4 & 2 & 3 & 2 & 1 \end{pmatrix}\)の距離は「3」となります。(3箇所違う箇所があるので)
ここまでは、これまで解説した通りですね。
では、先ほどの例で、符号1と符号2を「引き算」したらどうなるでしょうか?これも、行列の四則演算をマスターした皆さんなら簡単な話ですね。
$$ \begin{pmatrix} 4 & 3 & 3 & 1 & 0 \end{pmatrix} - \begin{pmatrix} 4 & 2 & 3 & 2 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 0 & -1 & -1 \end{pmatrix} $$ となります。
このとき、「引き算」した結果の\(\begin{pmatrix} 0 & 1 & 0 & -1 & 1 \end{pmatrix}\)の「ハミング重み」を見てみましょう。
「ハミング重」みは、その符号の「0」ではない要素の個数でした。はい、これも符号1と符号2の距離と同じ「3」になりますね。
よく考えれば、これは当然です。だって、符号間の距離は「二つの符号で異なる要素の数」です。
一方、片方の符号からもう片方の符号を引き算した場合に、「二つの符号で異なる要素」の部分は0以外になりますし、「二つの符号で同じ要素」の部分は0になるので、その「ハミング重み」をみると、元の二つの符号の距離と同じになるのです。
さぁ、ここからがポイントです!
では、もともと符号1と符号2がありましたが、この符号1から符号2を「引き算」した新たな「行列」は「符号」として認められるものなのでしょうか?
つまり、\(\begin{pmatrix} 0 & 1 & 0 & -1 & 1 \end{pmatrix}\)は「符号」として認めてもよいものなのでしょうか?
あっさり答えをいうと、「いいんです」
そもそも、「符号\(\times\)検査行列\(=\)ゼロ行列」となるものを「符号」と認めていいのでした。
では、「(符号1\(-\)符号2)\(\times\)検査行列」はどうなるでしょうか?
「行列」の「掛け算」は「分配法則」が使えるので、上の式は結局「符号1\(\times\)検査行列\(-\)符号2\(\times\)検査行列」となります。
そして「符号1\(\times\)検査行列」も「符号2\(\times\)検査行列」もともにゼロ行列のため、それらの「引き算」もゼロ行列となります。
結局、「(符号1\(-\)符号2)\(\times\)検査行列\(=\)ゼロ行列」が成り立つので、符号1から符号2を「引き算」した新たな「行列」を「符号」と認めてもよいのです。
このことは、適当な2つの符号を取り出して「引き算」しても(ちなみに、「足し算」しても問題ないです)、「引き算」の結果も「符号」となっているということであり、ということは、その2つの符号の距離と同じハミング重みをもつ「符号」が存在するということになります。
以上のことをちょっと真剣に考えると、「最小距離」を実現する2つの「符号」の差も「符号」であり、その最小のハミング重みが最小距離と一致することがわかります。
ふーーーん。で、何が楽しいの。
そんなこと言わないでよー。実は、符号間の距離で最小のものを見つけるのってとっても大変なんです。
例えば全部で10個符号がある場合、その中から2つの符号をとってくる組み合わせは\(10 \times 9 \div 2 = 45\)通りもあります。
(2つの符号を10個の中から選ぶ際、1つ目の符号の選び方は10通りあり、2つ目の符号の選び方は(1つ目に選んだものを除いた9個から選ぶから9通りあり、1つ目と2つ目のパターンの組み合わせは\(10 \times 9\)個あります。ただし1つ目にaを選んで、2つ目にbを選ぶ場合と、1つ目にbを選んで、2つ目にaを選んだ場合の距離は同じなので、2重カウントしないように2で割ってあります)
45個の組み合わせを選んで、それぞれの距離を計算し、最も小さいものを選ぶと最小距離が出ます。
ところが、先ほど見たように必ず最小距離と同じ重みをもつ符号があるならば、10個の符号のうち最も重みが小さいものを見つければそれが最小距離になるはずです。
(すべての要素が0の符号も、「検査行列」と掛け算した結果はゼロ行列になります。ということは、すべての要素が0の「符号」は「符号」として認めてもよいこととなります。そのため、各符号のハミング重みはすべての要素が0の符号との「距離」とみなすこともできます)
この場合だと、たった10個の重みを調べれば最小距離がわかることになります。45個を調べるより、簡単ですね。
さあ、これで最小距離を調べるには、最もハミング重みが小さい符号を見つければよいことがわかりました!
次回はこの事実を利用して、「検査行列」と「最小距離」の関係についてみていきます。