独極・QRコード担当の「あじな」です。
解説もついに中盤に差し掛かってきました。まだ中盤かよ・・・と自分でつっこんでしまいます。
「スペック」・・?特殊能力をもった敵と戸田恵梨香が戦うあのドラマ・・ではないですね。面白かったですね。
エラーを訂正する能力のことを「スペック」とここでは呼んでいます。
では、具体的にみていきましょうか。
「エラー訂正」業界では、次の3つの数字をスペックとして使います。
同じ表現力・エラー訂正機能能力であれば、「符号」の長さは「短い」ほうがよいですよね。
だって、1000桁を伝えるのと、10桁を伝えるのであれば10桁のほうが格段に楽ですからね。
これまで見てきたように、「符号」に「生成行列」を「掛け算」すると、「エラー訂正機能付符号」が出来上がります。
そして、元の「符号」よりも「エラー訂正機能付符号」のほうが長くなります。これは、「エラー訂正機能付符号」は「元の符号」を表す部分と「エラー訂正のための情報」を表す部分の2つがあるからです。
「k」は「エラー訂正機能付符号」の中の「元の符号」を表す部分の桁数を表します。
「n」(「エラー訂正機能付符号」の全体の長さ)が同じであれば、「k」は長いほうがよいです。
だって、もしkが1桁しか表せなければ(1,0の符号の場合は)2種類(\(2^{1}=2\))の情報しか持つことができませんが、kが10桁ならば1024種類(\(2^{10}=1024\))の情報を表すことができるからです。
元の「符号」が10個なら、各「符号」に「生成行列」を「掛け算」すると、10個の異なる「エラー訂正機能付符号」ができます。
そして、各「エラー訂正機能付符号」の間には「距離」を計算することができます。「距離」は、2つの「エラー訂正機能付符号」の各要素を比較したときに要素が「異なる」個数のことでしたね。(例えば、「1 0 0 1」と「1 1 0 0」の距離は2番目の要素と4番目の要素が違うので「2」ですね)
そして、「最小距離」というのは全ての「エラー訂正機能付符号」の間の距離を計算したときに、最も小さい距離のことです。
で・・・。それってなんの役に立つの?もー。いやだなぁ。忘れましたか?「最小距離」を解説したときに説明したじゃないですか。
「最小距離」の半分までの個数であれば「エラー訂正」が可能なんです。例えば、最小距離が「5」の場合、2.5個までのエラーであれば訂正することが可能ということになります。
(実際には2.5個のエラーというのは起きないので、2個のエラーまで訂正することができるということですよ) つまり、この「d」は大きければ大きいほど、沢山のエラー訂正をすることができるのです。
当然、世の中そんなに甘くはありません。
「n」を小さくすると、「k」や「d」は小さくなる運命にあります。
(だって、「符号」全体の長さが小さくなるんだから元の符号を表す部分も小さくなるし、符号間の距離も小さくなりますよね。そりゃ。)
また、「k」を大きくすると「d」が小さくなり、「n」が大きくなる運命です。
(元の「符号」間の距離は大体「1」しかない(全ての符号に意味をもたせるので・・・)ので、元の「符号」部分が大きくなれば全体の距離は「小さく」なるし、「符号」全体の大きさは大きくなります。)
このように、それぞれトレードオフの関係にあり、「丁度よいバランス」を見つけ出すことが必要です。
では、次回はこれら、「n」「k」「d」のスペックと「生成行列」「検査行列」の関係について解説します!
解説もついに中盤に差し掛かってきました。まだ中盤かよ・・・と自分でつっこんでしまいます。
これまでの復習 [表示する]
- QRコードは株式会社デンソーが作ったもので、スマホや携帯で読み取れる
- QRコードは「小さな白と黒の四角でできている」「多少汚れても大丈夫」という特徴がある
- 白黒の四角を使うのは、コンピュータにわかりやすくさせるため
- QRコードは「機能パターン」と「符号化領域」で出来上がっている
- 「機能パターン」は、「クワイエットゾーン」「位置検出パターン」「位置検出パターンの分離パターン」「タイミングパターン」「位置合わせパターン」の5種類
- 「符号化領域」は「形式情報」「型番情報」「データ領域」の3種類
- 「形式情報」は「エラー訂正レベル」と「マスクパターン参照子」で決まり、「\(4 \times 8=32\)」種類のパターンがある
- 「型番情報」は「QRコードのバージョンによって決まり、40種類ある
- 「データ領域」は「データ」と「エラー訂正情報」で出来上がる
- QRコードはバージョンが1〜40まである。一辺の大きさは、「QRコードのバージョン(1〜40)\( \times \)4\( + \)17」
- 「エラー訂正レベル」は「L(7%の汚れまで)」「M(15%の汚れまで)」「Q(25%の汚れまで)」「H(30%の汚れまで)」の4種類ある。
- 「エラー訂正レベル」が「L」だと「QRコード」で表現できるデータの量は最大で、「H」のときに最小になる。
- 「1bit」とは白・黒、1・0のような2種類の情報を表すことができる能力のことで、文字を増やすと「2bit(4種類)」「3bit(8種類)」と表現できる種類が増える
- 日常の言葉を「エンコード」して「コード(符号)」に置き換え、「コード(符号)」を「デコード」して日常の言葉に戻す
- QRコードの「エンコード」方式は「数字モード」「英数字モード」「漢字モード」「8bitモード」の4種類
- どの「エンコード」方式でも、データは「モード指示子」+「文字数指示子」+「データ」+「終端パターン」+「埋め草ビット」+「埋め草ワード」となる
- QRコードには「白」と「黒」を読み間違えても、元の情報を復元する「エラー訂正」能力が備わっている
- 「エラー訂正」は読み取れた(聞き取れた)言葉から最も近い「ありえそうな単語」を推測すること
- 「エラー訂正力が強い」ということは、「あえて使っていない単語が多い」ということと同じで、効率性は悪い
- 1,0でできている符号では「ハミング距離(2つの符号間で1と0が異なる箇所の個数)」があり、符号間で最も「ハミング距離」が小さいものを「最小距離」と呼ぶ
- 使える「単語」を制限すると「最小距離」は大きくなる
- 「最小距離」の半分までのエラーであれば訂正することができる
- 「単語」を「符号化」したものに、適当な「1」や「0」を後ろにつけると「最小距離」が大きい「エラー訂正機能付符号」になる
- 「エラー訂正機能付符号」を作る際は「符号」に「行列(生成行列)」を掛け算する。
- 「QRコード」は「リード・ソロモン符号」と呼ばれる方法で「エラー訂正機能付符号」を作る
- 「行列」は数字を並べただけのもので、もともとは「連立方程式」の係数だけ抜き取ってならべたもの
- 「行列」の「足し算」「引き算」は各「行列」の要素同士を「足し算」「引き算」したもの
- 「行列」の「掛け算」は、左の「行列」から「行」を取り出し、右の「行列」から「列」を取り出して、それぞれの要素を掛け算して足し合わせる
- 左の「行列」の大きさが「a行b列」で、右の「行列」の大きさが「b行c列」だった時、「掛け算」結果の行列は「a行c列」になる
- 「行列」の「掛け算」は順番を変えると結果も変わる
- 「掛け算」しても結果を変えない行列を「単位行列」と呼び、「掛け算」すると結果が「単位行列」になる行列を「逆行列」と呼ぶ
- 「行列」の特徴を表している「数字」を「行列式」と呼ぶ。「行列式」は「正方行列」だけが持っている
- 「並び替え」は「置換」によってい表すことができ、偶数回の「置換」でできる「並び替え」を「遇置換」、奇数回の「置換」でできる「並び替え」を「奇置換」という
- 「行列式」は各列から数字を選択し「掛け算」し、符号をつけた(「遇置換→(+)」「奇置換→(-)」たものを全ての選択パターンで足し合わせる。
- 「列」で計算しても、「行」で計算しても結果は同じ
- 「全てが0の列」、もしくは、「すべてが0の行」があれば「行列式」は「0」
- 「列」を入れ替えたら「行列式」の符号が変わる。「行」を入れ替えても「行列式」の符号が変わる。
- 全く同じ「行」が2個以上あれば「行列式」は「0」。全く同じ「列」が2個以上あっても「行列式」は「0」
- ある「行列」の「行列式」は、その「行列」の1つの「列」(もしくは「行」)を2つに分割して、2つの「行列」の「行列式」の「足し算」にすることができる
- ある「行」に違う「行」を「足し引き」しても、「行列式」の結果は変わらない。ある「列」に違う「列」を「足し引き」しても、「行列式」の結果は変わらない。
- ある「行(もしくは列)」を「定数倍」した「行列」の「行列式」は、「定数倍」する前の「行列」の「行列式」に定数をかけたものと同じ
- 2つの「行列」を「掛け算」した結果の「行列」の「行列式」と、それぞれの「行列」の「行列式」を「掛け算」した結果は同じ((\ \left| \mathb{A} \times \mathb{B} \right| = \left| \mathb{A} \right| \times \left| \mathb{B} \right| \))
- 「連立方程式」の係数を抜き出した「行列」の「行列式」の値が「0」になるということは、元の「連立方程式」が「不良設定問題」である
- 「逆行列」は「正方行列」かつ「行列式」の値が「0」でない「行列」だけに存在する
- 「\((-1)^{(i+j)} \times (元の行列からi行目とj列目を取り去った行列) \)」を「余因子行列」と呼ぶ
- 「行列式」は「余因子展開」を使うと、1サイズ小さい「行列」の「行列式」の「足し算」に展開することができる
- 「逆行列」は「(元の「行列」の「行列式」の逆数)\(\times\)(x行・y列目の要素が<元の行列のy行・x列目を取り除いた「余因子行列」の「行列式」>となる「行列」)」
- 「階段行列」は上の行から、左側(0の部分を除きます)を1にして、その行より下の行の左側が0になるように適当な数字をかけて足し算・引き算するというのを繰り返して作る
- 「ランク」はその「行列」の中の独立した行(または列)の数で、「連立方程式」の係数を「行列」にした場合、未知数の数より「ランク」が低ければ「不良設定問題」となる
- 「符号」のサイズが1行n列、「エラー訂正付符号」のサイズが1行m列のとき、「生成行列」はn行m列になる
- 「QRコード」で利用される「エラー訂正機能付符号」は「リード・ソロモン符号」と呼ばれるもの
- 「検査行列」を「エラー訂正機能付符号」に「掛け算」すると結果は「ゼロ行列」になる。逆に「ゼロ行列」にならないと、読み取った「エラー訂正機能付符号」が間違っている
スペック?
さぁ、これまで「生成行列」と「検査行列」を見てきました。「生成行列」や「検査行列」の種類によって出来上がる「エラー訂正機能付符号」の「スペック」も変わります。「スペック」・・?特殊能力をもった敵と戸田恵梨香が戦うあのドラマ・・ではないですね。面白かったですね。
エラーを訂正する能力のことを「スペック」とここでは呼んでいます。
では、具体的にみていきましょうか。
「エラー訂正」業界では、次の3つの数字をスペックとして使います。
その1。「エラー訂正機能付符号」の「長さ」
この「長さ」を表すときは、「n」の文字を使うことが多いです。同じ表現力・エラー訂正機能能力であれば、「符号」の長さは「短い」ほうがよいですよね。
だって、1000桁を伝えるのと、10桁を伝えるのであれば10桁のほうが格段に楽ですからね。
その2。実質的に単語を表現する桁数
この「桁数」を表すときは、「k」の文字を使うことが多いです。これまで見てきたように、「符号」に「生成行列」を「掛け算」すると、「エラー訂正機能付符号」が出来上がります。
そして、元の「符号」よりも「エラー訂正機能付符号」のほうが長くなります。これは、「エラー訂正機能付符号」は「元の符号」を表す部分と「エラー訂正のための情報」を表す部分の2つがあるからです。
「k」は「エラー訂正機能付符号」の中の「元の符号」を表す部分の桁数を表します。
「n」(「エラー訂正機能付符号」の全体の長さ)が同じであれば、「k」は長いほうがよいです。
だって、もしkが1桁しか表せなければ(1,0の符号の場合は)2種類(\(2^{1}=2\))の情報しか持つことができませんが、kが10桁ならば1024種類(\(2^{10}=1024\))の情報を表すことができるからです。
その3。「エラー訂正付符号」の間の「最小距離」
この「距離」を表すときは、「d」の文字を使うことが多いです。元の「符号」が10個なら、各「符号」に「生成行列」を「掛け算」すると、10個の異なる「エラー訂正機能付符号」ができます。
そして、各「エラー訂正機能付符号」の間には「距離」を計算することができます。「距離」は、2つの「エラー訂正機能付符号」の各要素を比較したときに要素が「異なる」個数のことでしたね。(例えば、「1 0 0 1」と「1 1 0 0」の距離は2番目の要素と4番目の要素が違うので「2」ですね)
そして、「最小距離」というのは全ての「エラー訂正機能付符号」の間の距離を計算したときに、最も小さい距離のことです。
で・・・。それってなんの役に立つの?もー。いやだなぁ。忘れましたか?「最小距離」を解説したときに説明したじゃないですか。
「最小距離」の半分までの個数であれば「エラー訂正」が可能なんです。例えば、最小距離が「5」の場合、2.5個までのエラーであれば訂正することが可能ということになります。
(実際には2.5個のエラーというのは起きないので、2個のエラーまで訂正することができるということですよ) つまり、この「d」は大きければ大きいほど、沢山のエラー訂正をすることができるのです。
小さい「n」と、大きい「k」「d」になるような「生成行列」や「検査行列」を教えてください
それがあれば私も知りたいです。当然、世の中そんなに甘くはありません。
「n」を小さくすると、「k」や「d」は小さくなる運命にあります。
(だって、「符号」全体の長さが小さくなるんだから元の符号を表す部分も小さくなるし、符号間の距離も小さくなりますよね。そりゃ。)
また、「k」を大きくすると「d」が小さくなり、「n」が大きくなる運命です。
(元の「符号」間の距離は大体「1」しかない(全ての符号に意味をもたせるので・・・)ので、元の「符号」部分が大きくなれば全体の距離は「小さく」なるし、「符号」全体の大きさは大きくなります。)
このように、それぞれトレードオフの関係にあり、「丁度よいバランス」を見つけ出すことが必要です。
では、次回はこれら、「n」「k」「d」のスペックと「生成行列」「検査行列」の関係について解説します!