2019/02/26

デジタル・アナログとは


デジタル・アナログについて





そもそものデジタル・アナログそれぞれの意味の前に、それらは何について説明しているのでしょうか?







デジタル・アナログは、「なにか」の状態を表す表現方法のことについて説明しています。

辞書的な定義は、大辞泉によると
"物質・システムなどの状態を、離散的な数字・文字などの信号によって表現する方式"
と説明されます。
一方で、アナログは、
"物質・システムなどの状態を連続的に変化する物理量によって表現すること"
ここで重要な違いは、「離散的」なのか、「連続的」なのかになります。
私が調べていていいなと思った例えは、
アナログはスロープ(実際はランプでした、つまり傾斜路)、デジタルは階段
という表現です。
「アナログはスロープで、デジタルは階段」

例えば、時間、温度、湿度などの状態を表現したい時に、アナログの表現方法、デジタルの表現方法がありますね。
時間の変化を、デジタル時計だと数字が次の別の数字に”スパッと”切り変わるのに対し、アナログ時計だとあくまで針の位置が移動することであらわしています。(温度計・湿度計も同様)
ある時間をみるときに、デジタルの場合、例えば秒数まで表示するデジタル時計、12時の時は、「12:00:00」と表現されていますが、アナログの場合は、時計の12時ところに「針が位置していること」で表現されています。
12時0分1秒になる時、アナログ時計の場合はその間も移動して(移動していることによって)、時間を表しているのに対し、デジタルは12時0分0秒の次は12時0分1秒にスパッと切り替わり、その間の時間は表現しません。
つまりデジタルはあくまで、アナログという表現方法内の、決められた範囲を表す「数値」に置き換えているだけなのです。
もちろん、例えば0.000000000001秒も数値で表すことによって、どんどん細かくすることができますが、どこまでいっても連続したものを表すのではなく、時計でいうと瞬間を数字で表しているだけなのです。つまり連続していないのです。途切れているのです。 離散的とはそういうことみたいです。
とびとびというのは、ある数字間は表さないという意味で、1の次に7がくるとか、5の次に0がくるとか、そういう意味では無いようです。


もちろんどんな階段も、ものすごく細かくすることによって、人間にとってはスロープと感じますが、ダニとっては階段で連続しておらず、スロープではないのです。もちろん、ダニとってもスロープと感じるぐらいに、いくらでも細かく階段にすることができるのですが、あくまで階段なのです。そこは精度の問題です。

音のデジタル化

音は空気の振動です。
レコードにその振動(アナログ情報)を連続的に記録します。その振動を針が拾い、すぐ後ろのカートリッジで、コイルと磁石の組み合わせによって、電気信号(アナログ情報)に変換します。その信号はとても小さいものなので、フォノアンプで増幅(アンプリファイ/amplify) して、ライン出力レベルまで上げて、それをスピーカーに送り、音が聞けるようになります。
ちなみに、レコードには、角度45度で溝がV字谷のように彫られており、一方の壁にがRチャンネル、もう一方がLチャンネルとしてステレオ方式で記録されています。
デジタル化とは、ここでフォノアンプで増幅された電気信号を、ケーブルを使ってアナログ/デジタルコンバーター(A/Dコンバータ)に送り、信号に変換します。このA/Dコンバーターは、ターンテーブル自体に内蔵されているものもあります。
このA/Dコンバーターで、アナログ信号を、サンプリング(標本化)して、量子化して、符号化します。

サンプリング/Sampling(標本化)

アナログ信号を一定間隔で抽出します。このときの間隔が短いほど、アナログ信号の波形の再現度が高くなります。
1秒間に何回信号を抽出するかを表す単位としてHzが使われます。この1秒あたりの周波数をサンプリング周波数といいます。
通常CDのサンプリング周波数は44100ヘルツ(44.1キロヘルツ)です。つまり1秒の電気信号を、44100回の細かさで分割しています。
伝送信号の最大周波数(最高音部)の二倍以上の周波数で標本化することで、元の波形が忠実に再現できます。(標本化定理)
標本化定理により、記録するアナログ信号の最大周波数(最高音部分)の2倍で忠実に再現されるということは、逆にいうと、デジタル化で記録すると周波数の半分の値までが忠実に再現されていることになります。ここでどこまで再現するかが音質に関わってくるようです。
人間が聞こえる最大の周波数は20000ヘルツと言われてます。なので、44100ヘルツで記録すると22050ヘルツまで再現できていることになるので、CDのサンプリング周波数、441000回分割して記録するというのは、聞こえない部分は省くという意味で合理的ですね。
ここまでが標本化です。

量子化/Quantizing 

ここで標本化してきた一回あたりの情報を、どのくらいの解像度で記録するかを決めます。一回あたりの情報を、二進法で、2段階の解像度で記録すると1ビット。2ビットだと、二乗して、4段階で記録。

CDは16ビットなので、16乗して、65536段階で記録することができます。
つまり、1秒あたり44100回分割した情報を、一回あたり65536段階で記録しています。
ここで何を記録しているのかというと、電圧になりますが、その一番低い電圧と一番高い電圧の間を何段階で分割して記録するかを決めています。サンプリングで縦に分割したのを、量子化で横に分割したとイメージするといいかもしれません。
量子化の際に、A/D コンバーターにおけるダイナミックレンジが決まります。
ここでいうダイナミックレンジとは、変換できる最大信号のレベルと最小信号のレベルの範囲の幅です。平たくいうと、記録の際に許容される音量の範囲です。
下はノイズ、上は機器が歪みなく扱える音量です。
1ビットだと6デシベルの幅で、24ビットだと144デシベルの幅の音量が歪みなく記録できます。人間が耳を傷めずに聞ける最大音量が120デシベルなので必要十分ですね。実際はそこまでの音量できくことはまずないでしょう。どんな好きな曲でも大きすぎると不快ですからね。

 符号化/Coding

サンプリングで分割された一個のサンプリングを、量子化によって数値化し、機器で扱えるように、1と0を使った二進法で符号化します。これを全てのサンプリングデータに行います。
量子化までの段階では、まだ十進法で表されたデータのままなので、二進法で記録し直す(符号化し直す)みたいです。

ここでできあったデータはもうすでに、音声信号ではなく、数字に記録されたものになっています。この数字を、いままでの逆の操作をすることによってアナログ信号に変えて人間が感知できる音と呼ばれる状態に変化させて、聞くことができます。
パソコン自体は、データを読んでる時点で音を楽しんでいるのかもしれませんね。