カズノコ(@kazunokoblog)です。今回は、音響基礎知識の1回目ということで、基本的な音の仕組みについて解説していきます。超基本的なところから説明していきますのでご心配なく読んでいただけると幸いです。
音の伝達
そもそも音はどのように私たちの耳に届いているのでしょうか。答えは簡単、「振動」です。音は主に空気を振動させて私たちの耳に届いています。厳密には物体にも振動は伝わりますが。さて、そこで気になるのは、「音が空気を振動する波」であるならば気圧とも関係があるのではないか。もちろんその通りです。学校でこのようなことを習いませんでしたか?
音の速さ(音波) = 約340(m/秒) |
この「約」が気になりませんか?そうです。ここで気圧が関係していたのです。気圧は日々その時々で変化します。これによって音の速さは若干の差が生まれます。そこで学校では日本の平均的な気圧1013hPa、そして気温は摂氏15度で計算した音速340mを使用しているのです。ちなみに、空気以外にも振動するものがあると前述しましたが、参考までに各物質の伝達速度を下記に記します。
水 | 1500(m/秒) |
杉の木 | 4000〜5000(m/秒) |
鉄 | 5950(m/秒) |
ゴム | 34〜70(m/秒) |
音の三大要素
音には3つの要素があります。あれ?色にもあるよね?光にもあるよね?ってことで一旦まとめてみましょう。
色の3原色 | 赤/青/黄 |
光の3原色 | 赤/緑/青 |
音楽の3要素 | リズム/ハーモニー/メロディ |
音の3要素 | 音程/音質/音量 |
ここで改めて音の3要素について簡単に説明します。まず、[音程]は「高い音・低い音」といった基本周波数に起因する要素です。次に[音質]は「明るい音・暗い音」といった音の質に関する要素です。フォルマント周波数という周波数に非常に密接に関わっています。最後に[音量]は「大きい音・小さい音」といった音のボリュームに関する要素です。音はこれらの3要素が合わさってできています。シンセサイザーやサンプラー(ボタンに音を打ち込んで音を作っていく機材)で音色をプログラムする場合などは、この3要素を直接コントロールための知識が重要です。
音程について
音の振動の周期
音の物理的特性を単純に表すと、下記のような図になります。

このような振動が1秒間に何回起きるかを「周波数」と呼び、「Hz(ヘルツ)」という単位で表します。例えば1秒間に1回往復振動すると1Hz、100回往復するならば100Hz、1000回往復するなら1kHz(キロヘルツ)になります。
可聴周波数帯域
人間が音として認識できる音程には限界があります。高すぎたり低すぎたりすると、人間はその音を認識することができません。この「人間が認知できる音の範囲」のことを[可聴周波数帯域]と呼びます。普通の人間が音として認識できるのは[20Hz〜20kHz]とされています。
可聴周波数帯域 | 重低音 | 20Hz〜100Hz | 迫力を出すための帯域 |
低音域 | 20Hz〜600Hz | ベース、ドラム、コントラバス | |
中音域 | 800Hz〜2kHz | 電話、AMラジオ | |
高音域 | 4kHz〜20kHz | ハイハット、シンバル、トライアングル | |
更に高い帯域 | 超音波 | 〜40kHz | 犬、コウモリ、イルカの認識できる音 |
また、音には音程振動の元になっている「基音」とその波形から広域にわたって派生する「倍音」が含まれます。特に「倍音」は超音波領域まで広がっています。
低周波の心因的な特徴
可聴帯域より低い音(20〜30Hz以下)は、空気の振動や揺らぎ、空気圧として身体で感じます。それ故に心因的な特徴があります。低周域には不安を感じさせる要素があり、SF映画やホラー、シリアスな映画では低い周波数を専用のスピーカーで放送し、観客に不安感を与える演出などに使われています。
メディアで求められる周波数
前提として、普通に音楽を楽しむ分には10kHzほど出ていれば問題ありません。実際、AMラジオやテレビの音声では高周波数帯域の音はほとんど聞こえてきません。古い映画の光学サウンドトラックなどでは7kHzくらいまでしか出ていなくても当時としては十分にいい音として認識されていました。現在のCDの規格では[20Hz〜20kHz]が再生可能な範囲です。人間の可聴周波数帯域を考慮すると、妥当な数字だと言えるでしょう。しかし、自然界の音や生演奏などの倍音成分の周波数レンジ(レンジとは幅のことを言います)を考えると、非常に狭い周波数帯域です。CD発売当時は技術的レベルやコストの問題から20Hz〜20kHzが限界であったそうです。現在は、音響研究も進化を遂げ新しいオーディオ規格や再生の技術が求められています。リアルな音の再現は非常に難しい問題なのです。
オクターブについて
オクターブは基準音に対して、「1オクターブ上、2オクターブ上、3オクターブ上・・・」と上がるにつれ、周波数は「2倍、4倍、8倍・・・」と増加していきます。ちなみに、「ラ」の基本振動周波数は440Hzです。「ラ」の基本振動周波数の1オクターブ上は880Hz、2オクターブ上は1760Hzです。
オシレーターについて
音響機器の測定に使用されるのがオシレーター(発振器)です。これは、スピーカーの周波数特性を調べたり、アナログテープの基準音にしたり、音響研究の一助になっている機材です。ネットでもオシレーターの波形を確認できるサイトがありましたのでこちらからご覧ください。大型レコーディング・コンソールに内臓されているものも多いそうです。しかし、ミキサーのみの用途の機材にはあまり入っていないと思います。録音する際、音楽や音声と一緒に低域・中域・高域の各基準音を録音しておいて、再生する際にその基準に従い機器を調整すれば、最良の状態で再生することができます。
しかし、デジタル時代に入り、このようなテクノロジーの進歩の弊害もあります。無音部分や雑音がほとんど聞こえなくなり、再生直前の不注意の大音量でスピーカーやアンプの破損に繋がる可能性があります。再生のためのアンプやスピーカーはアナログですので、オシレーターによる基準音はまだまだ大切な知識になります。
音質(音色)について
音質や音色は一般的にはかなり曖昧な定義しか持っていません。「それぞれの音や楽器のによって違って感じられる音の特性」のように定義されています。「音程」が「基音」を元に要素づけられているのであれば、「音質や音色」を決定づけるものとして「倍音」は非常に重要な要素になります。しかし、音質の違いを感じるためには、音そのものの物理的状態だけでなく、その音と同時に鳴っている別の音や音楽的な意味、そして聞く人の心理的状態や環境要因まで視野に入れなければいけません。まず、人間は「音の出始め」で音質の違いを感じていることを理解しましょう。
しかし、音の振動は目で見ることはできないと思います。では、音の空気振動をマイクで拾うとどうでしょうか?オシロスコープに電気信号の波として出力すれば可視化することができますよね。こういった機器を使うことで、生演奏や自然界の音と電子楽器の音の違いは一目瞭然だと思います。生演奏などは、波形に微妙な揺れが存在し、電子楽器(シンセサイザー等)のような音は波形にあまり変化が出ません。波形は、音質の違いを見るのに最も効果的な方法だと言えるでしょう。
倍音について
バイオリンの音のような生の音は複雑な波形を持っていると言われますが、実はよく分析して見ると、基本波から派生した高い周波数の波(倍音)が合成されて成り立っています。倍音とは、前述しました通りそれぞれの楽器や音の基本波から固有に発生する音のことです。例えば、下記をご覧ください。
音程 | 周波数 | 倍数 | |
基音 | ラ | 440Hz | 1倍 |
第一倍音 | 1オクターブ上のラ | 880Hz | 2倍 |
第二倍音 | その上のミ | 1320Hz | 3倍 |
第三倍音 | 2オクターブ上のラ | 1760Hz | 4倍 |
第四倍音 | その上のド♯ | 2200Hz | 5倍 |
倍音は、基音を基準に倍数と同じように周波数が増加していきます。※オクターブとは関係がないのでここでめちゃくちゃにならないように分離して考えてください。
このように、倍音構成が同じ比率でで平行移動したものが合成されることによって1つの音がメロディを奏でるかのように聞こえるのです。
純音
正弦波は、単一の周波数しか持たない最も基本的な波形でシンセサイザーのようなものを想像してください。このような音のことを「純音」と呼びます。私たちの周りの音はほとんどがこの純音の組み合わせによって成り立っています。そして、いろんな純音を組み合わせれば、波形上ではどんな音でも人工的に作り出すことができます。この考え方を応用したのがパイプ・オルガンです。
フーリエ変換
正弦波合成とは逆に、おる音質の音がどのような倍音で成り立っているのかを分析する作業を「フーリエ変換」と呼びます。一つの音の中にどの周波数の倍音がどの程度の強さで含まれているのかを分析します。よく見るスペクトルでの音の表現(スペクトログラム)は、横軸に周波数、縦軸にレベルのグラフで表現することがよくあります。
様々な波形の種類
代表的な波形に鋸歯波(ノコギリ波)、短形波(パルス波)があります。各波形の種類は下記の表の通りです。このような波形もフーリエ分析を行えば、多くの正弦波に分けることができます。
波形の種類 | 形状 | この特徴のある楽器 |
正弦波 | サインカーブ | シンセサイザー |
鋸歯波(ノコギリ波) | ノコギリの歯のような形状 | バイオリン、ビオラ |
短形波(パルス波) | 四角形 | クラリネット、オーボエ |
三角波 | 三角形 | 正弦波とほぼ同じ |
非対称短形波 | 非対称 | 生ギター、ハープ |
共振(レゾネーション)
音質に影響を与える要素として、「共振(レゾネーション)」があります。ほとんどの楽器がこの共振(レゾネーション)によって音を体系化しています。例えば、アコースティックギターを思い出してみてください。アコースティックギターは弦単体ではすごく小さい音ですが、ボディの木箱の部分に響かせることで大きな味のある音が鳴っていますよね。ここでいう箱の響きが「共振(レゾネーション)」に当たります。このように、音源とは楽器自体が弾かれたり、叩かれたり、吹かれたりしているところだけを指す訳ではなく、その振動を最もよく響かせる場所の音のことを言います。

エレクトリック・ギターの場合も弦振動をピックアップで電気信号に変えアンプで鳴らすだけのように感じるかもしれませんが、ボディの形や材質、ピックアップの性能に左右されるので、共振をアンプで増幅させることになります。
音質コントロール(イコライザー)
音質(音色)を変化させるには「イコライザー」を使います。映像業界でイコライズというと平均化のようなイメージがあるかもしれませんが、音響の世界では意味合いが少し違います。例えば、ミニ・コンポやカー・ステレオに低音や高音をコントロールするツマミが装備されてあると思います。レンタカーとかするとわかりにくいところにありますよねw 簡単にいうと、この低い音や高い音をコントロールするツマミが「イコライザー」のことです。イコライザーの種類についてまとめてこの章は終わりにしようと思います。
イコライザーの種類 | 特徴 |
パッシブ型 | 1つのツマミを回すと、高域が上がり低域が下がる。逆に回すと、高域が下がり低域が上がる。 |
アクティブ型 | 高域と低域にそれぞれツマミがついている。 |
グラフィック・イコライザー | 低域から高域まで1オクターブごとにツマミがついている。 |
パラメトリック・イコライザー | 強調したい、カットしたい周波数を連続的に変化させることができる。 |
主にこれだけの種類のイコライザーが存在します。イコライザーは音の3要素における音質(音色)を変化させるために重要な装置です。
音量について
音量は音の大小のこといいます。音の大きさは音の波の圧力であり、圧力が大きければ大きな音に、小さければ小さな音になります。単純に振幅が大きくなれば大きな音に、反対に振幅が小さければ小さな音になるだけの話です。
dB(デシベル)
音量は、人間の感覚(心的要因)と非常に密接に関わっています。というのも、人間の音程や光に対する感覚は等間隔の変化ではなく、対数による比例カーブに近いのです。これはウェーバー・フィフェナーの法則と呼ばれています。人間の感じる音量の感覚も同じことが言えます。この人間の聴感特性に合った音量を表す単位が「dB(デシベル)」という単位です。
音圧レベル
音圧レベルは0dBが基準になっています。この0dBは一番小さな数値ですが、音圧が0ということが無音ではありません。基準となる音量と等しいだけであり、これは人間が聞くことのできる最も小さな音圧です。デシベルが業界水準である理由は、ヘクトパスカルで表すと10桁以上になる値でも3桁程度で表すことができるからです。音の大きさを表す単位として、「phon(ホン)」というものがありますが、呼び方が違うだけで、意味はデシベルと同じです。日本の騒音の表示でよく「phon(ホン)」が使われますが、音楽音響関係者の間ではデシベルが使用されています。
音量と周波数がおよぼす聴覚的感じ方の特徴
音量の聴感特性は周波数(音の高さに起因する要素)とも密接に関わっています。例えば、音量が同じで周波数の異なる音がある時、聴感上は高い周波数の方に人は敏感に反応します。そして、音量の同じ音で明るい音と暗い音がある場合、聴感上は明るい音の方が音量が上がったように聞こえます。また、音量が大きい時に比べて音量が小さい場合、音に対して聴感感度が鈍くなります。この聴感特性に対して音質を補正するためにオーディオ機器には、ラウドネス・コントロールと呼ばれるものがよく装備されています。
音の要因の比較 | 聴感特性 |
同一音量で周波数が異なる音 | 高い周波数 > 低い周波数 |
同一音量で音質が異なる音 | 明るい音 > 暗い音 |
音量が異なる音 | 聴覚感度が鈍る |
アンプ(増幅器)
アンプとは音量に大きく関わる機材です。振幅を増幅させたり減幅させたりする(減幅はほとんどしません)ことで音量を調節します。アンプの性能を示す単位は「W(ワット)」です。単純にW数が大きいからといって音量が大きいアンプなのかというとそういう訳ではありません。あくまで性能を示す単位だからです。スピーカーの能率(音圧レベルの大小)によって、聴覚上の音量が変わるのです。性能の悪いアンプは音質すら変えてしまいかねませんのでスピーカー選びは慎重に行いましょう。エレクトリック・ギターに使用されるアンプは、この性能の悪さを逆手にとり、音をわざと歪ませることでライブでの臨場感を掻き立てるような音の増幅をしています。
ボリューム(可変抵抗)
ミキシング・コンソールに採用されている縦長のボリュームのことをフェーダーと呼びます。
エンベロープについて
「エンベロープ」とは、音程・音質・音量の時間的な変化のことを言います。ここではエンベロープに密接な関係を持った生演奏の形態を想定し、エンベロープの要素について学びましょう。
エンベロープの要素
音の出方と消え方を分類すると下記のようになります。
エンベロープの種類 | 各エンベロープの説明 |
アタック・タイム | 音が出始めて音量がピークになるまでの時間 |
ディケイ・タイム | 音のピークから音が落ち着くまでの時間 |
サステイン・タイム | 音の持続する時間 |
リリース・タイム | 音がなくなるまで減衰する時間 |
まとめ
今回は、音響についての基礎知識についての記事でした。この内容は、音響機材やDAW、MIDIなど音楽・音響の世界では知っておいて当たり前の知識ですが、意外とちゃんと知らない人が多いのも事実だと感じ、この記事を書きました。今回の内容は音響の基礎の基礎ですが、これを見返せば音響についての理解を深める材料になると思います。
コメントを残す