音響基礎知識2/オーディオファイル形式と圧縮技術

2019/04/21
 
この記事を書いている人 - WRITER -
カズノコ
カズノコです。 趣味は自主映画制作、写真撮影、サブカルチャー開拓、銭湯です。 映像編集(After Effects,Premiere Pro)や画像編集(Photo shop,Illustrator)についての情報を発信しています!

こんにちは。カズノコ(@kazunokoblog)です。

オーディオを再生する際最後につく拡張子って一体なんなのか?多くの人が一度は疑問に思ったのではないでしょうか。wave?MP3?なんの暗号だこれは!? ということで、今回はオーディオのファイル形式の種類と使用用途や特徴についてまとめてみたいと思います。そして、後半でファイル形式が多様に存在することに大きく影響している圧縮技術についてまとめています。

はじめに

まず、オーディオファイルと一言にいっても、そもそも「ファイル」とはなんなのでしょうか?デジタル信号は変換したままではただの0と1の羅列に過ぎません。ある規則性を持った集合体にすることで、このデータは扱いやすくなります。このデータや、プログラムの集合体のことを「ファイル」と呼びます。これが文字データなら「テキストファイル」ですし、音声なら「音声ファイル」、画像なら「画像ファイル」、動画なら「ムービーファイル」です。それぞれのジャンルのファイルによってファイル形式は変わってきますが、今回はオーディオの主なファイル形式をご紹介します。扱っているPCやアプリケーションによって使用できる拡張子(ファイル形式)が異なりますのでその点についても解説したいと思います。

オーディオファイルの種類

カッコ内は拡張子を表しています。

MS RIFF WAVEファイル(.wav)

おそらく多くの人が耳にしたことがあるのではないでしょうか。MicrosoftとIBMが規格制定し、Windowsで用いられる標準音声ファイル形式です。「ワブファイル」と呼ばれています。Microsoftサウンドレコーダー(SNDREC32.EXE)で録音、再生が可能です。MacのPCでも再生できます。

AIFFファイル(.aiff/.aif)

「Audio Interchange File Format」の略で、Appleが制定した規格です。Macintoshで標準的に使用されているオーディオファイル形式です。特にデータの圧縮を行なっているファイルを[AIF-C(.aifc)]、[AIFF-Compression]といいます。

Sun/NeXT AUファイル(.au/,snd)

UNIXで最も普及しているオーディオファイル形式の一つです。インターネットでも利用されることが多くあります。μ-law形式、AU形式とも呼ばれています。

RealAudioファイル(.ra/.ram)

PROGRESSIVE NETWORKSが開発したオーディオファイル形式です。[.wav]や[.aiff]や[.au]よりデータサイズが小さいため、インターネットでの送受信に適しています。再生には、Real Playerが必要です。RealAudioEncoderを用いて、[.wav]や[.au]を[.ra]に変換することができます。[.ram(RealAudio Meta File)]は[.ra]ファイルをのURLのみを記述したテキストファイルを指定することにより、ストリーム再生(ダウンロードしながら再生すること)が可能になります。

WMAファイル(.wma)

「Windows Media Audio」の略です。Microsoftのマルチメディア配信技術です。Windows Media Technologiesで用いられ、Windows Media Playerで再生することができます。

MP3(.mp3)

「MPEG-1 Audio Layer 3」の略で、同じデータ、シーケンスや人間の耳には聞こえない帯域の音声データを省略することで、1/10程度のファイルデータサイズに圧縮することが可能です。Webなどからファイルをダウンロードし、専用のプレーヤーでデコードすること多いです。最近ではどのPCでも再生できています。

AAC(.aac)

AACとは、「MPEG 2 Advanced Audio Coding」の略で、MP3以上に高圧縮・高音質を目指した圧縮方法によるオーディオファイル形式です。元の音のソースと区別がつかないほどの高音質を実現しています。MPEG-2とMPEG-4で標準音声として使用されています。サンプリング周波数は8kHz〜96kHzを指定でき、使用できるチャンネル数も1〜48と多くなっています。圧縮率はMP3と比べた場合、約70%のビットレートで同じ品質の音声を得られます。携帯電話の「着うた」や、「iPod」などもこのファイル形式に対応しています。

TwinVQ/SoundVQ/VQファイル(.vqf/.vql)

音質をほとんど損なうことなく、最大で1/20程高い圧縮率を実現したオーディオファイルです。TwinVQを研究開発したのがNTTです。そして、その技術を使用したのがYAMAHAのSoundVQです。

Liquid Audioファイル(.LAR)

音楽配信を目的にLIQUID AUDIOが開発したオーディオファイル形式です。電子透かし技術やストリーミング配信時のフローコントロールが可能です。

RAW Sound(.raw)

ファイル内部にサンプリング・レートなどの情報を持たず、純粋な音声データのみの形式です。Raw Soundデータ、ストレートPCM形式とも呼ばれています。静止画の形式でも[.raw]が存在しますが生のデータという点では類似しています。

MIDIファイル(.mid/.midi)

音声ファイルではありませんが、ファイルサイズが非常に小さく、Web上での音楽演奏に適しています。世界共通のGM(General MIDI)、GM2、ROLANDのGS、YAMAHAのXGなどの音源があり、SMF(Standard MIDI File)のFormat 0、Format 1のデータを[.mid]、[.midi]の拡張子で使用します。Web上で扱う場合は、GM Level 1のSML Format 0を使用するのが一般的です。

主な音声圧縮技術の種類

次に、圧縮技術について少し解説します。

インターネットの普及やレコード技術の進歩(CD-R等のメディア媒体の誕生)により、デジタルオーディオファイルは転送速度やデータ容量に制限がでてきました。より多くのデータを扱うためには、個々のデータファイルを小さくすることが必要となります。そこで登場したのが効率的な圧縮を行える音声圧縮技術です。

リニア

コンビニなどでCDの裏側のデータ容量をみてみるとわかるのですが、CD、CD-R、CD-RWは650〜700MBという制限があります。音声圧縮をしていない音声変換や記録のことを「リニア」と呼びます。音響機材を用いて編集などで用いるマスターは「リニア」の音声記録メディアです。

圧縮技術の基本用語

エンコード

デジタル音声を圧縮すること

デコード

圧縮データを元に戻して、再生可能なデジタル音声にすること。

音声圧縮技術の種類

さて、それでは音声圧縮技術の種類について解説します。後述する[ATRAC][ATRAC3][MP3][TwinVQ]は「非可逆圧縮」という圧縮効率を優先させ、一度圧縮すると完全に元の状態には戻らない方法です。最後の[ロスレス圧縮]は「可逆圧縮」というPCのファイル圧縮などと同じようにオーディオ自体に対して行う圧縮方法です。

ATRAC

MDに使用されている圧縮技術です。「Adaptive Transform Acoustic Coding」の略です。SONYが研究開発した技術で、人間の聴覚特性を利用し、波形データを効果的に間引くことにより、元のデータの音質をほとんど損なうことなく、CDクオリティの音声データを約1/5に圧縮することが可能です。ちなみにCDのビットレートは16ビット、44.1kHz、128kbps、ステレオ音源です。エンコードやデコードに時間がかからないため、マルチトラック・ハードディスク・レコーダーなどのリアルタイムでの音声編集や音声処理機器に応用されています。

ATRAC3

ATRACをさらに1/2サイズに圧縮する技術です。CDの約1/10のサイズへ圧縮することができます。メモリースティックなどを利用し、音楽配信を意識した高音質のデジタル録音/再生が可能なポータブル機器の実現を目指して開発されました。高音質に加え、圧縮スピードや圧縮・復号処理速度に優れています。音楽分野での利用を前提に開発されたことが伺えますね。

波形のパターンを周波数帯域で区切り、さらに2種類に分類することで、より効率的な圧縮を実現していあます。また、0と1で表されるデジタル信号の頻繁に出てくる連番を短いパターンに変更することで、全体のデータ容量を縮小しています。ATRAC3は、著作権保護などの限定ユーザーへの配慮も考慮されています。

MP3

動画や静止画、音声の圧縮技術で有名なMPEG(Moving Picture Experts Group)が提唱する「MPEG-1 Audio Layer3」という規格です。略して[MP3]と呼ばれています。原音のクオリティを保ちながら、1/10程度に圧縮することができます。その仕組みは音響心理上、気にならない部分や、音声データとして必要とされていないところをカットしたり、聴感上気にならない程度の同じ波形の繰り返し部分を一度の命令で実行することでデータサイズを格段に小さくしています。そのため、CD-Rで12時間以上の音楽を再生することができ、転送速度の遅いPC通信でも高音質の音楽を送受信することが可能になります。

TwinVQ

NTTが独自に開発した音声圧縮方式です。MPEG-4/Audioとして採用されています。音質劣化を最小限に抑えながら、データ量を約1/10から1/100まで圧縮できる技術です。圧縮されたビット列の一部からでも音楽再生できる機能です。マルチメディアに対してのサービスに向いている圧縮技術です。例えば、インターネット番組放送や、音楽・ビデオの配信、通信カラオケ、スマホを使った音楽提供など提供領域は多岐に渡ります。

ロスレス圧縮

代表的なものは[WMAロスレス]、[APPLEロスレス]、[MPEG-4 ALS]などがあります。より高音質なサウンドが必要とされるシチュエーションで用いられます。

まとめ

いかがでしたでしょうか。今回はオーディオファイル形式と主な圧縮技術についてご紹介しました。使用頻度の高いオーディオファイル形式から、あまり使われていないもの(聞いたことがないもの)まで様々だったのではないでしょうか。もし、音響関係の仕事を行う場合、納品する際のファイル形式が指定されることが多いので、その時は是非この記事に立ち返ってみてください。

スポンサーリンク



この記事を書いている人 - WRITER -
カズノコ
カズノコです。 趣味は自主映画制作、写真撮影、サブカルチャー開拓、銭湯です。 映像編集(After Effects,Premiere Pro)や画像編集(Photo shop,Illustrator)についての情報を発信しています!

- Comments -

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Copyright© カズノコブログ , 2019 All Rights Reserved.