ファイルベース時代に学ぶ ビデオ技術(基礎編)第2回 その1: 映像・音声信号の種類と伝送


 本連載では、新しいデジタル放送時代にマッチした映像理論・技術を、業界に仲間入りされた方に向けて発信していきます。

 すでに経験をお持ちで、より深い知識をお求めの方は、兼六館出版株式会社より発刊されている月刊「放送技術」に掲載の、本連載をさらにプロ向けの内容にした「ファイルベース時代に学ぶビデオ技術(プロ編)」をご覧ください。
 最新の掲載情報については、放送技術のFacebookにて御確認ください

電流と映像信号

〜映像信号で豆電球は灯るのか?

 映像信号に感電したという話は聞いたことがありません。しかし映像信号も立派な電気信号ですので、電圧があり、電流も起きるはずです。小学生は豆電球を使って乾電池で電流が起きることを学びますが、同じ方法で、つまり映像出力端子に豆電球をつなげる方法で、映像信号が電流であることを判別できるのでしょうか?

 結論をいうと、映像信号を扱う機器は、入出力端子が75Ωのインピーダンスをもつように設計されています。そして映像信号の電圧はおおむね1V程度となります。これをオームの法則に当てはめると、ケーブルを流れる電流値は瞬間的でも13mA程度、実効値なら9mA以下となり、点灯に500mW(≒300mA)程度の電力が必要な豆電球はおろか、省エネ型のLEDですら点灯させられない値とわかります。

 ここで理解したいのは、映像や音声を伝送する信号は、電流の一形態ではあるものの、豆電球1つ灯すことができないほどの微弱なものであるため外乱に弱く、取り扱いには細心の注意が必要だということです。

アナログ音声信号の特徴

〜周波数未定の連続交流電流

 音波は、空気の密度がわずかに変化する振動として伝わります。マイクロフォンの内部には膜のような構造があり、空気の振動を受けて微弱に振動します。その動きを利用して微弱な発電をしたり、電流値に変化をもたせたりすることで、電圧が波のように変動する音声信号をつくり出します。これを1V程度の電圧になるように増幅したのが、アナログの音声信号です。そのためアナログ音声信号は自然界の空気の動きをそのまま電気に置き換えた要素が強く、機器が異なっても互換性が高いのが特徴の1つです。

 音声信号の波形は、三角関数に使われるサインカーブのように滑らかで、音が大きくなると振幅が大きくなり、音が高くなると振動数(周波数)が大きく小刻みな形状となる性質があります。また、さまざまな周波数の音が混ざり合って音色がつくられるため、実際の音声信号は複雑な形状となり、先端が尖ったようにも見えますが、時間軸方向に拡大すると、やはり滑らかなカーブを描いています(図1)。

 録音時に音量を上げすぎると、録音可能な最大レンジに達した部分の波形に図2のような「角」ができてしまい、俗に「音が割れた」状態となって聞きづらくなります。そのため録音時には音割れが起こらないよう、ピークメーターでのレベルチェックと、ヘッドフォンによる実音の確認を怠らないことが重要となります。

 IT技術が発達した現在では、音源の多くはデジタル記録され、伝送や配信もデジタル信号で行われますが、マイクなどは超小型につくる必要があること、機器の仕様によらず互換性を確保しやすい(=設計の自由度が高い)ことなどから、録音機器にいたる前の集音・ミクシング段階と、再生信号をスピーカーへ伝送する区間ではアナログ音声信号が多用されており、アナログ信号への知識は不可欠となります。

デジタル音声信号の特徴

〜ノイズに強くてノイズに弱い?

 連続するアナログ音声の信号波形をごく短時間ごとに切り分け(サンプリング)、各サンプリング時刻における波形の電圧を数値化(量子化)して並べたものが、デジタル音声信号です(図3)。

 アナログ信号では外乱によってノイズが発生しても、受信した機器側では原音なのかノイズなのかを判断できないため、これを排除することができず、伝送を行うたびにノイズが増えて音質が劣化してしまいます。デジタルの場合は電圧がHiかLoのみの信号で伝送されるため、外乱によってその中間域の電位が生じてもこれをノイズと判断して排除でき、受信側の機器で原音を復活できるのが最大のメリットとなります(図4)。

 実際の伝送データでは、量子化された数値(1サンプリング分の値)を表す数列の前後に、メタ情報や誤り訂正符号などの情報がヘッダーやフッターとして付加されていて、サンプリング周波数などの音声以外の情報も記録、伝送できるようになっています。

 1秒間のサンプリング数(サンプリング周波数)には、32,000回(32kHz)、44,100回(44.1kHz)、48,000回(48kHz)があり、量子化ビット数は16ビット(2^16=65536階調)、20ビット(2^20=1048576階調)、24ビット(2^24=16777216階調)に対応し、これらのなかから選んで使用します。一般的に音楽の業界では、サンプリング周波数はCDに使用されている44.1kHzで運用することが多いですが、映像業界は通常48kHzを使用します。量子化ビット数は、民生用機器の16ビットに対し、業務用VTRフォーマットでは20ビットを使用するものが多かったのですが、ファイルベース時代を迎え、24ビットを使用するものが増えてきました。

 このデジタル音声データは、デジタル端子を介して伝送されますが、音声はステレオで扱われることが多いので、ケーブル1本で2ch分の音声データを伝送できます。しかしデジタル化したことによって、データ量がアナログ時の100倍以上に増え(サンプリング周波数×64倍で計算)、映像信号に近い3MHzという帯域に達します。そのためケーブルの延長によって信号の減衰が起きやすく、ノイズには弱くなりますので(受信側機器で復元はしますが…)、ケーブルの接続や引き回しは慎重に行います。そしてその規格は業務用機器で使用するAES/EBUと、民生用機器で使われるS/P DIFに大別されます。どちらも音声波形部分のデータ構造は共通していますが、メタ情報の使用法が大きく異なっていて、表向きの互換性はありません。まるで中身は同じものなのに、パッケージだけ変えて販売されるOEM商品に似ています。

 余談ですが、ネットで音楽が配信され、これをPCや携帯端末に保存して視聴できる現在では、音の加工や再生リストの作成などの編集作業はすべて機器内で行え、ファイル化されたデータの保存はSDカードなどデジタルメディアへの「コピー」作業で行えます。しかし制作業務の現場では、PC以外の専用機が多用されることから、ファイル化されたデータのコピーではなく、アナログ信号時代と同様にデジタル信号を「伝送」したり、録画機器で「ダビング」を行うことが多く、PCが1台あればなんでもできてしまうわけではない点を理解しておく必要があります。

映像信号の特徴

〜不連続、不定形の不思議系電流のため規格が重要

 縦横2つの次元をもつ「面」としての風景を、1次元の「線」である電気信号にするために、映像信号は人工的なものとなります。画面を走査線に分解し、さらに縦と横の位置を示す「同期信号」を、時分割的に加えた複合信号となり、信号形状も被写体の形状によって決まるため、波形は音声信号のような連続するサインカーブになることはなく、断続的でランダムな形状となります(図5)。この信号の切れ目を利用して文字情報や番組表、アスペクト比やゴースト除去信号、コピー禁止情報などを盛り込むことは、アナログ放送のころから行われてきました。

 また人工的につくられた要素が多い映像信号は、しっかりと規格を決めないと、機器間の互換性が取れなくなってしまう側面があります。そのためSMPTE(米国映画テレビ技術者協会)やITU(国際電気通信連合)、ARIB(電波産業会)などの団体によって標準的な規格が定められ、機器の設計はもとより、映像の調整などもこれらを遵守するように運営することが常識となっています。

 ところで2000年に民放も参加したBSデジタル放送を開始するにあたり、アナログ放送より画面の精細度を高めたハイビジョン映像が採用されたため、映像信号規格はアナログ放送やDVDで扱われるSD映像信号と、ハイビジョン用のHD映像信号に分かれ、それぞれにアナログ方式とデジタル方式が存在することになりました。また近年ではデジタルシネマ並みの精細度を持つ4K映像の放送が予定され、新たな規格の策定と周辺機器の開発が進められています(図6/kiso_1404-1_06b)。

 テレビ番組の制作では、デジタル映像信号として後節で述べるSDI信号が標準的に使われています。一方でSDアナログ映像用のICは安価で種類も多いため、スイッチャーなどの機器を安くつくれる面もあり、SD映像の解像度で運用されるストリーミング映像の現場では、アナログ映像信号を使用するところも残っています。

 音声同様、カメラでデジタル映像を記録し、映像の加工・編集から配信までをPC内で行えるファイルベース環境が整ってきていますが、制作の現場ではケーブルによる単体機器への伝送や、レコーダーへのダビング、VTRを使用するEED(リニア編集)が普通に行われており、映像信号の性質と取り扱いに対する正しい知識が必要といえます。

※本連載は、昨年まで「デジタル時代に学ぶ〜ビデオ技術の基礎」として当サイトに掲載されていた連載記事を改題し、再構成したものです

[映像・音声信号の種類と伝送 その2につづく]

 [ファイルベース時代に学ぶ ビデオ技術(基礎編)]連載リスト
第1回:映像が動いて見えるしくみ
第2回:映像・音声信号の種類と伝送 その1 その2 その3
第3回:ファイルベースフォーマットの概要 その1 その2 その3


About 水城田 志郎

 旧日本ビクター(現JVCケンウッド)にて、ハイビジョンVTRやデジタルVTRの開発に従事する。その後独立して映像制作を行う傍ら、テクニカルライターとして業界誌への執筆活動を行い、解りやすい技術解説には定評がある。一方でNHK放送研修センターや放送系専門学校などで後進の育成にも努める。

同カテゴリーの最新記事