フォルマント
話している人の音声のスペクトルを観察すると、特定のピークが時間的に移動していることが分かる。このピークを'フォルマント、またはホルマントと言う。周波数の低い順に第一フォルマント、第二フォルマント…と言い、周波数は、フォルマント周波数と呼ぶ。発音する音韻が同じであれば、似たフォルマントのパターンが観察される。
音声との関係
人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された母音とは認識できなくなる。子音では明確なフォルマントは観察できない。 音声は、声帯が気道や口鼻腔で共振することにより形成される。 声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される人工咽頭は、ブーという音しか出ない。 この声帯振動を、気道や鼻腔、唇・舌・歯・顎・頬で構成される口腔で共振させることにより、音声に変わる。人が言葉を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、骨格が近いことが理由の一と考えられる。
観察方法
観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラフ (Spectrograph) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音(サンプリング)したものに短時間フーリエ変換 (STFT) を掛けて作成する。 なお、従来のフォルマントの観察は、ソナグラフ (Sonagraph) とか、サウンドスペクトログラフという装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは1950年ごろに、アメリカのベル研究所で発明された。
発音との関係
母音
子音
観察のためのソフトウェア
音声-->フォルマント
フォルマント-->音声
電子音楽 奏者の何人かは画像をフォルマントに見立て、音に復調にする手法を使ってが画像を音楽に隠した。たとえば、
- Aphex Twin はMetaSynthを使って自分の画像をスペクトログラフに埋め込んだ。この画像はWindowlicker シングルの2曲目、曲の終わりに近い9秒間のスイープ部にある。 (MP3でも確認できると思うけど、圧縮によってスペクトログラフが崩れるのでCDほどクリアな画像ではない。)
- Venetian Snaresのアルバム Songs About My CatsにあるLookという曲には、彼の飼っている猫の画像が含まれている。
参照
話者から発声者を推定する手法。