フォルマント
話している人の音声のスペクトルを観察すると、特定のピークが時間的に移動していることが分かる。このピークをフォルマント、またはホルマントと言う。周波数の低い順に第一フォルマント、第二フォルマント…と言い、それぞれF1, F2と表記する。周波数は、フォルマント周波数と呼ぶ。発音する音韻が同じであれば、似たフォルマントのパターンが観察される。
![](http://upload.wikimedia.org/wikipedia/commons/thumb/7/77/Spectrogram_-iua-.png/220px-Spectrogram_-iua-.png)
音声との関係
人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された母音とは認識できなくなる。子音では明確なフォルマントは観察できない。 音声は、声帯が気道や口鼻腔で共振することにより形成される。 声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される人工咽頭は、ブーという音しか出ない。 この声帯振動を、気道や鼻腔、唇・舌・歯・顎・頬で構成される口腔で共振させることにより、音声に変わる。人が言葉を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、骨格が近いことが理由の一と考えられる。
観察方法
周波数分析器により観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラム (Spectrogram) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音(サンプリング)したものに短時間フーリエ変換 (STFT) を掛けて作成する。 なお、周波数分析には従来、ソナグラフ (Sonagraph) や、サウンドスペクトログラフ (Spectrograph)という装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは1950年ごろに、アメリカのベル研究所で発明された。
発音との関係
母音
子音
観察のためのソフトウェア
音声-->フォルマント
フォルマント-->音声
電子音楽 奏者の何人かは画像をフォルマントに見立て、これを音に復調することで、画像を音楽に埋め込んだ。たとえば、
- アペックス・ツイン 氏はMetaSynthを使って自分の画像をスペクトログラムに埋め込んだ。この画像はWindowlicker シングルの2曲目、曲の終わりに近い9秒間のスイープ部にある。 (ただし、MP3でも確認できると思うけど、圧縮によってスペクトルが崩れるのでCDほどクリアな画像ではない。)
- ベネチアン・スネアス はアルバム Songs About My CatsにあるLookという曲に、飼っている猫の画像を埋め込んだ。
これらのスペクトログラムは、bastwood.comで見ることが出来る。