「フォルマント」の版間の差分

削除された内容追加された内容

インライン

2007年1月21日 (日) 12:36時点における版

話している人の音声のスペクトルを観察すると、特定のピークが時間的に移動していることが分かる。このピークをフォルマント、またはホルマントと言う(英語表記はformant)。周波数の低い順に第一フォルマント、第二フォルマント…と言い、それぞれF1, F2と表記する。周波数は、フォルマント周波数と呼ぶ。発音する音韻が同じであれば、似たフォルマントのパターンが観察される。

音声との関係

人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された母音とは認識できなくなる。子音では明確なフォルマントは観察できない。母音の弁別は第一フォルマントと第二フォルマントによってほぼ行うことできる。音声は、声帯（vocal fold）の振動によって生成された音源が声道(vocal tract)で共鳴（共振）することにより生成される。声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される人工喉頭は、ブーという音しか出ない。この声帯振動によって生成された声帯音源を、声道つまり咽頭および唇・舌・歯・顎・頬で構成される口腔、鼻腔等で共鳴させ、さらに口から外部の放射、伝搬を経て、音声へと変わる。人が言葉を話すことは、音響音声学的には、音声におけるそれぞれの音韻に必要な共鳴や音声の生成方法を制御すること、つまり調音を行なうことに他ならない。親子や兄弟で声が似ているのは、骨格などの形態が近いことが理由の一と考えられる。

観察方法

周波数分析器により観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラム (Spectrogram) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音（サンプリング)したものに短時間フーリエ変換 (STFT) を掛けて作成する。なお、周波数分析には従来、ソナグラフ (Sonagraph) や、サウンドスペクトログラフ (Spectrograph)という装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは1950年ごろに、アメリカのベル研究所で発明された。

発音との関係

母音

子音

観察のためのソフトウェア

音声-->フォルマント

Audacity (Linux, Macintosh, Windows用)

フォルマント-->音声

電子音楽奏者の何人かは画像をフォルマントに見立て、これを音に復調することで、画像を音楽に埋め込んだ。たとえば、

エイフェックス・ツイン氏はMetaSynthを使って自分の画像をスペクトログラムに埋め込んだ。この画像はWindowlicker シングルの2曲目、曲の終わりに近い9秒間のスイープ部にある。 (ただし、MP3でも確認できると思われるが、圧縮によってスペクトルが崩れるのでCDほどクリアな画像ではない。)
ヴェネチアン・スネアズはアルバム Songs About My CatsにあるLookという曲に、飼っている猫の画像を埋め込んだ。

これらのスペクトログラムは、bastwood.comで見ることが出来る。

@@ 1行目: / 1行目: @@
-話している人の[[音声]]の[[スペクトル]]を観察すると、特定のピークが時間的に移動していることが分かる。このピークを'''フォルマント'''、または'''ホルマント'''と言う。周波数の低い順に'''第一フォルマント'''、'''第二フォルマント'''…と言い、それぞれ'''F1''', '''F2'''と表記する。周波数は、'''フォルマント周波数'''と呼ぶ。発音する[[音韻]]が同じであれば、似たフォルマントのパターンが観察される。
+話している人の[[音声]]の[[スペクトル]]を観察すると、特定のピークが時間的に移動していることが分かる。このピークを'''フォルマント'''、または'''ホルマント'''と言う(英語表記はformant)。周波数の低い順に'''第一フォルマント'''、'''第二フォルマント'''…と言い、それぞれ'''F1''', '''F2'''と表記する。周波数は、'''フォルマント周波数'''と呼ぶ。発音する[[音韻]]が同じであれば、似たフォルマントのパターンが観察される。
 [[画像:Spectrogram -iua-.png|thumb|スペクトログラム: アメリカ英語の[i, u, ɑ]のF1とF2]]
 ==音声との関係==
-人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された[[母音]]とは認識できなくなる。[[子音]]では明確なフォルマントは観察できない。
+人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された[[母音]]とは認識できなくなる。[[子音]]では明確なフォルマントは観察できない。母音の弁別は第一フォルマントと第二フォルマントによってほぼ行うことできる。
-音声は、[[声帯]]が[[気道]]や口鼻腔で[[共振]]することにより形成される。
+音声は、[[声帯]]（vocal fold）の振動によって生成された音源が[[声道]](vocal tract)で[[共鳴]]（[[共振]]）することにより生成される。
-声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される[[人工咽頭]]は、ブーという音しか出ない。
+声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される[[人工喉頭]]は、ブーという音しか出ない。
-この声帯振動を、[[気道]]や[[鼻腔]]、[[唇]]・[[舌]]・[[歯]]・[[顎]]・[[頬]]で構成される[[口腔]]で共振させることにより、音声に変わる。人が[[言葉]]を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、[[骨格]]が近いことが理由の一と考えられる。
+この声帯振動によって生成された声帯音源を、[[声道]]つまり[[咽頭]]および[[唇]]・[[舌]]・[[歯]]・[[顎]]・[[頬]]で構成される[[口腔]]、[[鼻腔]]等で共鳴させ、さらに口から外部の放射、伝搬を経て、音声へと変わる。人が[[言葉]]を話すことは、音響音声学的には、音声におけるそれぞれの音韻に必要な共鳴や音声の生成方法を制御すること、つまり調音を行なうことに他ならない。親子や兄弟で声が似ているのは、[[骨格]]などの[[形態]]が近いことが理由の一と考えられる。
 ==観察方法==
-周波数分析器により観察したスペクトルの時間遷移のグラフは、'''サウンドスペクトログラム''' (Spectrogram) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音（[[サンプリング]]）したものに[[短時間フーリエ変換]] (STFT) を掛けて作成する。
+周波数分析器により観察したスペクトルの時間遷移のグラフは、'''サウンドスペクトログラム''' (Spectrogram) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音（[[サンプリング]])したものに[[短時間フーリエ変換]] (STFT) を掛けて作成する。
 なお、周波数分析には従来、[[ソナグラフ]] (Sonagraph) や、'''サウンドスペクトログラフ''' (Spectrograph)という装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは[[1950年]]ごろに、アメリカの[[ベル研究所]]で発明された。