コンテンツにスキップ

「フォルマント」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
m ソフトウェアの項目埋めた。あと、文法修正、など。
1行目: 1行目:
''''フォルマント'''、または'''ホルマント'''とは、話している人の[[音声]]の[[スペクトル]]を観察すると、特定のピークが時間的に移動していることが分かる。このピークを言う。周波数の低い順に'''第一フォルマント'''、'''第二フォルマント'''…と言い、周波数は、'''フォルマント周波数'''と呼ばれます。発音する[[音韻]]が同じであれば、似たフォルマントのパターンが観察される。
話している人の[[音声]]の[[スペクトル]]を観察すると、特定のピークが時間的に移動していることが分かる。このピークを''''フォルマント'''、または'''ホルマント'''と言う。周波数の低い順に'''第一フォルマント'''、'''第二フォルマント'''…と言い、周波数は、'''フォルマント周波数'''と呼。発音する[[音韻]]が同じであれば、似たフォルマントのパターンが観察される。


==音声との関係==
==音声との関係==
人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された[[母音]]とは認識できなくなってしまう。[[子音]]では明確なフォルマントは観察できない。
人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された[[母音]]とは認識できなくな。[[子音]]では明確なフォルマントは観察できない。
音声は、[[声帯]]が[[気道]]や口鼻腔で[[共振]]することにより形成される。
音声は、[[声帯]]が[[気道]]や口鼻腔で[[共振]]することにより形成される。
声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば分かる。実際、声帯を失った人に使用される[[人工咽頭]]は、ブーという音しか出ない。
声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される[[人工咽頭]]は、ブーという音しか出ない。
この声帯振動を、[[気道]]や[[鼻腔]]、[[唇]]・[[舌]]・[[歯]]・[[顎]]・[[頬]]で構成される[[口腔]]で共振させることにより、音声に変わる。人が[[言葉]]を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、[[骨格]]が近いことが理由の一と考えられている。
この声帯振動を、[[気道]]や[[鼻腔]]、[[唇]]・[[舌]]・[[歯]]・[[顎]]・[[頬]]で構成される[[口腔]]で共振させることにより、音声に変わる。人が[[言葉]]を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、[[骨格]]が近いことが理由の一と考えられる。


==観察方法==
==観察方法==
[[画像:Spectrogram -iua-.png|thumb|スペクトログラ: アメリカの英語の[i, u, ɑ]のF1とF2]]
[[画像:Spectrogram -iua-.png|thumb|スペクトログラ: アメリカの英語の[i, u, ɑ]のF1とF2]]


観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラフ (Spectrograph) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音([[サンプリング]])したものに[[短時間フーリエ変換]] (STFT) を掛けて作成する。
観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラフ (Spectrograph) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音([[サンプリング]])したものに[[短時間フーリエ変換]] (STFT) を掛けて作成する。
なお、従来のフォルマントの観察は、ソナグラフ (Sonagraph) とか、サウンドスペクトログラフという装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは[[1950年]]ごろに、アメリカの[[ベル研究所]]で発明された。
なお、従来のフォルマントの観察は、[[ソナグラフ]] (Sonagraph) とか、サウンドスペクトログラフという装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは[[1950年]]ごろに、アメリカの[[ベル研究所]]で発明された。


==発音との関係==
==発音との関係==

母音
=== 母 ===


=== 子音 ===



==観察のためのソフトウェア==
==観察のためのソフトウェア==

音声-->フォルマント
フォルマント-->音声
=== 音声-->フォルマント ===

=== フォルマント-->音声 ===
* [http://www.uisoftware.com/PAGES/acceuil_meta.html MetaSynth] ([[Macintosh]]用)
* [http://hem.passagen.se/rasmuse/Coagula.htm Coagula] ([[Microsoft Windows]]用)
* [http://faculty.washington.edu/dillon/PhonResources/javoice/vowjavoice2.html JavOICe] ([[Javaアプレット]]用)

[[電子音楽]] 奏者の何人かは[[画像]]をフォルマントに見立て、音に復調にする手法を使ってが画像を音楽に隠した。たとえば、
* [[Aphex Twin]] は'''MetaSynth'''を使って自分の画像をスペクトログラフに埋め込んだ。この画像は''Windowlicker'' シングルの2曲目、曲の終わりに近い9秒間のスイープ部にある。 ([[MP3]]でも確認できると思うけど、[[圧縮]]によってスペクトログラフが崩れるので[[CD]]ほどクリアな画像ではない。)
* [[Venetian Snares]]のアルバム ''Songs About My Cats''にある''Look''という曲には、彼の飼っている猫の画像が含まれている。


==参照==
==参照==
25行目: 38行目:
*[[音]]
*[[音]]
*[[声紋]] (voice print)
*[[声紋]] (voice print)
*話者から発声者を推定できる。
話者から発声者を推定手法
*[[人工声帯]] ([[音声合成]])
*[[人工声帯]] ([[音声合成]])
*[[音声認識]]
*[[音声認識]]

2005年10月3日 (月) 12:55時点における版

話している人の音声スペクトルを観察すると、特定のピークが時間的に移動していることが分かる。このピークを'フォルマント、またはホルマントと言う。周波数の低い順に第一フォルマント第二フォルマント…と言い、周波数は、フォルマント周波数と呼ぶ。発音する音韻が同じであれば、似たフォルマントのパターンが観察される。

音声との関係

人は、各フォルマント周波数とその時間変化を判断することにより、どの音韻が発音されたかを認識する。フォルマント付近の帯域を除去すると、その発音された母音とは認識できなくなる。子音では明確なフォルマントは観察できない。 音声は、声帯気道や口鼻腔で共振することにより形成される。 声帯の振動は200Hz付近で、ゴム風船のブーという振動とあまり変わらない。喉にマイクを当ててモニターしてみれば実験できる。実際、声帯を失った人に使用される人工咽頭は、ブーという音しか出ない。 この声帯振動を、気道鼻腔で構成される口腔で共振させることにより、音声に変わる。人が言葉を話すことは、共振を制御することに他ならない。親子や兄弟で声が似ているのは、骨格が近いことが理由の一と考えられる。

観察方法

スペクトログラフ: アメリカの英語の[i, u, ɑ]のF1とF2

観察したスペクトルの時間遷移のグラフは、サウンドスペクトログラフ (Spectrograph) と呼ばれる。一般に、縦軸に周波数、横軸に時間を配置している。観察する信号をディジタル録音(サンプリング)したものに短時間フーリエ変換 (STFT) を掛けて作成する。 なお、従来のフォルマントの観察は、ソナグラフ (Sonagraph) とか、サウンドスペクトログラフという装置が使われてきた。これらは分析するための音をいったん録音し、再生時に帯域通過フィルタの周波数を変えながら紙に順次記録していくもので、周波数成分の強い箇所が濃く記録される。ソナグラフは1950年ごろに、アメリカのベル研究所で発明された。

発音との関係

母音

子音

観察のためのソフトウェア

音声-->フォルマント

フォルマント-->音声

電子音楽 奏者の何人かは画像をフォルマントに見立て、音に復調にする手法を使ってが画像を音楽に隠した。たとえば、

  • Aphex TwinMetaSynthを使って自分の画像をスペクトログラフに埋め込んだ。この画像はWindowlicker シングルの2曲目、曲の終わりに近い9秒間のスイープ部にある。 (MP3でも確認できると思うけど、圧縮によってスペクトログラフが崩れるのでCDほどクリアな画像ではない。)
  • Venetian Snaresのアルバム Songs About My CatsにあるLookという曲には、彼の飼っている猫の画像が含まれている。

参照

話者から発声者を推定する手法。