コンテンツにスキップ

「フォルマント」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
ナビゲーションテンプレート追加
整理: 個別記事との重複をmainに置き換え、修正: 要出典範囲追加
(6人の利用者による、間の6版が非表示)
1行目: 1行目:
[[ファイル:Spectrogram -iua-.png|thumb|[[スペクトログラム]]:アメリカ英語の[i, u, ɑ]のF1とF2]]
[[ファイル:Spectrogram -iua-.png|thumb|[[スペクトログラム]]:アメリカ英語の[i, u, ɑ]のF1とF2]]
'''フォルマント''','''形成音'''<ref>小学館『ランダムハウス英和大辞典』</ref>または'''ホルマント'''({{Lang-en-short|''formant''}})は[[音声]]の周波数[[スペクトル]]に現れる、周囲よりも強度が大きい周波数帯域である<ref>"Of a complex sound, a range of frequencies in which there is an absolute or relative maximum in the sound spectrum." Acoustical Society of America. [https://asastandards.org/Terms/formant/ formant].</ref>。
'''フォルマント'''({{Lang-en-short|''formant''}}、''ホルマント'')は[[音声]]の周波数[[スペクトル]]に現れる、周囲よりも強度が大きい周波数帯域である<ref>"Of a complex sound, a range of frequencies in which there is an absolute or relative maximum in the sound spectrum." Acoustical Society of America. [https://asastandards.org/Terms/formant/ formant].</ref>。


== 概要 ==
時間変化する音声を一定区間で区切り周波数領域へ変換すると、周波数帯ごとに強弱がみられる。すなわちスペクトル包絡が山谷をもっている。この山に当たる周波数帯をフォルマントという。フォルマントは複数個存在する場合もあり、[[周波数]]の低い順に'''第一フォルマント'''、'''第二フォルマント'''と呼ばれ、それぞれの周波数を'''F<sub>1</sub>''', '''F<sub>2</sub>'''と表記する<ref>" the formant frequencies could continue to be written as F<sub>1</sub>, …, F<sub>m</sub>" Ingo, et al. (2015). ''[[doi:10.1121/1.4919349|Toward a consensus on symbolic notation of harmonics, resonances, and formants in vocalization]]''.</ref>。また経時的に変化する場合もある。
時間変化する音声を一定区間で区切り周波数領域へ変換すると、周波数帯ごとに強弱がみられる。すなわちスペクトル包絡が山谷をもっている。この山に当たる周波数帯をフォルマントという。フォルマントは複数個存在する場合もあり、[[周波数]]の低い順に'''第一フォルマント'''、'''第二フォルマント'''と呼ばれ、それぞれの周波数を'''F<sub>1</sub>''', '''F<sub>2</sub>'''と表記する<ref name=":0">" the formant frequencies could continue to be written as F<sub>1</sub>, …, F<sub>m</sub>" Ingo, et al. (2015). ''[[doi:10.1121/1.4919349|Toward a consensus on symbolic notation of harmonics, resonances, and formants in vocalization]]''.</ref>。また経時的に変化する場合もある。


声の波形に現れるフォルマントは[[声道]]の形状から強く影響を受ける。ゆえに個体差や性差もフォルマントの違いを生む原因となる。発音する[[音]]が同じであれば各フォルマント周波数は近い値になる。
声の波形に現れるフォルマントは[[声道]]の形状から強く影響を受ける。ゆえに個体差や性差もフォルマントの違いを生む原因となる。[[単音|]]が同じであれば各フォルマント周波数は近い値になる。


== 音声との関係 ==
== 音声との関係 ==
{{Main|声#生成|調音}}
{{出典の明記| date = 2012年2月}}
フォルマントは[[声#生物|発声過程]]における[[調音]]で主に付与される。すなわち比較的平坦な周波数スペクトルをもつ声帯音源が、[[口腔]]や[[鼻腔]]等の声道における共鳴により特定周波数の強調を受けてフォルマントをもつ。


母音の識別には、各フォルマント周波数が重要である。録音した音声から主要フォルマント(主に500~3000Hz近辺に点在する)を除去して再生すると、発音された[[母音]]とは認識できなくなる。逆に楽器などの音波にシンセサイザーやイコライザーなどでフォルマントを模したピークを加ると母音混じったような音声が出来上が。[[阻害音]]では明確なフォルマントは観察できない。母音の弁別は第一フォルマント(約500~1000Hz)と第二フォルマント(約1500~3000Hz)によって大体行うことができる第一、第二といった数字の当て方は研究者や時代によって異なる
母音の識別にはフォルマント周波数が重要である。音声からフォルマントを除去すると[[母音]]とは認識できず、逆にフォルマントを模したピークをると母音混じりの音声が得られる。母音の弁別は第一フォルマント(約500~1000Hz)と第二フォルマント(約1500~3000Hz)によって大体行うことができる<ref>第一、第二といった数字の当て方は研究者や時代によって異なる</ref>。なお、[[阻害音]]では明確なフォルマントは観察できない


{{出典範囲|親子や兄弟で声が似ているのは、[[骨格]]などの形態が近いことも理由の一と言われるが、骨格と大きく相関するフォルマントの高低は音声の個性にはあまり影響しない。音色に影響するのはむしろ声帯の微妙な鳴らし方の違い([[声種]])で、これは習慣的なものである|date=2023年4月}}{{要出典範囲|似た声になるのは、聴き慣れた家族の声を無意識にまねることのほかに、使う発声が親から遺伝していることも理由である(使う発声とはあくまで「発声練習などを何もしていない状態」でのものであり、練習次第で遺伝した発声を変えていくこともできる)|date=2023年4月}}
音声は、[[声帯]]({{lang-en-short|''vocal fold''}})の振動によって生成された音波(喉頭原音)が[[声道]]({{lang-en-short|''vocal tract''}})で[[共鳴]]することで形成される。音声の源となる声帯振動は会話の時は100~200Hz付近で、ゴム風船のブーという振動とあまり変わらない。この音は喉に直接マイクを当てれば聴くことができる。また、声帯を失った人に使用される[[人工声帯]]は、ブーという音しか出ない。この声帯音源が、[[声道]]つまり[[咽頭]][[喉頭]]および[[唇]]・[[舌]]・[[歯]]・[[顎]]・[[頬]]で構成される[[口腔]]、さらに[[鼻腔]]、[[副鼻腔]]で共鳴することによって特定帯域ごとに[[倍音]]が増幅される。この増幅された成分の塊もしくはピークをフォルマントと言う。この音は、さらに口から外部への放射、伝播を経て、我々が普段耳にしている音声へと変わる。

人が[[言葉]]を発するということは、音響音声学的には、音声におけるそれぞれの音韻に必な共鳴や生成方法を制御することで、これを調音または構音という。親子や兄弟で声が似ているのは、[[骨格]]などの形態が近いことも理由の一と言われるが、骨格と大きく相関するフォルマントの高低は音声の個性にはあまり影響しない。音色に影響するのはむしろ声帯の微妙な鳴らし方の違い([[声種]])で、これは習慣的なものである。似た声になるのは、聴き慣れた家族の声を無意識にまねることのほかに、使う発声が親から遺伝していることも理由である(使う発声とはあくまで「発声練習などを何もしていない状態」でのものであり、練習次第で遺伝した発声を変えていくこともできる)。


== 観察方法 ==
== 観察方法 ==
22行目: 22行目:
* [[線形予測符号|線形予測符号 (LPC)]]
* [[線形予測符号|線形予測符号 (LPC)]]


フォルマントは元来スペクトログラム上の黒い帯として(大雑把に)定義された。そのため、数学的・[[音声学]]的に厳密なフォルマントの定義は存在しない。より客観的にフォルマントを記述するパラメータにはピーク周波数(F<sub>n</sub>)、ピーク強度(L<sub>Fn</sub>)、バンド幅(B<sub>Fn</sub>)がある。
フォルマントは元来スペクトログラム上の黒い帯として(大雑把に)定義された。そのため、数学的・[[音声学]]的に厳密なフォルマントの定義は存在しない。より客観的にフォルマントを記述するパラメータにはピーク周波数(F<sub>n</sub>)、ピーク強度(L<sub>Fn</sub>)、バンド幅(B<sub>Fn</sub>)がある<ref name=":0" />


== 発音との関係 ==
== 発音との関係 ==
=== 母音 ===
=== 母音 ===
概して、F1は狭めさに比例する。つまり高母音のほうが低母音よりもF1は低い。母音、子音両方に言えることであるが、狭めはF1を低くする効果がある。
概して、F1は'''口開きの大き'''に比例する。つまり高母音のほうが低母音よりもF1は低い。母音、子音両方に言えることであるが、狭めはF1を低くする効果がある。


F2は舌の前後によって影響され、前母音のほうが後母音よりもF2が高い。これは、F2が舌の前の空間で共鳴を起こすためである。また後母音は、唇の丸めが加わることが多く、これによって共鳴空間がさらに長くなり、F2は下がる。
F2は舌の前後によって影響され、前母音のほうが後母音よりもF2が高い。これは、F2が舌の前の空間で共鳴を起こすためである。また後母音は、唇の丸めが加わることが多く、これによって共鳴空間がさらに長くなり、F2は下がる。
<!-- === 子音 === -->

== 観察のためのソフトウェア及びハードウェア==
== 観察のためのソフトウェア及びハードウェア==
=== 音声からサウンドスペクトログラムを生成 ===
=== 音声からサウンドスペクトログラムを生成 ===
39行目: 37行目:


=== フォルマントから音を生成 ===
=== フォルマントから音を生成 ===
* [[PLG100-SG]] - 有声音無声音共通の第一~第六フォルマントと、有声音専用のバズバー及びナザル(鼻音)フォルマントを組み合わせて音を生成する<ref>[http://www2.yamaha.co.jp/manual/pdf/emi/japan/xg/PLG100SGJ.pdf PLG100-SG取扱説明書] YAMAHA</ref>。
* [[PLG100-SG]] - 有声音無声音共通の第一~第六フォルマントと、有声音専用のバズバー及びナザル(鼻音)フォルマントを組み合わせて音を生成する<ref>[https://jp.yamaha.com/files/download/other_assets/0/316480/PLG100SGJ.pdf PLG100-SG取扱説明書] YAMAHA</ref>。


== 脚注 ==
== 脚注 ==
56行目: 54行目:
* [[音声分析]]
* [[音声分析]]
* [[線形予測符号]]
* [[線形予測符号]]

<!-- == 外部リンク == {{Cite web}} -->


{{Language-stub}}
{{Language-stub}}

2023年4月7日 (金) 04:55時点における版

スペクトログラム:アメリカ英語の[i, u, ɑ]のF1とF2

フォルマント: formantホルマント)は音声の周波数スペクトルに現れる、周囲よりも強度が大きい周波数帯域である[1]

概要

時間変化する音声を一定区間で区切り周波数領域へ変換すると、周波数帯ごとに強弱がみられる。すなわちスペクトル包絡が山谷をもっている。この山に当たる周波数帯をフォルマントという。フォルマントは複数個存在する場合もあり、周波数の低い順に第一フォルマント第二フォルマントと呼ばれ、それぞれの周波数をF1, F2と表記する[2]。また経時的に変化する場合もある。

声の波形に現れるフォルマントは声道の形状から強く影響を受ける。ゆえに個体差や性差もフォルマントの違いを生む原因となる。音価が同じであれば各フォルマント周波数は近い値になる。

音声との関係

フォルマントは発声過程における調音で主に付与される。すなわち比較的平坦な周波数スペクトルをもつ声帯音源が、口腔鼻腔等の声道における共鳴により特定周波数の強調を受けてフォルマントをもつ。

母音の識別にはフォルマント周波数が重要である。音声からフォルマントを除去すると母音とは認識できず、逆にフォルマントを模したピークを追加すると母音混じりの音声が得られる。母音の弁別は第一フォルマント(約500~1000Hz)と第二フォルマント(約1500~3000Hz)によって大体行うことができる[3]。なお、阻害音では明確なフォルマントは観察できない。

親子や兄弟で声が似ているのは、骨格などの形態が近いことも理由の一と言われるが、骨格と大きく相関するフォルマントの高低は音声の個性にはあまり影響しない。音色に影響するのはむしろ声帯の微妙な鳴らし方の違い(声種)で、これは習慣的なものである[要出典]似た声になるのは、聴き慣れた家族の声を無意識にまねることのほかに、使う発声が親から遺伝していることも理由である(使う発声とはあくまで「発声練習などを何もしていない状態」でのものであり、練習次第で遺伝した発声を変えていくこともできる)[要出典]

観察方法

以下のいずれかの方法によって観察される。

フォルマントは元来スペクトログラム上の黒い帯として(大雑把に)定義された。そのため、数学的・音声学的に厳密なフォルマントの定義は存在しない。より客観的にフォルマントを記述するパラメータにはピーク周波数(Fn)、ピーク強度(LFn)、バンド幅(BFn)がある[2]

発音との関係

母音

概して、F1は口の開きの大きさに比例する。つまり高母音のほうが低母音よりもF1は低い。母音、子音両方に言えることであるが、狭めはF1を低くする効果がある。

F2は舌の前後によって影響され、前母音のほうが後母音よりもF2が高い。これは、F2が舌の前の空間で共鳴を起こすためである。また後母音は、唇の丸めが加わることが多く、これによって共鳴空間がさらに長くなり、F2は下がる。

観察のためのソフトウェア及びハードウェア

音声からサウンドスペクトログラムを生成

フォルマントから音を生成

  • PLG100-SG - 有声音無声音共通の第一~第六フォルマントと、有声音専用のバズバー及びナザル(鼻音)フォルマントを組み合わせて音を生成する[4]

脚注

  1. ^ "Of a complex sound, a range of frequencies in which there is an absolute or relative maximum in the sound spectrum." Acoustical Society of America. formant.
  2. ^ a b " the formant frequencies could continue to be written as F1, …, Fm" Ingo, et al. (2015). Toward a consensus on symbolic notation of harmonics, resonances, and formants in vocalization.
  3. ^ 第一、第二といった数字の当て方は研究者や時代によって異なる
  4. ^ PLG100-SG取扱説明書 YAMAHA

関連項目