「プロジェクト‐ノート:翻訳検証」の版間の差分
Tze Chiang Hao (会話 | 投稿記録) |
|||
276行目: | 276行目: | ||
::::そう考えた場合、「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳というのは往々として生じるわけで、むしろ「日本語としては辿々しい」が「専門的な知見に関しては正しく理解されている」翻訳も考えられると思います。その際、前者と後者を比較して、どちらがWikipediaの記事として「品質として優れている」かを考えると、必ずしも前者の方が優れているとは言い難いと考えます。 |
::::そう考えた場合、「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳というのは往々として生じるわけで、むしろ「日本語としては辿々しい」が「専門的な知見に関しては正しく理解されている」翻訳も考えられると思います。その際、前者と後者を比較して、どちらがWikipediaの記事として「品質として優れている」かを考えると、必ずしも前者の方が優れているとは言い難いと考えます。 |
||
::::今回の措置で、後者の(日本語としての品質に劣る)翻訳は悉く排除されることになるだろうと思いますが、そのことを持って悪い品質の記事が減ると言えるのかどうか、むしろ「日本語としては美しいが内容に事実誤認の多い」翻訳ばかりにならないか(そもそも翻訳記事の絶対数自体が激減するだろうと考えているのは先に述べたとおりですが)との懸念があることを皆様にお伝えしておきたいと思います。失礼いたしました。--[[利用者:Bsx|Bsx]]([[利用者‐会話:Bsx|会話]]) 2022年12月8日 (木) 04:08 (UTC) |
::::今回の措置で、後者の(日本語としての品質に劣る)翻訳は悉く排除されることになるだろうと思いますが、そのことを持って悪い品質の記事が減ると言えるのかどうか、むしろ「日本語としては美しいが内容に事実誤認の多い」翻訳ばかりにならないか(そもそも翻訳記事の絶対数自体が激減するだろうと考えているのは先に述べたとおりですが)との懸念があることを皆様にお伝えしておきたいと思います。失礼いたしました。--[[利用者:Bsx|Bsx]]([[利用者‐会話:Bsx|会話]]) 2022年12月8日 (木) 04:08 (UTC) |
||
:::::{{At|Bsx}} お久しぶりです。最近はほとんど顔を出せていないながらコメントさせていただくことご容赦ください。Bsxさんのコメントのうち、「「日本語文法的に」悪い品質の記事を減らすことに注力されておられる」という部分には誤解がありそうだということを指摘させていただければと思います。 |
|||
:::::確かに一昔前までの機械翻訳ツールは、日本語への翻訳は特に文法レベルでの致命的な誤訳や文章の崩れが見られるものでした。一方で近年は技術の進展により状況が変わってきており、そういった文法的な部分についてはかなりの改善が見られてきています。また、最近主流になっている言語モデルの構造的な特徴故に、全体的な文脈としては自然な文章になるような出力をするものが増えています。しかしその結果として、原文のうち1文を丸ごと無視するような「訳抜け」といった現象が発生したり、自然さをとるあまり原文と文意が変わってしまうような出力がなされることもあります。すなわち、最近の翻訳ツールは、Bsxさんの表現をお借りするならば「「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳」を生成することが多いのです。このあたりのことは、削除の方針のG-3を導入する議論の際にも、[[特別:差分/88314901|述べたことがあり]]ます。 |
|||
:::::当然、悪い品質の記事には日本語としての品質が低いものも含まれますが、コンテンツ翻訳の機械翻訳機能廃止に向けた一連の動きは、どちらかというとBsxさんも懸念されている内容そのものに誤りが多い翻訳記事を減らすことを目的とした手段として検討されてきたものだという認識は、共有させていただければと思います。(むろん、その目的を実現するための手段が「コンテンツ翻訳からの機械翻訳の排除」で果たしてよいのか、という主張があることは、当然だと思います) --[[利用者:紅い目の女の子|紅い目の女の子]]([[利用者‐会話:紅い目の女の子|会話]]/[[特別:投稿記録/紅い目の女の子|履歴]]) 2022年12月14日 (水) 03:24 (UTC) |
|||
*{{コメント}} 正直、このページでの議論についてはリンク元のページで説明しているので、「[[プロジェクト:翻訳検証]]で行われた[[プロジェクト‐ノート:翻訳検証#コンテンツ翻訳の機械翻訳機能廃止に向けて―議論提起と今後の構想のお知らせ|議論]]により、」の部分はいらない気がします。--[[利用者:YellowSmileyFace|YellowSmileyFace]]([[利用者‐会話:YellowSmileyFace|会話]]) 2022年12月4日 (日) 13:17 (UTC) |
*{{コメント}} 正直、このページでの議論についてはリンク元のページで説明しているので、「[[プロジェクト:翻訳検証]]で行われた[[プロジェクト‐ノート:翻訳検証#コンテンツ翻訳の機械翻訳機能廃止に向けて―議論提起と今後の構想のお知らせ|議論]]により、」の部分はいらない気がします。--[[利用者:YellowSmileyFace|YellowSmileyFace]]([[利用者‐会話:YellowSmileyFace|会話]]) 2022年12月4日 (日) 13:17 (UTC) |
||
*{{報告}} 早急な告知が求められていることを鑑み、[[Wikipedia:管理者伝言板/保護ページ編集]]にてSitenoticeでの告知を{{oldid|92725989|依頼|92753849}}しました。--[[利用者:YellowSmileyFace|YellowSmileyFace]]([[利用者‐会話:YellowSmileyFace|会話]]) 2022年12月4日 (日) 21:51 (UTC) |
*{{報告}} 早急な告知が求められていることを鑑み、[[Wikipedia:管理者伝言板/保護ページ編集]]にてSitenoticeでの告知を{{oldid|92725989|依頼|92753849}}しました。--[[利用者:YellowSmileyFace|YellowSmileyFace]]([[利用者‐会話:YellowSmileyFace|会話]]) 2022年12月4日 (日) 21:51 (UTC) |
2022年12月14日 (水) 03:24時点における版
過去ログ一覧 |
---|
コンテンツ翻訳の機械翻訳機能廃止に向けて―議論提起と今後の構想のお知らせ
いつもお世話になっております。McYataです。事後報告となり申し訳ないのですが、「コンテンツ翻訳内の機械翻訳機能廃止」へ具体的に動き出すために、財団側の方とクローズドな情報共有ミーティングを行いました。まずはWikipedia:井戸端#財団の方とミーティングを行いました&機械翻訳機能廃止を要請するための日本語版合意形成提案(過去ログ)をご覧いただき、皆さまのご意見をいただきたいです。
次の段階に向けて動き始めようと考えた背景には、皆さまのご協力によりコンテンツ翻訳レビューが進展して「機械翻訳機能が深刻な問題を引き起こしている」といえるだけの十分なデータがそろい、またG-3削除方針が成立したことで「機械翻訳依存を排除する」という広いコンセンサスがとれたことがあります。これらから、2019年から長きにわたって議論されてきた「財団との交渉材料は出そろった」と考えました。ここまで至ったからには、井戸端でAppleRingo777さんが言及している通り、時間をかけすぎても目標を達成するのが難しくなってしまうでしょう。今ここで踏ん切りをつけ、コミュニティ内で状況を共有して、機械翻訳機能廃止のコンセンサスをとるための投票実施まで一気に持っていく時ではないでしょうか。
なおミーティングにはコンテンツ翻訳開発チームの方も参加していたのですが、その方から以下のような指摘(反論)をいただきました。正直、これまでの議論にかかわってきた方々ならうんざりするほど見てきているような「言い訳」の類で、私もこれらを想定してプレゼンしたつもりなのですが、力不足で説得まで至ることは出来ませんでした(ただ参加された方は機械翻訳機能の担当ではなく、「疑義が上がっている状況はよく分かったので担当にも伝えよう」と仰っていました)。
- 機械翻訳が誤訳をするのはどの言語版でも同じ
- 機械翻訳を使いこなせず粗悪な記事を公開してしまうのは、その利用者の責任である。コンテンツ翻訳の責任ではない。
- インドネシア語版は「機械翻訳率の閾値を設ける」という開発チーム側の提案を受け入れて「ハッピー」だと言っていた
- コンテンツ翻訳記事の削除率の推移は開発チームも言語版ごとに監視している。削除率が極端に上がれば、我々も「何か問題があるのか?」と聞きに行くだろう。
- 英語版では「機械翻訳機能を復活させてくれ」という声も上がっている。日本語版にも「機械翻訳は良い記事を作るために便利なツール」だと考えている利用者がいるはずだ。
すべてについて十分な反論が出来るだけの情報は持ち合わせているつもりです(後程、日本語版コミュニティ向けの説明もかねて、私論か何かで詳しく書こうかと思っています)。これらの論点についても、これまで機械翻訳とかかわってきた皆様のご意見をいただきたいです。--McYata(会話) 2022年6月25日 (土) 15:57 (UTC)
- 一般的な西洋言語からの翻訳以上に中日の場合はコンテンツ翻訳が吐き出す機械翻訳は、はっきり言って垃圾(rubbish)とだけ申しておきます。←この部分は原文ママでお伝えくださって結構です。
- 特に長文を翻訳する場合、機械翻訳の後始末をしなくていい分、自力翻訳のほうが効率的に作業できます。
- そして、そのような欠陥がありながらも、それをゴリ推ししている財団の姿勢も容認できませんし、ツールを使いこなしているつもりで結果的に使われてるだけの問題利用者側にも不信感があります。
- 機能廃止が1日でも早く訪れることを願っています。廃止できないのであれば、拡張承認された利用者以外は利用者名前空間にしか出せなくするというのも一つの手かと思います(英語版や中国語版で実施されているドラフト制度)。--Tze Chiang Hao(会話) 2022年6月26日 (日) 00:20 (UTC)
- 開発チームの方からの指摘は、McYataさんがすでに反論材料を揃えているわけで、私からこれ以上何か述べる必要はなさそうです。「拡張承認された利用者以外がコンテンツ翻訳を利用して、標準名前空間に投稿することを(機械翻訳の有無にかかわらず)禁じる」、もしくは「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」ならば、編集フィルターでできることを申し上げておきます。すなわち、日本語版で合意できれば財団/開発チームが対応を拒否した場合もローカルでの対処手段はあります。--ネイ(会話) 2022年6月26日 (日) 07:16 (UTC)
- コメント ネイ氏の提案は非常に興味深いものがあります。財団との交渉が決裂したとしも実装できるのであれば賛成です。「拡張承認」というのは日本語版のことでしょうか?例えば外国語版で拡張承認されているが日本語版ではされていない利用者の扱いについてはどういったケースを想定されていますか?外国語版で拡張承認され、かつ無期限ブロックされているが、グローバルブロックには至っていないという(日本語話者ではない)利用者に対してもフィルターが有効であればなあ、と個人的に思うところです。--Tze Chiang Hao(会話) 2022年6月26日 (日) 07:59 (UTC)
- 日本語版です。ローカルの編集フィルターなので、他言語版の拡張承認を参照することはできません。--ネイ(会話) 2022年7月2日 (土) 13:09 (UTC)
- この編集フィルターブロック全般について、財団に理解頂けなかった場合の対処手段をこちらが有していることは、強力な交渉材料になりえると私は考えています。別に編集フィルターでできるのであれば、わざわざ財団と話しあう意味がないのですからね。まあ、私は穏便に行きたいと考えていますが。
- 同様に考えれば、翻訳する際の履歴継承に用いる言語間リンクを検出することにより、Draft名前空間以外に公開することを禁止したり、極論(コンテンツ翻訳を禁止した結果として、コピペ翻訳が増えた場合)記事の翻訳を新利用者グループの「翻訳者(一例)」に限ることも可能なのですね。このような考え方は、そもそも翻訳という作業が非常に難解なものであるということを再確認したからです。ともかく、とても有用な情報提供に感謝いたします。--Sethemhat(会話) 2022年7月2日 (土) 13:45 (UTC)
- 日本語版です。ローカルの編集フィルターなので、他言語版の拡張承認を参照することはできません。--ネイ(会話) 2022年7月2日 (土) 13:09 (UTC)
- コメント ネイ氏の提案は非常に興味深いものがあります。財団との交渉が決裂したとしも実装できるのであれば賛成です。「拡張承認」というのは日本語版のことでしょうか?例えば外国語版で拡張承認されているが日本語版ではされていない利用者の扱いについてはどういったケースを想定されていますか?外国語版で拡張承認され、かつ無期限ブロックされているが、グローバルブロックには至っていないという(日本語話者ではない)利用者に対してもフィルターが有効であればなあ、と個人的に思うところです。--Tze Chiang Hao(会話) 2022年6月26日 (日) 07:59 (UTC)
- 開発チームの方からの指摘は、McYataさんがすでに反論材料を揃えているわけで、私からこれ以上何か述べる必要はなさそうです。「拡張承認された利用者以外がコンテンツ翻訳を利用して、標準名前空間に投稿することを(機械翻訳の有無にかかわらず)禁じる」、もしくは「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」ならば、編集フィルターでできることを申し上げておきます。すなわち、日本語版で合意できれば財団/開発チームが対応を拒否した場合もローカルでの対処手段はあります。--ネイ(会話) 2022年6月26日 (日) 07:16 (UTC)
- コメント まずは財団側の皆さんとの交渉などに動いていただき、ありがとうございます。これまで日本語版で議論してきたことを、どう実装に持っていくのか、というところは不明瞭な部分もありましたし、今回のミーティングのおかげで財団側の姿勢であったり、次のアクションが分かり易くなったと思います。
- さて、コンテンツ翻訳の機械翻訳機能を廃止するための合意形成に進むことには賛成です。McYataさんも指摘されている通り、現状財団側から上がっている反論は、日本語版の問題点が無視されている、もしくは日本語特有の事情が加味されていない、といったものに過ぎません。プロジェクト:翻訳検証でも現状明らかなように、リソースが不足しているわけで、根本的に流入側を締める対策を取る必要があります。一つだけ注意したいのは、「機械翻訳をコンテンツ翻訳で使えないようにする」ことと「拡張承認された利用者だけがコンテンツ翻訳を遣えるようにする」ことは、イコールではない点かと思います。前者には賛成だが後者には反対、といった方が一律に反対もしくは賛成とならないよう、切り分けて議論を進めていくべきかと存じます。 --紅い目の女の子(会話/履歴) 2022年6月27日 (月) 02:52 (UTC)
- コメント McYataさん、情報提供ありがとうございます。インドネシア語版の事例につきましては、ベトナム語版からのコンテンツ翻訳の拡張承認未満の利用制限の要望(phab:T299636)において、財団側からの閾値での提案が受け入れられずにベトナム語版の要望が通った反例があります。この事例は、viwikiがコンテンツ翻訳の削除率の高い言語として挙げられていないことも含めて、今後の交渉の参考になるのではないかと思います。ただ、この事例は機械翻訳を制限する要望ではないので、そこが気がかりではあります(機械翻訳に対する要望を挙げたアラビア語版があの状態なので)。--Junknote(会話) 2022年6月28日 (火) 08:31 (UTC)
- コメント 2か月がたちましたが、この問題について進展がありません。どうすればよいのでしょうか。--Sethemhat(会話) 2022年8月25日 (木) 12:17 (UTC)
- すでにUser:OmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、もやはこの問題に進展が見えない以上、前述のメタのページに「自動翻訳機能をオフにしなければ、jawpではコンテンツ翻訳を全面禁止するぞ」と脅しをかける段階に入っていると考えます。これを実行してもよいでしょうか。皆様の意見をお待ちしております。--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- しばらくご無沙汰でした。メタでいろいろなドアを叩いてきましたが、開かない扉だらけだと解りました。メディアウィキのCX2専用トークページに「これは使いにくい」という声が上がるのですが、3年前よりも四倍に増えた印象です(この件、後述)。
- そこで、実利を先行させませんか。CX2が公認の拡張機能でもポンコツなら、ローカルで対処をとる。日本語版で合意を築き、CX2から記事名前空間への出稿を処理すれば、それで十分では? ただし、管理者の皆さんに負担が増えるのでは、大元のメディアウィキに挑むほかないかもしれないです。これは別件、私論でも書きます。
- 皆さんが出してくださった案を一覧にします。それぞれ特徴があるのですが、費用対効果と、実現可能性を可視化しましょう。もちろん、両論賛成はしたくない方もおられると思いますから、多数決にするためではありません。
- 「機械翻訳をコンテンツ翻訳で使えないようにする」ことと「拡張承認された利用者だけがコンテンツ翻訳を遣えるようにする」ことは、イコールではない(@紅い目の女の子さん 2022年6月27日 (月) 02:52 (UTC)時点)
- どのあたりに落とし所を求めるのか、見てみたいです。Sethemhatさんが焦れておられるのも、そこでは? 管理者に頼むなら頼むで、道筋が決まっています。そこに載せるかどうかで止まっているだけでは?
- 不明点
- 費用対効果。ローカル(日本語版ウィキペディア)単体で実現でき、管理者がしんどくない案の順位。(翻訳新記事の見回りは楽になるが誰かにツケが回らないか)
- 1を考えずに、優先順位を与えるなら、どうなる?
- 作業の流れ図。
- 合意形成とは。このスレッドで合意すれば必要十分か? それともアンケート調査など、分母の大きな合意形成が必要ですか?
- 管理者伝言板へ依頼を書くだけで良いのか?
- 工程表。
- 見直しもしくは再度、話し合う。
- 仮番
- どうするか、[改行] *提案者・備考
- 01
- 02
- 「コンテンツ翻訳ツールを利用して日本語版に投稿することを禁じる」
- 編集フィルターで対処[※ 1]。
- 03
- Draft名前空間(利用者/sandboxのこと?)以外に公開することを禁止。条件は、利用者の履歴継承にフィルタをかける。履歴 > 翻訳記事 > 言語間リンク?
- そもそも翻訳という作業が非常に難解なものである[※ 2]。
- ところでSethemhatさんに一言。
- (前略)すでにOmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、(後略)--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- 【ここから加除修正、下線部を補足】「Omotechoさんは」と書いてリンクで呼び出されたので上記をまとめました。接頭辞「mw」はメタではないのでご注意いただきたいのと、メタは恐ろしいところと考える人は少なくないと見ており、「中途半端な言及は迷惑です」と申しあげるほかありません。Omotechoの当該の投稿は、CX2ご意見ご感想ノートページに寄せた物です(サイトはメディアウィキ)。「CX2から出稿した翻訳記事を峻別する手段は{{tl:翻訳告知}}の活用」と他の人が発言したので、コメントとして「CX2出稿の記事は、自動的に『翻訳告知』テンプレートをその記事のノートページに付与してほしい」と提案しました[※ 3]。
- 注
-
- すでにUser:OmotechoさんがMetaにてコンテンツ翻訳の製作者とすこし対話をされておられるようですが、もやはこの問題に進展が見えない以上、前述のメタのページに「自動翻訳機能をオフにしなければ、jawpではコンテンツ翻訳を全面禁止するぞ」と脅しをかける段階に入っていると考えます。これを実行してもよいでしょうか。皆様の意見をお待ちしております。--Sethemhat(会話) 2022年9月3日 (土) 08:20 (UTC)
- 一部発言を編集、不穏当であり反省します。--Omotecho(会話) 2022年9月10日 (土) 14:25 (UTC) / --Omotecho(会話) 2022年9月3日 (土) 14:24 (UTC)
- ここでOmotechoさんも仰るように日本語版だけで完結することを、あえて私がMediawikiと交渉のすべを残そうとしているのか述べたいと思います。皆さんと円滑に思考の共有をするためです。
- コンテンツ翻訳=悪ではないこと。レビュースペースの1月のところを見て頂けるとお分かりの通り、50%の記事はOKなものです。この半分の方が普通の翻訳手段を用いて翻訳いただければよいのですが、コンテンツ翻訳が廃止されれば止めてしまわれるかもしれません。なので、出来るだけ無関係の善意の方を巻き込まないためにコンテンツ翻訳は存続が最善と考えています。
- 財団との関係。下のMcYataさんのコメントでかなり不穏な雰囲気が漂っておりますが、出来るだけ悪化させたくはありません。こちらはコンテンツ翻訳を禁止するまでは言っていないと先方に言い、武器をちらつかせながらですが理解を求めるのがウィキペディア的合意形成かと考えています。
- 他言語版での実施可能性。この問題により太古の昔にアラビア語版、最近でもベトナム語版でも悲鳴が上がっています。ここでJawikiが先陣を切り機械翻訳を停止させれば、他の言語版でもこの操作を実行しやすくなるかもしれません。
- 以上により、私が先にコンテンツ翻訳製作チームと交渉すべきと考えています。しかし、もしJawikiで先にコンテンツ翻訳からの記事を閉めるべきという意見が多数を占めた場合はこの限りではありません。
- 議論の本筋に戻ります。「管理者に負担がかからない」という観点では、直接交渉が管理者とは無関係ですが、編集フィルターでの処理は一回コードを書いていただくだけで済みますので、手動で何かをしなければならないというものが発生しない以上、あまり負担が大きいとは思いません。合意形成は、ここにいるメンバーで交渉かどうかを決め、もしコンテンツ翻訳一括禁止となれば利用者すべてか、拡張承認に絞るかどうかをここで議論した後、コメント依頼に出すのがよいと考えます。
- ともかく、直接交渉をすべきかどうか(または、しても問題ないか)というのが議論の中心だと思います。言い忘れておりましたが、直接交渉というのは私がやりますので議論参加者の皆様のご負担になるようなことはありません。--Sethemhat(会話) 2022年9月4日 (日) 13:20 (UTC)
- ご説明がとてもよくわかりました。ご指定の2022年1月度統計、記事として水準を満たすものは5割ですか。多いような少ないような。
- >ここでOmotechoさんも仰るように日本語版だけで完結することを、あえて私がMediawikiと交渉のすべを残そうとしているのか述べたいと思います。
- では、複合的に進めそうですね。
- CX2の改善が必要だとメディアウィキに提言する。
- 実利先行のローカルでCX2から日本語版ウィキペディアの標準空間(記事名前空間)へ、出稿制限をかける。
- 出稿制限の試行
- データの見える化のためにも暫定期間を設けて、出稿制限をかけてはどうでしょうか? 対処すべき記事件数を、少しでも低減できたらという苦肉の策です。
- たとえば3か月でも試験的に出稿の制限を行い、統計をとり品質が劣る「事故率」を見える化する案です。すると比較データはすでに積み上げておられますので、後追いでもメディアウィキでの交渉に添付し、お役に立たないでしょうか?
- 小出しに変化を持ち込み、場合によっては戻すリスク。
- コミュニティが混乱する
- 管理者の手間。
- 判断材料として、CX2を使った出稿をする人は、常駐編集者三千五百人(援用:投票の有権者数)に対して、どれくらいの率でしょう? お分かりでしたら教えてくださいませんか?--Omotecho(会話) 2022年9月6日 (火) 03:52 (UTC)
- 情報 @user:Omotechoさん、取り急ぎコンテンツ翻訳がどれくらい使用されているかを過去20か月分で調査しました。利用者:Junknote/CX2日本語版統計をご参照ください。--Junknote(会話) 2022年9月6日 (火) 06:48 (UTC)
- ありがとうございます @Junknoteさん拝見しました。あっという間にこの表ができるとは思えず、お手数をおかけしました、ありがとうございます。いやぁ。数値にすると、グッと苦味が減ったような(~.~;) 分母は1万の桁が良いですかね、それとも常駐人口値を少し絞って、直近の連続の編集回数などで足切りをすると3500人(投票の有権者の条件並みにする)、ただ対策に当たっている編集者は、実はもっと情熱を傾けたい主題をお持ちのはず。それを諦めて奉仕をする人たちだとするなら、それを数値に現せないか。1万人が80数名の対策に当たっているのではないし、「1万人のうちの八十人じゃあ、想定内だ、我慢しなさいよ」と言われないために数字を操作したくないですし。
- 嫌な方もあるかと思うのですが、携わっておられる編集者の数を、仮定で良いので掴めないか。もう少し目に見えると説得力が増します。次の3番以下は、CX2を使わずとも、また翻訳記事に限らない作業ですから、どのように対照できるでしょうか。
- CX2出稿の落第記事(事故)を削除する作業時間、作業量
- ぎりぎり及第点に達するよう、書き換える作業時間、作業量
- 翻訳原文が検証可能性を満たしていないため、資料をたくさん当たったり。
- 場合によっては「●●語版に偏重」した内容を、グローバルまたは日本語話者の社会に近づけたり。
- 何かお知恵はありませんか。数字データで押すなら、これまで希望が通らなかった言語版と同じ末路を避けられそうな予感がします。ただし日本語版ウィキペディアはパイが大きい(参加者数が多い)ため、条件で絞り込むまで、データが見た目、小さいです。
一点、表のクラスを並べ替え可能にしてくださるとありがたいのですが、動かしたくない列・行の指定を失念してしまいました。- {| class="wikitable sortable"(以下同文)
- {| class="wikitable sortable"(以下同文)
- --Omotecho(会話) 2022年9月10日 (土) 15:14 (UTC)
- コメント かなり事後になりましたが、ソート可能なウィキテーブルへ対応致しました。挙げていただいたOmotechoさんの懸念は理解できるところです。母数に統計ページの活動中利用者数や、理事会選挙の有権者数といった利用者数を持ってきてしまうと、その割合の見た目の小ささから問題が矮小化されかねないと感じます。そうしますと、数字として表すのであれば、やはり対応にかかる手間(工数)部分を見える化して比較するという作業になってくるのではないかと思います。私の考えるところでは、例えばレビュースペースの結果が出ている部分をさらに精査する、問題のある記事数と対応された記事数、また、対応の内訳として改訳・改稿をした利用者数、削除を依頼した利用者数など、対応が行なわれた部分の数値化でしょうか。対応する利用者に対して、事案発生数が多すぎるという論点の補助にはなりそうには思えます。--Junknote(会話) 2022年9月11日 (日) 23:13 (UTC)
- @Junknoteさん、なるほど分母よりも実態を立体的に述べるデータですね。簡単に抽出できそうと思って分母を示して早計でした。
- @Sethemhatさんのお申し出はとても貴重です。このスレッドの共通の認識を振り返ってみたのですが、メタウィキのあちこちを覗いたせいか、機械翻訳擁護派に日本の事情は見えていないと気になります。いかにも外野ぶって書いたとも読めるため、寝かせておこうかと考えましたが、熱が冷める前にお目にかけます。小見出しにします。--Omotecho(会話) 2022年9月12日 (月) 01:45 (UTC)
- 自己レスです。メタウィキなりメディアウィキで交渉するとしたら、他言語版のCX2対策はどうなっているのか事例集があるといかがでしょうか。あるいは、すでにどなたか調べておられるよというお知恵がありましたら、教えてください。
- 英語版の事例研究のため試訳。下位ページに、en:Wikipedia:Content_translation_tool を試訳します。ほんの少し読んだところで「拡張承認を受けた利用者のみ使えるように制限する」と述べてあり、このスレッドで検討している手順は整合性があると感じます。
- 以下の手順で版を継承。Copied to translate from enwp: 翻訳のため転記、テンプレート無効化、内部リンクに「:en:」を付与して赤リンクを回避、カテゴリnowkiで無効化。原文の特定版は、&oldid=1104658120 2022年8月16日05:35 (UTC) 時点における Czar による版 (IP利用者 による版を Jackfork による版に差し戻し)。
- --Omotecho(会話) 2022年9月14日 (水) 11:35 (UTC)
- Omotechoさん、en:WP:Content translation toolの翻訳ありがとうございます。改めて英語版で制限されている現状や経緯が把握しやすくなったと思います。他言語版のCX2対策ということでは、コンテンツ翻訳のphpのパラメータを眺めていて気になったのですが、ドイツ語版も機械翻訳無効にされているように見えます。具体的には、wgContentTranslationEnableMT(コンテンツ翻訳の機械翻訳の利用可否パラメータ)の英語版(enwiki)は勿論falseになっているのですが、ドイツ語版(dewiki)もfalseに設定されており、変更履歴は見つけたものの、ドイツ語版での機械翻訳の無効化の合意形成や議論が見当たりませんでした。この点、何かご存じの方いらっしゃれば、ご教示いただければ幸いです。--Junknote(会話) 2022年9月14日 (水) 23:54 (UTC)
- すみません、少しこの議論を放置してしまっていました。
- @Omotechoさんが仰ります議論の傾向として、Mediawikiでjawikiの機械翻訳をオフにするように申し入れるのと同時に、コンテンツ翻訳からの記事をすべてストップさせることも実行するということでしょうか。「実利先行」とありますが、正直に言えば私はこれは微妙かなと思っています。善意の方を巻き込みたくはないと考えています。ただし、直近ではこんな例(1、2)がありますし、拡張承認未満の利用者の利用を制限するならば賛成します。
- 私今忙しいため、Mediawikiに申し入れるのは10月中旬ごろになりそうです。ただし、Jawp内での議論にはできる限り対応するようにします。
- Junknoteさんのドイツ語版のも議論材料になりそうです。--Sethemhat(会話) 2022年10月2日 (日) 12:49 (UTC)
- インデントを戻したほうがよければ、よろしくお願いします。
- Sethemhat さんの2022年9月4日 (日) 13:20 (UTC) 時点のご発言に戻っても良いでしょうか。グローバルな視点で以下にまとめておられます。
- >1. コンテンツ翻訳=悪ではないこと。
- >2. 財団との関係。
- >3. 他言語版での実施可能性。
- -----
- 私Omomtechoが日本語版ウィキペディアでローカルに、実利的に考える対策は、以下の1点からご相談したいです。
- CX2の作業結果の出力先
- 記事名前空間(標準名前空間)へ直接、出力させるかさせないかが一つの課題と思います。サンドボックスに置くなら、見回りの労力は減るでしょうか? でも、サンドボックスで改稿を手伝ってほしいと依頼を出したい場合、どうフォローしますか?
- -o 原則、CX2から記事名前空間へ出力させないとする場合。閾値を設けるか。編集回数や、ブロック有無などを基準に、直接、記事名前空間に出力できるようにする。編集初学者はこれで、サンドボックスにのみ出力することになります。
- -o 「1」を認めない場合に、CX2の出力先を個人のサンドボックスに限定するかどうか。
- -o 誰でもCX2から現状どおり、いきなり記事を立項して何の問題もない。
- 「2-o」の弱点。既存の善意の寄稿者を峻別する必要があるのかどうか。寄稿者は全員、改名の手続をしないとCX2翻訳機能による立項ができなくなります。善意の、寄稿歴が長い人は割を食います。
- 編集回数500回でアカウント登録後の日数制限を設けるなどか?
- この条件は、検討から外せば公平だと思います。CX2上で推敲を重ねずに出稿する「失敗事例」と編集歴の統計がわからないため。
- 上記に整理した私の現状認識です。対比が英語版に偏っているのは、ドイツ語が読めないためです。どなたかフランス語版、ドイツ語版の例をご存知でしたら、教えてください。
- o 日本語版にはサンドボックスで下書きをさせ、それを記事名前空間へ移動(改名)する措置に強制的な査読制度はありません。
- o 英語版では巡回者が記事として寝れていないものをサンドボックスすなわち下書き空間へ移動する権限があるようです。(実際に経験したので、おそらく間違いではない)
- o 英語版にもどのくらい記事が成熟したら下書きから記事に昇格させるか、合理的な基準がないようです。
- o 失敗事例の救済というか、「ダッシュボード」という自習の研修過程があります。そこに編集のイロハも翻訳記事の心得も載っているので、翻訳しているところです。
- フェアでないなと感じるところは、私自身の反省点でもあります。ろくにやり方を教えず、あそこを読め、ここに書いてあると説諭する私たちのやり方です。教材がないから他に方法がないと言えば、それも事実だったのですが、そこも変えたい。
- 幸い、ダッシュボードという機能があります。ウィキペディアではない空間にあるため、「{{tl:welcome}}」にリンクを追加する前に整理すると、どうやってそれを紹介するのか。あるいはダッシュボードで質問したい場合に、どうやってやる気のある寄稿者に応えていけるのか。(この辺りの基本は私のサンドボックスに私論を書きました。)
- 翻訳の基本を読もうにも、初学者が慣れない用語や不文律まで目を配れと強制するようなものではありませんか? それを生存するのがウィキペディア参加の条件とするような姿勢は、変な言い方ですが昭和すぎる。20年くらい時代に遅れているようにも思います。--Omotecho(会話) 2022年10月2日 (日) 14:29 (UTC)
- Omotechoさん、en:WP:Content translation toolの翻訳ありがとうございます。改めて英語版で制限されている現状や経緯が把握しやすくなったと思います。他言語版のCX2対策ということでは、コンテンツ翻訳のphpのパラメータを眺めていて気になったのですが、ドイツ語版も機械翻訳無効にされているように見えます。具体的には、wgContentTranslationEnableMT(コンテンツ翻訳の機械翻訳の利用可否パラメータ)の英語版(enwiki)は勿論falseになっているのですが、ドイツ語版(dewiki)もfalseに設定されており、変更履歴は見つけたものの、ドイツ語版での機械翻訳の無効化の合意形成や議論が見当たりませんでした。この点、何かご存じの方いらっしゃれば、ご教示いただければ幸いです。--Junknote(会話) 2022年9月14日 (水) 23:54 (UTC)
- 自己レスです。メタウィキなりメディアウィキで交渉するとしたら、他言語版のCX2対策はどうなっているのか事例集があるといかがでしょうか。あるいは、すでにどなたか調べておられるよというお知恵がありましたら、教えてください。
- コメント かなり事後になりましたが、ソート可能なウィキテーブルへ対応致しました。挙げていただいたOmotechoさんの懸念は理解できるところです。母数に統計ページの活動中利用者数や、理事会選挙の有権者数といった利用者数を持ってきてしまうと、その割合の見た目の小ささから問題が矮小化されかねないと感じます。そうしますと、数字として表すのであれば、やはり対応にかかる手間(工数)部分を見える化して比較するという作業になってくるのではないかと思います。私の考えるところでは、例えばレビュースペースの結果が出ている部分をさらに精査する、問題のある記事数と対応された記事数、また、対応の内訳として改訳・改稿をした利用者数、削除を依頼した利用者数など、対応が行なわれた部分の数値化でしょうか。対応する利用者に対して、事案発生数が多すぎるという論点の補助にはなりそうには思えます。--Junknote(会話) 2022年9月11日 (日) 23:13 (UTC)
- 情報 @user:Omotechoさん、取り急ぎコンテンツ翻訳がどれくらい使用されているかを過去20か月分で調査しました。利用者:Junknote/CX2日本語版統計をご参照ください。--Junknote(会話) 2022年9月6日 (火) 06:48 (UTC)
- ご説明がとてもよくわかりました。ご指定の2022年1月度統計、記事として水準を満たすものは5割ですか。多いような少ないような。
* コメント やはり、編集回数でのリミットは不適切かもしれませんね。例として 挙げて恐縮ですが、YellowSmileyFaceさんの編集回数は780回です。しかし、この方は500回未満の時にも問題のない翻訳(機械翻訳そのままの「翻訳」が多いのでこのような言い方をしています)をされておられており、これを制限するのは道理が通りません。しかし、代案はすべての利用者に対して利用者名前空間への出稿のみに制限するか、全制限か、あるいは特定の利用者のみ解禁、その他はダメという方法もあります。ただし、これはJunknoteさんの統計によると80人居り、その半分の40に許可をするとしても、かなり手間がかかります。ただし、もし制限をかけるとしても、日本語版で機械翻訳がオフになれば、止める理由はありませんのでただちに解消されます。あくまでも、財団が動くまでの措置です。
やはり、財団対処まで我慢してもらうという方法はまずいので、一回財団に話を通しませんか。もし財団が渋るようであれば(McYataさんのコメントを見る限りその可能性が高そうですが)その時考えるということにしませんか。財団がすんなり受け入れた場合、この議論は時間の無駄になってしまう可能性があります。
「翻訳の基本を読もうにも、」以降の文章も大いに共感するところで、翻訳のガイドラインも時代に合わせてそろそろ改訂の必要があるなとか考えています。多忙のため今は不可能なのですが。--Sethemhat(会話) 2022年10月5日 (水) 14:13 (UTC)
- コメント この説のコメントすべてを読む気はないので冒頭の方だけ読ませていただきました。個人的な意見としては、コンテンツ翻訳自体の廃止には反対だが、コンテンツ翻訳内での機械翻訳機能の廃止には賛成というようになると思います。当方はウィキペディアでの活動を始めた初期からコンテンツ翻訳を使わせていただいておりますが、コンテンツ翻訳を使うと他言語版でのウィキリンクが日本語版でのウィキリンクに自動的に変わるなど、翻訳者にとって使いやすい機能が多く備わってると考えています。しかし、当然ながら機械翻訳の品質は非常に低く問題なので、上記の通り、「コンテンツ翻訳自体の廃止には反対・機械翻訳機能の廃止には賛成」という立場を取らせていただきます。--YellowSmileyFace(会話) 2022年10月2日 (日) 17:22 (UTC) 署名位置を修正--YellowSmileyFace(会話) 2022年10月2日 (日) 17:51 (UTC)
- ご意見ありがとうございます。翻訳依頼でのYellowSmileyFaceさんのご活躍を拝見しております。
- もちろん、ここの議論参加者の共通認識はコンテンツ翻訳についている機械翻訳が悪というものですので、翻訳ツールとしてのコンテンツ翻訳へ制限をかける理由は全くございません。ただし、財団がコンテンツ翻訳内機械翻訳の廃止を渋った場合が面倒なことになります。全投稿者のコンテンツ翻訳記事を制限しなければならない事態になるかもしれません。--Sethemhat(会話) 2022年10月5日 (水) 14:13 (UTC)
- 返信 (Sethemhatさん宛) 認識は共通との事、安心しました。出来の悪い翻訳記事の立項に貢献する機械翻訳機能の廃止になぜ財団が渋るのかはわかりませんが、もしそのような場合にはコンテンツ翻訳の全般廃止となってしまうのかもしれないですね。その影響で善意の翻訳者がウィキペディアを立ち去ってしまうかもしれないので、そうならないよう願っております。もし財団との交渉の間で何か必要になられましたら、できるだけお力になりたいと思います。--YellowSmileyFace(会話) 2022年10月5日 (水) 23:53 (UTC)
- 報告 冒頭の井戸端リンク(下線部)を、過去ログに置き換えました。--Omotecho(会話) 2022年11月10日 (木) 10:32 (UTC)
編集フィルターでの制限
- コメント 一点気になったので情報共有のため、ご報告です。交渉の武器の一つとして考えられている「コンテンツ翻訳を日本語版ローカルで編集フィルター対処」ですが、今年phabricatorに要望のあった、ベトナム語版の「拡張承認ユーザ以外へのコンテンツ翻訳の投稿制限」の件(phab:T299636)の冒頭で「JSと不正利用フィルターを設定していたが、新Vector導入後には時代遅れとなった」と述べられており、対処内容としてwmf-config/InitialiseSettings.phpの修正が入っています。MediaWikiや編集フィルタ―に詳しくはないので、個人の感想レベルで恐縮なのですが、この修正を入れなければ、ローカル側の設定だけではフィルターが作動しない可能性があるように思えるのですが、いかがでしょうか。--Junknote(会話) 2022年9月5日 (月) 06:21 (UTC)
- 私にはJunknoteさん以上にその問題について不明ですので、編集フィルター編集者の方にお伺いしようと思ったのですが、何分知識が浅くJunknoteさんの意図の通りに説明できないと思います。そのため、@Junknoteさんご自身でWikipedia‐ノート:編集フィルターにて質問頂けないでしょうか。お手数おかけします。--Sethemhat(会話) 2022年9月13日 (火) 12:21 (UTC)
- Sethemhatさん、ご返答ありがとうございます。Wikipedia‐ノート:編集フィルター#コンテンツ翻訳に対する編集フィルタについてで本件について質問致しました。--Junknote(会話) 2022年9月14日 (水) 00:00 (UTC)
- 報告 編集フィルタ―のノートで質問していた件ですが、コンテンツ翻訳投稿時に生成される要約欄の内容をトリガーにして、投稿を制限することが可能と教えていただきました。ローカル側だけでの対処も可能なようです。--Junknote(会話) 2022年9月19日 (月) 23:01 (UTC)
- ありがとうございます
- @Junknoteさん、せっかく調べて動いてくださったのに今頃のコメントですみません。技術的にこのような対処の可能性があるのですね。ウィキペディアはつくづく深いです。 --Omotecho(会話) 2022年10月2日 (日) 14:37 (UTC)
- 報告 編集フィルタ―のノートで質問していた件ですが、コンテンツ翻訳投稿時に生成される要約欄の内容をトリガーにして、投稿を制限することが可能と教えていただきました。ローカル側だけでの対処も可能なようです。--Junknote(会話) 2022年9月19日 (月) 23:01 (UTC)
- Sethemhatさん、ご返答ありがとうございます。Wikipedia‐ノート:編集フィルター#コンテンツ翻訳に対する編集フィルタについてで本件について質問致しました。--Junknote(会話) 2022年9月14日 (水) 00:00 (UTC)
- 私にはJunknoteさん以上にその問題について不明ですので、編集フィルター編集者の方にお伺いしようと思ったのですが、何分知識が浅くJunknoteさんの意図の通りに説明できないと思います。そのため、@Junknoteさんご自身でWikipedia‐ノート:編集フィルターにて質問頂けないでしょうか。お手数おかけします。--Sethemhat(会話) 2022年9月13日 (火) 12:21 (UTC)
お詫び
McYataです。中途半端なところで失踪して1か月以上経ってからのご連絡になりすみません。もう一つお詫びしなければならないのですが、諸事情により、McYataはこのコンテンツ翻訳内の機械翻訳機能の件から降ります。翻訳率以外の方策が必要だと私が説明した相手から「日本語用に翻訳率閾値を設定するための調査に協力してくれ」と言われたあたりから何かおかしいとは思っていたのですが、その後でまさかアレがこんな「些細な」ことのために一個人にああいうことをするとまでは覚悟していませんでした。今後のMcYataは約1年前の状態、つまり単なる記事翻訳・執筆者に戻ります。どなたかが引き続き建設的な方向へ本プロジェクトをまとめ、財団と共に何らかの解決策を見出していってくださるか、Gから始まる奴が変な所にリソース割かずにさっさと機械翻訳をまともなレベルに完成させてくれるのを祈るばかりです。今の私の口からはこの程度のことしか言えないのですが、年明け以来、私が色々やってきた無茶にご協力・ご指導いただいた皆様に心から感謝すると共に、改めてお詫び申し上げます。誠に申し訳ありません。--McYata(会話) 2022年9月4日 (日) 09:36 (UTC)
技術班へ申し入れ以降 (2022-10-25)
- 報告 意見が出尽くしたと思いますので、mw:Topic:X5np6qyldklnm166にて申し入れを実行してみました。反対されて進む見込みがない時は以前から言っていた制限を課すことを検討しましょう。しかし、そうならないことを切に願っています。--Sethemhat(会話) 2022年10月25日 (火) 11:12 (UTC)
- 報告 (phab:T321819)で「しきい値 75」に変更が完了し「解決済み」とされたようです。短い記事で実際に試して見たところ、Google翻訳にあまり手を加えていない翻訳「78%」は新規ページとして「公開」するのも、個人ページに公開するのも不可能でした。--eWikiLearner(会話) 2022年11月8日 (火) 15:53 (UTC)
- 補足説明をします。@Sethemhatさんからメディアウィキでコンテンツ翻訳拡張機能に関する申し入れをされたところ、UOzurumba (WMF)(言語チーム)という職員の方から機械翻訳との一致度のしきい値75%に調整中であるとの話が出ました。先方からは日本語コミュニティが拡張機能に手を焼いているのは申し訳ないという前置きがあります。
- さて、@EWikiLearnerさんが見つけてくださったファブリケーターという技術作業の連絡板(phab:T321819)の件。10月27日3:37 PM (utc) 時点で前出の言語チーム職員から技術系ボランティアに作業を発注の由。タグから、Language-Team (Language-2022-October-December) (Done)〈言語チームの10-12月期の作業項目であったが完了〉、CX-analytics (Backlog)〈翻訳拡張ツールの分析で遅滞ありだった〉。Referenced Files→None〈経過の添付文書なし〉と読み取れます。
- 以下、わざわざ転記するまでもないかと迷いましたが、事態が一つ前進したのか見切るために、皆さんにご一読を願えないでしょうか。特に★印以下文末まで、「しきい値変更後は日本語版コミュニティが拡張機能を利用した立項を査読評価し件数をチェック」するという段取りだと述べてありますが、これまで協議いただいたことから、外れていないかどうかご確認ください。
- なお転記したものは、いわゆる〈発注内容〉つまり技術的な作業を申し入れる時に、状況説明と何をしてほしいか述べるものです。以下、三角カッコは転記したOmotechoの加筆です。
- 《ここから転記》Content translation applies different limits to control how much machine translation is modified, preventing the publishing of unreviewed initial machine translation.
- This ticket proposes to increase the modification of Machine translation to ensure that translators modify the initial machine translation by 75% in Japanese Wikipedia before publishing the translation.
- The above decision is based on complaint from the Japanese community.
- 《★》Once the above change is made, the community will monitor content published using the Content translation tool to evaluate the quality and number of translations.
- Project〈プロジェクト名〉operations/mediawiki-config
- Subject〈主題〉Set ContentTranslation MT threshold to 75 in Japanese WP〈日本語版ウィキペディア向けには機械翻訳のしきい値は75とする〉
- Customize query in gerrit〈統計のクエリを書き換える〉
- UOzurumba created this task.Thu, Oct 27, 3:37 PM《転記ここまで》
ここからは別件ですので、機会を改めて話題を立てるかもしれません。拡張機能経由で翻訳すると、非常に高率で無出典もしくは出典の少ない記事が立ちます。その点を問題視され、再三、拡張機能利用者に指摘なさる方が対話拒否に遭う事態もたまにいるのですが、もしかして「メタでお勧めしている編集初学者向けの公認の拡張機能」に、こういう恐ろしい落とし穴があるとはどちらも知らされていないのではないか。- 原因はシステムにあり、言語間でテンプレートの引数や構文が非対称な時は、機械的に原文にある出典を削除して訳文に渡さない点は、マシンとしては優秀でも、翻訳の補佐機能としては欠陥です。私Omotechoとしては、閾値よりも原文にある出典テンプレートを拡張機能が剥がして訳文に渡さない点に大きな不満があります。上記の職員に申し述べたのですが、別次元の問題なのか、うまく答えてもらえませんでした。
うまい対策は思い付かないのですが、私の泥縄は「脚注を原文から持ち込まない」とシステムが告げる箇所では、むりやり左窓の原文から脚注を転記します(原文を読みに行くこともある)。
せめてシステムがそのような出典を<nowiki>で包んで訳文に出力するなら、もし翻訳作業者の手に負えなくてそのまま記事名前空間に保存したとしても、少なくとも手がかりが残って日本語版ウィキペディアに立項後に後処理ができるかもしれません。立項の時点では、その部分は出典としては機能しませんが。--Omotecho(会話) 2022年11月9日 (水) 16:38 (UTC)
-
- コンテンツ翻訳機能のトークページにコメントしました。手翻訳の結果さえも一律に機械翻訳の結果と照合して、出力を阻害するのはいかがなものか。
- メディアウィキにて解説文書に該当するヘルプ:コンテンツ翻訳/..../翻訳の品質は英語版原文にローカル版の対応は加筆されないと見込みます。同トークページに「現状を投稿しました。--Omotecho(会話) 2022年11月10日 (木) 09:17 (UTC)
- 結果としてしきい値を75%に引き上げることによってこの件の対処を試みたことは、私の怒りにさらに油を注いだだけに他なりません。理由は以下です。
- Omotechoさんが質問されたように"75%"という値の根拠が不明であり、そもそもen-jaの翻訳に関して知識がない者が適切なしきい値を設定できるとは思えません。日本人が見てOKな文章が75%以上と判断される可能性もあるのです。この判断をしているのは機械ですよね。それは機械翻訳に頼っていることと原理的になにも異なりません。
- 私は「しきい値を設定するのは日本語に関しては無意味」と言ったにも拘わらず"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."のような頓珍漢なことを仰る。しきい値がどうかを考えるのではなくそもそも諦めろと私は言っています。ローカルウィキの実際に対処している人間よりも自分たちの判断が勝っていると考えておられるのでしょうか?
- そもそも私は機械翻訳を合意に基づき廃止するように申し入れを行いました。それに対してCX2チームはしきい値を設定することで難を逃れようとしました。クライアントからの要求を恣意的に解釈して対処することを実際の会社で行ったら叱責ものだろうと思います。
- 以上のような内容を向こうにも、後ほどもう少しきつめの言葉で投稿します。これで分かってもらえなければ残念至極ですが、最終手段行使に踏み切る必要があるでしょう。--Sethemhat(会話) 2022年11月11日 (金) 07:09 (UTC)
- コメント 少なくとも箸にも棒にもかからない、トコロテン式の転訳は撲滅され、皆さんの手間がなくなるでしょうか? 技術班が機械翻訳をどうしても使わせたい理由は、システムとしてどこに齟齬があるか理解していないかどうかではない。大口スポンサーつまり私たちが依存する財団のサーバと技術力を支える経済基盤への政治的な配慮?
- 「あなた方技術者が大口スポンサーのAPIのせいで、身内であるはずのコミュニティに責められる苦労もわかる」「機械翻訳を使わないという手段で円満解決だ」とすっとぼけてみたいです。
- 技術者として同情すべき点があるなら、〈他人のフンドシ〉(改変が許されない)から小手先で実績を築き、たなざらし案件が消化できて万々歳ではないかと想像するに至りました。ボランティアで記事を書くのも、コードを整理するのも、どちらも個人のやる気に依存していますから。
- となると、作戦は次元が変わってしまう。相手も言語班あるいは技術班という政治的決定権のない相手は飛び越え、コミュニティ関与部門など、文化格差と包括性へ持ち込むのか。話がまったく通じないので、もう投了で良いと諦めます。12月まで気持ちの整理にあて、ウルトラシーの明暗が降ってくれば幸いだと考えます。--Omotecho(会話) 2022年11月11日 (金) 09:44 (UTC)
- コメント メディアウィキの窓口の方とのコミュニケーションがうまく行っていないように見受けられます。「"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."」は、「なぜしきい値の設定ではだめなのか、もっと詳しく知りたい」という意味です。窓口の方自身が、日本語は「字数」の変更でしか「しきい値」を計算していないことをご存じないのではないかという気もします。なかなか、メッセージのやり取りでは難しそうです。チャットでもできれば、もう少し言いたいことを伝えられるかもしれません。--eWikiLearner(会話) 2022年11月11日 (金) 12:48 (UTC)
- @EWikiLearnerさん: 上にあるMcYataさんの投稿にあるように、McYataさんはチャット等ではなく実際に会話をされたようです。それでもなお理解は得られなかったのです。しかも彼は意味深な発言を残して退かれました。私の申し出を勝手にしきい値の話にすり替える時点で怪しさが...でしたので、これ以上善意に取ることは難しかったと思います。今回の私のポストの言葉は強かったかわかりませんが、後は相手次第だと思っています。コンテンツ翻訳自体の禁止など、どのユーザー層まで許容するかなど調整が恐ろしく面倒なことが予想されるため、機械翻訳を禁止することで妥協してほしいと思っています。--Sethemhat(会話) 2022年11月11日 (金) 14:22 (UTC)
- なぜメディアウィキチームがコンテンツ翻訳に固執するのか。これは私の想像でしかありませんが、彼らは技術を生かしてウィキメディア財団全体の理想に貢献することが使命のはずでしょうから、彼らの取り組みを、たとえその一部分であっても否定することは、彼らのウィキメディアグループ内での仕事ぶり、ひいては存在意義を否定することになるからでしょう。私はこのプロジェクトに出入りさせてもらうようになったのがつい最近のことなので、皆様が苦労なさって作って来られた進め方の路線について、色々と言える立場にありません。その上でひとつ心配なのは、Google翻訳の自動取り込みだけを禁止したコンテンツ翻訳は、結局外部のウェブブラウザなりでGoogle翻訳やDeepL翻訳を行って、コピー&ペーストする手法を使う人が出てくるような気がします。少し面倒になる分、機械翻訳のほぼコピーが減るといいのですが。ところで、最近のCX2利用者の上位利用者に関する推移を調べるとこんなことになっていました。--eWikiLearner(会話) 2022年11月11日 (金) 14:59 (UTC)
- @EWikiLearnerさん: 上にあるMcYataさんの投稿にあるように、McYataさんはチャット等ではなく実際に会話をされたようです。それでもなお理解は得られなかったのです。しかも彼は意味深な発言を残して退かれました。私の申し出を勝手にしきい値の話にすり替える時点で怪しさが...でしたので、これ以上善意に取ることは難しかったと思います。今回の私のポストの言葉は強かったかわかりませんが、後は相手次第だと思っています。コンテンツ翻訳自体の禁止など、どのユーザー層まで許容するかなど調整が恐ろしく面倒なことが予想されるため、機械翻訳を禁止することで妥協してほしいと思っています。--Sethemhat(会話) 2022年11月11日 (金) 14:22 (UTC)
- コメント メディアウィキの窓口の方とのコミュニケーションがうまく行っていないように見受けられます。「"If the above is what you mean, I would like to understand this more because this might be an issue that would need fixing."」は、「なぜしきい値の設定ではだめなのか、もっと詳しく知りたい」という意味です。窓口の方自身が、日本語は「字数」の変更でしか「しきい値」を計算していないことをご存じないのではないかという気もします。なかなか、メッセージのやり取りでは難しそうです。チャットでもできれば、もう少し言いたいことを伝えられるかもしれません。--eWikiLearner(会話) 2022年11月11日 (金) 12:48 (UTC)
- 結果としてしきい値を75%に引き上げることによってこの件の対処を試みたことは、私の怒りにさらに油を注いだだけに他なりません。理由は以下です。
- 報告 (phab:T321819)で「しきい値 75」に変更が完了し「解決済み」とされたようです。短い記事で実際に試して見たところ、Google翻訳にあまり手を加えていない翻訳「78%」は新規ページとして「公開」するのも、個人ページに公開するのも不可能でした。--eWikiLearner(会話) 2022年11月8日 (火) 15:53 (UTC)
- 報告 重要な事実に思われますので、すでにご存じの方もいらっしゃると思いますが、このプロジェクトに参加されておられる方(@McYataさん、@Tze Chiang Haoさん、@Open-boxさん、@紅い目の女の子さん、@Junknoteさん、@YellowSmileyFaceさん) +この件に意見をくださった方(@Omotechoさん、@EWikiLearnerさん)すべてに通知申し上げます。
- 上記の話にもありました通り、McYataさん主導による5月ごろからのコンテンツ翻訳 (CX2)チームとの折衝の結果として、10月25日よりメディアウィキの方へコンテンツ翻訳 (CX2)チームへ機械翻訳の廃止の申し入れに踏み切っていました。交渉は非常に、非常に難儀しましたが、およそ一か月たった11月29日、廃止を行うPhabricatorのタスクがチームの方により作成されました。この機械翻訳に制限をかけることは機械翻訳の質が今よりもずっと悪かった2016年ごろから井戸端で議論されていたり、例えば削除の方針の改定が試みられたこともありましたが、機械翻訳自体は2022年新設の削除方針G-3により対処が容易になったものの大本を閉めることはできずにいたと思います。そんな状況の中、皆様にご尽力頂いた結果として機械翻訳の廃止を開発者側に認めさせることができたということは、日本語版の翻訳問題において非常に大きな意義を持つのではないかと考えております(ただし、実際に規制が行われるまでには2週間ほどかかるとのことです)。
- しかしながら、ここでコンテンツ翻訳からの機械翻訳はあらかた規制できるようになりましたが、手動で切り貼りすることは今でも容易な状態です。これを防ぐために翻訳のガイドラインの改定を含むさらなる策を考えていかなければならないと思い策も練っていましたが、一身上の都合(多忙)により私はこれ以上のWikipediaへの参加が難しくなってしまいました。それでも、ファーストステップ(翻訳が行われたことを検知して編集フィルターを作動させ、画面にWP:翻訳のガイドラインを含む各種翻訳関係リンクを表示し、読み込みを促す)の策定は行いたいと思っております。この提案を実行すべきかということも含め、皆様のさらなるお力添えを賜りたいと存じます。これはもう少し練った上で再度提案したいと思います。改めまして皆様お疲れ様でした。--Sethemhat(会話) 2022年11月29日 (火) 11:52 (UTC)
- 補足 今回、廃止するという言質を引き出すことには成功しましたが、開発者たちが機械翻訳の問題点を今だに理解できていないということは問題として残っています。しかし、これからはローカルの話になりますので、高次的なところとはもう話をする必要は発生しないのではないかと思っています。
- ともあれ、どのユーザーに許可するのかなどの複雑な議論手順を踏まなければならないコンテンツ翻訳自体の(一部)禁止を、実行しなくてよくなったことに対して非常にほっとしています。--Sethemhat(会話) 2022年11月29日 (火) 12:01 (UTC)
- @Sethemhatさん、そして関係者皆さん、ありがとうございました。そして、お疲れさまでした。これで機械翻訳を濫用した翻訳記事は減ると思います。
- ただ、機械翻訳を参考程度(単語の意味などの小さなこと)に使用するのは許可すべきだと思っています。この考えにみなさんが賛同されるかは分かりませんが、賛同された場合はWP:MACHINEに「コンテンツ翻訳での機械翻訳機能は、コンテンツ翻訳を使用した低品質な翻訳記事が数多く投稿されたため停止されました。しかし、主に翻訳を自分で行っており、外部サイトの機械翻訳(Google翻訳など)を参考程度(ある単語の意味など)に使う限りは問題ありません。ただ、外部サイトの機械翻訳をコピペしてそのまま投稿するのは絶対におやめください。」などの記述を追加するのが必要かもしれません。--YellowSmileyFace(会話) 2022年11月29日 (火) 13:40 (UTC)
- 追記 以上の考えを共有したのは、MediaWikiの方々も仰られていた通り、機械翻訳機能が廃止されることによって日本語へ記事を翻訳する方の数が減ってしまう、という懸念からです。これを防ぐためにも、参考程度での外部の機械翻訳を使うことを許容することで翻訳者の方々の助けになるのでは、と考えました。--YellowSmileyFace(会話) 2022年11月29日 (火) 13:48 (UTC)
- コメント Sethemhatさん、Omotechoさん、YellowSmileyFaceさん、EWikiLearnerさん、メディアウィキでの交渉ありがとうございました。他言語版の廃止要望で閾値の調整を主導されていた Pau Giner(Pginer-WMF)さんが、機械翻訳廃止のチケットを作成したことには驚き、大きな前進であると感じております。来るべき機械翻訳廃止に向けて、YellowSmileyFaceさんの仰る翻訳者の減少への対策など、色々と準備を進める必要がありそうです。(むしろ本当に2週間で廃止が実施されるのであれば、時間がほとんどありませんね…)--Junknote(会話) 2022年11月29日 (火) 23:24 (UTC)
- コメント しばらくログインしておりませんでした。年始にレビュープロジェクトが始動してから機能廃止が年内決着となったことは驚いていますし、このような結果となったことには素直に喜びたいと思います。これまで交渉にあたってこられたSethemhatさん他の本プロジェクト参加者には頭が下がる思いです。事後追認という形となりますが、改めて御礼申し上げます。--Tze Chiang Hao(会話) 2022年12月11日 (日) 09:25 (UTC)
- 報告 phabのチケットの進捗を確認しておりましたが、機械翻訳機能を無効にするパッチセットが適用されました。私も今CXを試してみましたが、原文転写しかできなくなっているようです。取り急ぎご報告まで。--Junknote(会話) 2022年11月30日 (水) 08:49 (UTC)
- 報告 Wikipedia‐ノート:翻訳のガイドライン#コンテンツ翻訳の機械翻訳廃止に伴う改訂についてにてWP:MACHINEの改訂を提案しました。皆様のご意見をいただければ幸いです。--YellowSmileyFace(会話) 2022年11月30日 (水) 13:14 (UTC)
機械翻訳廃止を周知して頂けませんか
プロジェクト外から失礼します。今朝(12月1日朝)コンテンツ翻訳を使おうとしたらGoogle翻訳が出来なくなっており、その原因をいろいろ探した挙げ句、最終的にこちらの議論にたどり着きました。メタウィキでの技術チームとのやりとりも拝見した上で、jawikiの「総意」のような形で機械翻訳廃止について強い申し入れが行われて廃止に至ったものと理解しています。ただ、実際に機械翻訳を補助的に活用していた利用者は少なくなく(私もその一人です)、このように影響の大きい仕様変更が行われたのであれば、然るべき内容についてもっと広く周知して頂きたいというお願いに至った次第です。よろしくお願いします。--Bsx(会話) 2022年12月1日 (木) 09:46 (UTC)
- @Bsxさん: 機械翻訳廃止の提案をしました、Sethemhatと申します。機械翻訳機能がいきなり使えなくなっていれば困惑するのは当然と思います。機能無効化の原因を探させてしまったこと、お詫び申し上げます。
- 「然るべき内容」について詳しくお聞かせ願えませんでしょうか。本廃止案件に関しましてはすでにWP:お知らせには記載されていますが、もしさらなる周知が必要だとお考えならば、Sitenoticeで全閲覧者に告知を行うことが可能です。その実行を申し入れた方がよいのでしたらその旨お伝えください。
- 「機械翻訳を補助的に活用していた利用者は少なくない」という件に関してですが、Bsxさんのようにきちんと翻訳を改稿できる利用者ばかりではなく、むしろそうではない人の方が多いです。コンテンツ翻訳で可能な、機械翻訳で作成された訳文から翻訳を行う方式は、機械翻訳が行った誤訳を見過ごす可能性が高い点で、翻訳の質が低くなる可能性が指摘されています。具体的にはコンテンツ翻訳からの翻訳の約半数が許容できないレベルの日本語であることが判明しています(参考)。この件ではご迷惑をおかけしておりますが、ご自身で適切な対処頂けませんか。また、機械翻訳は参考程度の使用ならば許容されることを明示する翻訳のガイドラインの改定を現在行っておりますので、今しばらくお待ちください。--Sethemhat(会話) 2022年12月1日 (木) 10:07 (UTC)
- @Sethemhatさん:端的に言えば「Sitenoticeでの周知」を希望するところです。私はWikipediaを使用するにブックマークをメインページ以外の所にしており、WP:お知らせが目につかないというユーザーも少なくないのではないかと推測しています(少数派かも知れませんが)。Sitenoticeでの周知を行えば、そういったユーザーにも目に届くと思われます。ご検討をお願いします。--Bsx(会話) 2022年12月1日 (木) 11:08 (UTC)
- 返信 お知らせで告知されたことはほとんどのユーザーは確かに知らないと思いますので、Sitenoticeでの告知に私は賛成します。Sitenoticeを使用する可能性があるとのことで、MediaWiki‐ノート:Sitenotice#コンテンツ翻訳内の機械翻訳機能廃止に関する告知 にて議論が行われていることを告知しました。以下に文案を作成しましたが、文案の改善やSitenotice以外の告知方法がよい、またはその他の意見あれば皆様より頂きたく存じます。
--Sethemhat(会話) 2022年12月1日 (木) 11:30 (UTC)
- 横から失礼 コンテンツ翻訳の機械翻訳廃止の経緯を解説するページを作成しましたので、「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」のような感じでSitenoticeからリンクしていただければと思います。--YellowSmileyFace(会話) 2022年12月1日 (木) 19:40 (UTC) 例を追加--YellowSmileyFace(会話) 2022年12月2日 (金) 02:05 (UTC)
- 「一斉通知」はこういう使い方が適すると感じます。申請トークページで管理者に依頼する手順でしたね。見てきます。
- @Bsxさんの迅速なお問い合わせ・ご提案と@Sethemhatさんのご確認・進行、@YellowSmileyFaceさんのご対応、誠にありがとうございます。--Omotecho(会話) 2022年12月2日 (金) 04:56 (UTC)
- 横から失礼 コンテンツ翻訳の機械翻訳廃止の経緯を解説するページを作成しましたので、「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」のような感じでSitenoticeからリンクしていただければと思います。--YellowSmileyFace(会話) 2022年12月1日 (木) 19:40 (UTC) 例を追加--YellowSmileyFace(会話) 2022年12月2日 (金) 02:05 (UTC)
- @Sethemhatさん:端的に言えば「Sitenoticeでの周知」を希望するところです。私はWikipediaを使用するにブックマークをメインページ以外の所にしており、WP:お知らせが目につかないというユーザーも少なくないのではないかと推測しています(少数派かも知れませんが)。Sitenoticeでの周知を行えば、そういったユーザーにも目に届くと思われます。ご検討をお願いします。--Bsx(会話) 2022年12月1日 (木) 11:08 (UTC)
- 提案 異論が無いようなので明日か明後日にも「【お知らせ】プロジェクト:翻訳検証で行われた議論により、「コンテンツ翻訳ツール」内の機械翻訳機能は廃止されました。詳細はプロジェクト:翻訳検証/コンテンツ翻訳の機械翻訳廃止についてを御覧ください」の文面でSitenoticeの依頼をしようと思います。一応異論がないか確認するため、議論に関わられた@Bsxさん、@Sethemhatさん及び@Omotechoさんに通知を入れさせていただきます。--YellowSmileyFace(会話) 2022年12月3日 (土) 17:11 (UTC)
- YellowSmileyFaceさんの最終文面で異論ありません。ただ、リンク先の解説文書は直す余地があるのではないかと思います。--Sethemhat(会話) 2022年12月3日 (土) 22:57 (UTC)
- 解説文書について、同意です。この件に後の方から参加した自分が土台として作った程度なので。経緯を説明しようとしたらあんな文章になってしまいました。やはり長い文章が苦手な自分には無理ですね...どなたかが直してくださることを期待します。--YellowSmileyFace(会話) 2022年12月4日 (日) 00:06 (UTC)
- YellowSmileyFaceさんの最終文面で異論ありません。ただ、リンク先の解説文書は直す余地があるのではないかと思います。--Sethemhat(会話) 2022年12月3日 (土) 22:57 (UTC)
- なお参照先ページが最終稿・決定稿ではないとテンプレートで(メディアウィキのコンテンツ翻訳ツール解説ページに)示す方法を探してみます。翻訳ページのため加筆できないので管理者に依頼するか、ノートページへ誘導か。
示してきます(ウィキペディアの「工事中」相当のテンプレートはないのでしょうかね)。
- なお参照先ページが最終稿・決定稿ではないとテンプレートで(メディアウィキのコンテンツ翻訳ツール解説ページに)示す方法を探してみます。翻訳ページのため加筆できないので管理者に依頼するか、ノートページへ誘導か。
- 補足:以下はリンク元に加筆し、いったんコメントアウト。編集が競合した場合は乞ご容赦。
== 外部リンク ==
- コンテンツ翻訳ツール メディアウィキの機能解説ページ
- CX2拡張機能を使った・使わない翻訳記事の件数(折線グラフ) 全言語版対象、期間と属性を指定して比較。たとえば [2022-11-01]〜[2022-12-01] + [機械翻訳エンジン] など。ウィキメディア技術班Dashiki作成(クリエイティブ・コモンズ・ライセンス CC0)
- ウィキメディア財団の見解 公式ブログ→「translate」で絞り込み。(クリエイティブ・コモンズ・ライセンス帰属-同一条件許諾 3.0 Unported license)
- --Omotecho(会話) 2022年12月4日 (日) 05:49 (UTC) 下線部を追加。/ --Omotecho(会話) 2022年12月4日 (日) 04:34 (UTC)
- 文章を改稿してみました。概略の理解に大きな問題はないと思います。さらなる加筆も自由にお願いします。おまけで年表的なものも付けましたが、私は2021年以前の議論はあまり存じませんので不要なものがあったりや逆に必要なものが欠けていたりした場合はこれも適宜編集をお願いします。Omotechoさんが外部リンクを加筆されるならばそれもお願いしたいと思います。
- sitenoticeについては早ければ早いほどよいと思います。掲示期間は2週間ほどでよいでしょうか。--Sethemhat(会話) 2022年12月4日 (日) 07:18 (UTC)
- コメント sitenoticeについては「遅すぎる」と感じているくらいですので、速やかに対応頂ければと思います。
- それと余談ですが、「一件落着ではないのでは? いずれ、拡張機能としての充実・修正に合議が待たれます。しかしタイミングはいつかですよねぇ」とのOmotechoさんのコメントにはちょっとだけ違和感を覚えました。MetaWikiの技術チームとのやりとりを見る限り、先方は自動翻訳機能を活用してコンテンツ翻訳の利用を促したいように見えたのですが、今回の申し出で「jawikiが自動翻訳機能そのものを拒絶している」ように映ったのです。そうなると、拡張機能としての充実・修正はMetaWikiの技術チーム的に「もうありえない(自動翻訳機能を組み込むこと自体がjawikiに受け入れられない)」という風に解釈しているのでは…?と懸念を覚えたところです。--Bsx(会話) 2022年12月4日 (日) 09:39 (UTC)
- @Bsxさん冒頭でご指摘の点、コンテンツ翻訳拡張機能(以下CX2)に機械翻訳を組み込まない不利益があるのですよね(後述)。私の先般の「まだ収束ではない」というコメントは、機械翻訳という蛇口を閉めた後も、百科事典の品質を下げる記事は残り、それにどう対処したら良いのか。機械翻訳の研究が進んだ英日という言語のペアであるからこそ、言語班はその組み込みに関して、おいそれとあきらめまいと考えます。そうなら交渉できる。今回、先方は機械翻訳の出力結果とのマッチング率を発動させた(過年度の未消化案件をクリアしようとした)のを、1回失敗しただけですし。(というような獲らぬ狸の皮算用はSethemhatさんが警戒しておられます。)
- 議題は応用篇になるけれども、それを考えると、ジナーさん(PGiner_(WMF) )の最後の投稿は社交辞令ではなく、前向きな申し出だと解釈します。議論が熱いうちに、後始末に何かツールで協力してもらえないかと話を進める可能性を捨てるかどうか。CX2由来で量産型された低質な記事はまだ大量にあるから校閲を人海戦術であたると消耗するし、この作業は、ある程度は機械化できないものでしょうか?
- 以下はすでに検証を積んできた皆さんの作業を翻案したのみです。もちろんローカルの管理者や技術に詳しい方のご助言を仰ぎたいですし、火元はCX2なので、因果関係としては向こうに負うべきものはある。
- 例:利用者1件が200超の低質な記事を立てた。
- 問題の分析=
- 立項を受け、他の編集者の努力により質があがったもの、
- 出鱈目な自作の文が多く、編集するよりも削除した方が効率が良いもの、
- 機械翻訳のところてん式の出力で、しかも特性が手付かずで残っている。その場合は、
- 修正が必要な箇所を機械的に処理しておき、
- 一群の「翻訳直後」記事として扱えるようにする。
- ただ、機械的に処理できるかどうかの見極め、そのための共通理解を言語をまたいで取り付けたりなど、正直、腰が引けています。
------ 後述の部分です。
- 質問ですが、編集作業中に、段落単位程度の文字量を機械翻訳で確かめ、ご自分の訳文のチェックにたい。そういうCX2の使い方は想定できませんでした。そのニーズに応える、小さなガジェットがあればお役に立ちますか?
- 蛇足。あくまでも後知恵ですが、当初、別案を提案しました。
- コンテンツ翻訳拡張機能の作業結果保存先は、既定で個人のサンドボックス[利用者:username/下書き]限定する。経験値は度外視。
- 同出力を直接、標準名前空間(記事名前空間)に出稿できる利用者層を絞りこむ。目安は生涯投稿回数≒。
- 機械翻訳をどの程度、やっかいな機能と評価するか……。先週末にAAMTの発表会があり、公設の研究機関から中間発表がありました。題材は「みんなの翻訳」でしたが、エンドユーザの使用感を拾ったようです。私感ながら、ごっそりと文の要素をおとすディープルに寄せる懸念も聞かれました。--Omotecho(会話) 2022年12月6日 (火) 00:03 (UTC)
- @Omotechoさんのお考えは判りましたが、残念ながら今回jawikiにおいて「コンテンツ翻訳における自動翻訳の全面拒絶」という最もお手軽かつハードランディングな方向性で決着してしまった以上、その先のステップは「事実上消滅した」と考えています。状況が変わるとしても年単位で先の話になるでしょう(皆さんの「次」に向かうモチベーションがだだ下がりなのも容易に想像がつきます)。他言語版で「自動翻訳機能が使える利用者の条件設定」などのソフトランディングで決着したのを見るにつけ、返す返すも残念に思います。--Bsx(会話) 2022年12月6日 (火) 22:16 (UTC)
- コメント 文面についてだけ。sitenoticeはお知らせであることが自明なので、わざわざ【お知らせ】とつけたことは過去の例にもありませんし、とても違和感を覚えます。個人的感覚ではその「お知らせ」というヘッダーがなければとりあえずは許容できると思いますが、お知らせメッセージが出てからだと「なんだこれ」と言われてしまうので、改めて異質すぎないように変更してもらえませんか。過去にどんな形でお知らせされていたかはページの履歴を見れば分かるはずですし、それらを参考にしてもらえれば良いと思います。--青子守歌(会話/履歴) 2022年12月4日 (日) 10:19 (UTC)
- @青子守歌さん: では、「【お知らせ】」を除去した文面を暫定最終案としましょう。
- @Bsxさん: 我々の認識では、先方が2週間以内に対応されるとのことでしたからほぼ即時の実装は予想外であったということだけ申しておきます。Omotechoさんによるリンク追加が終わればすぐにでもSitenoticeの編集を申し入れる予定です。
- 前から開発元とのやり取りのことで皆様に意見申し上げたかったのですが、失念していました。Bsxさんのお言葉で思い出すことができましたのでこの機会に、ついでに述べます。まず、Bsxさんのご認識は正しく、こちらは再度有効にするという合意が形成されない限り二度とコンテンツ翻訳内の自動翻訳機能を有効にすることはありません。ですから、閾値調整のために開発元が行っている英語・日本語訳文の対照作業を行う必要が消滅しています。そもそもこちらが機能を廃止しろと言っているのにそれに直接返答せず、向こうは論点をそらし閾値の設定を勝手にやったり、私の閾値設定は無意味であるという批判に回答しないようにして、閾値設定につながる自動翻訳と人力翻訳の対照作業を行いたいと言っていたり非常におかしい交渉でした(私は日本語を解しない者が閾値調整を行っていることに対してそもそも強く反対してもいます)。それに協力しても今は無意味ですからしないようにお願いしたいです。--Sethemhat(会話) 2022年12月4日 (日) 10:37 (UTC)
- @Sethemhatさん:もう「今更」感しかないので個人的感想でしかないのですが、そもそも自動翻訳機能の廃止を、いつの間にか「jawikiの総意」という形でMetaWikiに申し入れを行っていること自体に強い違和感を覚えています。Sethemhatさんのお考えは理解できますが、コンテンツ翻訳における重要な機能の一つであり(MetaWikiの技術チームが強く抵抗したのもそれでしょう)、コンテンツ翻訳の機能自体を事実上無効化するに等しい手続きの検討について広く意見を募った形跡もなく(少なくとも、私は自動翻訳機能の廃止が行われるまで今回の議論を全く知りませんでした)、MetaWikiの技術チームとのやりとりにおいてもSethemhatさんの強硬姿勢ばかり目についたというのが正直な印象です。--Bsx(会話) 2022年12月4日 (日) 14:14 (UTC)
- 返信 (Bsxさん宛) : 落ち着きましたので返信致します。以下はOmotechoさんへのBsxさんからの返信に対する、私のコメントも含みます。
- まず、「広く意見を募った形跡」があまり見られないことは私の議論進行の不手際です。関連議論は井戸端にて数回行っており、そこですでに廃止に動いていることは認められるためコメント依頼に掲載したのとほぼ同じ周知度があったかと思いますが、コメント依頼に掲載していなかったことは事実ですからこの点でお詫び申し上げます。
- 次に、機械翻訳機能廃止の妥当性について。機械翻訳は折り曲げナイフのようなものです。普段はその刃は収納されていますが、いざとなると牙をむきます。すなわち、普段使いならば問題ないですが、正確性が求められるウィキペディアにおいては誤訳はよろしくないものです。人力で翻訳していればミスしてしまうこともあるでしょう。しかしそれは原文を確認してもなおミスしてしまうものですから、仕方のないものとして割り切ることができます。しかしながら、機械翻訳の文章をちょっと修正で公開して例えば(機械翻訳がよく間違える)専門用語などでミスをしてしまったならば、それは機械翻訳に責任を擦り付けることはとてもできず利用した者の責任になります。ここで、この責任を放棄する(というか刃物の危なさを知らずに遊ぶ)者が(結構)現れます(例: 1, 2, 3, 4, 5)。要するに刃物の悪用です。そうなると、いくら善良な用途に使っている者がいても仕方なしに禁止しなければならないのは当然のことです。
- それから、なぜ妥協策ではなく廃止を要求したのかについて。
- 「強硬姿勢」に関しては、これ以外に道はありませんでした。もし他にやさしい姿勢でも廃止をもぎ取れる方がおられるのでしたら、それは私の能力不足ということになります。過去に同様に、アラビア語版(門前払い)やベトナム語版(一個緩い条件で妥協)を見ていれば生半可な覚悟では議論に望めないのは分かっていましたし、事前に他のPJ参加者が会話を行ったときも向こうはこちらの主張を理解しようとしないかできないということが判明していました。私が最初に「廃止してくれなければローカルで対処します」と言っていれば正しい対応は、「1、素直に従う」「2、なぜ廃止に踏み切ったのかについて詳しく話を聞く」の二択でしょう。断じて、こちらが頼んでもいないのに勝手に閾値を下げて「してあげたから問題があったら言ってください」のような態度をとることではない筈です。この時点で第一の論点のすり替えが行われ、この態度は次の「翻訳レビュー」の要請においても踏襲されます。最初の態度は決して柔らかいものではありませんでしたが、その後に私の態度をさらに硬化させたのは度重なる論点のすり替えと指摘に全く答えない態度です。
- 「お手軽かつハードランディング」に関しては、上記に申したように最初から柔らかい態度で言ったらずるずる問題が格下げになるので、持てる一番厳しい条件で臨むのは一つの交渉法です。ただし、私が強硬手段を取ったからと言って私がそういう人間であるとは誤解しないで頂きたいです。穏当に行けば目的の条件が引き出せないからやむを得ずこうしているまでです。実際、最高条件で行ったにも拘わらず失敗したかと思いました(その点でもpginerさんの申し出は驚愕に近いものでした)。上に挙げた刃物の例で例えますと、ライセンス発行をすることにより使用を許可することができましょう。しかし、WikipediaにおいてPJ参加者が他利用者を審査することに抵抗を感じますし、手間もかかります。そんなに多くのリソースを割いてはいられません。
- --Sethemhat(会話) 2022年12月7日 (水) 06:34 (UTC)追記--Sethemhat(会話) 2022年12月7日 (水) 06:49 (UTC)
- 返信 (Sethemhatさん宛) コメントありがとうございます。が、残念ながら、コメントを読ませて頂くにつけ、ここでの議論も、MetaWikiの技術チームとのやりとりも含めて、結果的に「機械翻訳機能の廃止」がプロジェクトの目的化してしまっているのがなんだかなぁ、との印象を強くしたというのが正直なところです。いみじくも、Sethemhatさんが刃物を持たない運動の例を挙げていらっしゃいますが、そうした急進的な運動の結末がどういったハレーションをもたらしたのかについては一切無視されるのでしょうね。
- 今般、コンテンツ翻訳における機械翻訳機能の廃止で、他言語版からjawikiへの翻訳を試みようとする人も件数も桁単位で減少することは避けられないでしょうし(このことは恐らくは皆様が最も望んでいたことなのでしょう)、それでもなんとか翻訳を試みる人は「Google 翻訳のコピペ」での記事作成を試みるでしょうから、そもそもこのプロジェクトの発端となったであろう「日本語版へ質の低い翻訳記事が移入される」という問題の根本的な解決には至らないんじゃないかな、とは思っています。尤も、これ以上私が何を申し上げても、「機械翻訳機能の廃止」という結論が出て実行されてしまっている以上は「感想戦」の域を出ませんし、私個人は機械翻訳機能の復活に向けて無駄なリソースを割くつもりもない(ここにいらっしゃる皆様が全力で反対に回ることは容易に想像できます)ので、私の個人的感想はこのくらいにさせて頂きます。ありがとうございました。--Bsx(会話) 2022年12月7日 (水) 09:34 (UTC)
- 返信 (Bsxさん宛) 真摯な批判は何事にも代えがたいものです。その点で、今回の反対派のBsxさんのご意見は非常に貴重なものと私は考えています。当たり前ですが、私は正常に議論される方に対しては真剣に向き合って返答を返しております。このことを明確にしつつ考えますと、すべての意見の中身が何であれ、そう思っている人が存在することはある程度考慮しなければならない点となりましょう。
- ただし、私たちPJ:翻訳検証の目的は根本的に、悪い品質の記事を減らすことにあります。私の勝手な意見ですが、機械翻訳が使えないことで翻訳をあきらめるということは編集が機械翻訳に依存して(しまって)いるということであり、それはWP:DP#G-3で禁止していることそのものです。
- 「日本語版へ質の低い翻訳記事が移入される」問題に関しましては、編集フィルターでの事前お知らせを含め地道に対処方法を考えてまいりたいと考えています。改めて、この度一般利用者の方々へ廃止のお知らせをするべきだと勧告頂いたことを含む、数々の貴重なご意見に対し御礼申し上げます。--Sethemhat(会話) 2022年12月7日 (水) 09:53 (UTC)
- 返信 (Sethemhatさん宛) 先程のコメントで止めにしようと思っていたのですが、先ほどのお返事を含め、当初からの議論をずらっと見るにつけ、一つだけ思い違いをなさっているのでは無いか(そしてそのままの認識のまま今後プロジェクトが進められていくのではないか)との懸念を覚えましたので、蛇足かつ長文になりますが、老婆心ながら申し上げておきます。
- 「翻訳検証の目的は根本的に、悪い品質の記事を減らすことにある」とのことですが、ここまでのみなさまの認識は「日本語文法的に」悪い品質の記事を減らすことに注力されておられるのだろうと思われます。しかし、そもそも他言語版から翻訳を試みようとする方は、翻訳を生業とするような美しい日本語の書けるバイリンガルの方ばかりとは限りませんし、むしろそうでは無い、言い換えれば言語知識はさほどではなくともその記事の分野に関して関心が強い、あるいは専門的な知見がある方のことが多いだろうと考えています(そして、どちらかといえば私もこちらになるだろうと思います)。
- そう考えた場合、「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳というのは往々として生じるわけで、むしろ「日本語としては辿々しい」が「専門的な知見に関しては正しく理解されている」翻訳も考えられると思います。その際、前者と後者を比較して、どちらがWikipediaの記事として「品質として優れている」かを考えると、必ずしも前者の方が優れているとは言い難いと考えます。
- 今回の措置で、後者の(日本語としての品質に劣る)翻訳は悉く排除されることになるだろうと思いますが、そのことを持って悪い品質の記事が減ると言えるのかどうか、むしろ「日本語としては美しいが内容に事実誤認の多い」翻訳ばかりにならないか(そもそも翻訳記事の絶対数自体が激減するだろうと考えているのは先に述べたとおりですが)との懸念があることを皆様にお伝えしておきたいと思います。失礼いたしました。--Bsx(会話) 2022年12月8日 (木) 04:08 (UTC)
- @Bsxさん お久しぶりです。最近はほとんど顔を出せていないながらコメントさせていただくことご容赦ください。Bsxさんのコメントのうち、「「日本語文法的に」悪い品質の記事を減らすことに注力されておられる」という部分には誤解がありそうだということを指摘させていただければと思います。
- 確かに一昔前までの機械翻訳ツールは、日本語への翻訳は特に文法レベルでの致命的な誤訳や文章の崩れが見られるものでした。一方で近年は技術の進展により状況が変わってきており、そういった文法的な部分についてはかなりの改善が見られてきています。また、最近主流になっている言語モデルの構造的な特徴故に、全体的な文脈としては自然な文章になるような出力をするものが増えています。しかしその結果として、原文のうち1文を丸ごと無視するような「訳抜け」といった現象が発生したり、自然さをとるあまり原文と文意が変わってしまうような出力がなされることもあります。すなわち、最近の翻訳ツールは、Bsxさんの表現をお借りするならば「「日本語として美しい」かもしれないが「専門的知見からすれば誤謬がある」翻訳」を生成することが多いのです。このあたりのことは、削除の方針のG-3を導入する議論の際にも、述べたことがあります。
- 当然、悪い品質の記事には日本語としての品質が低いものも含まれますが、コンテンツ翻訳の機械翻訳機能廃止に向けた一連の動きは、どちらかというとBsxさんも懸念されている内容そのものに誤りが多い翻訳記事を減らすことを目的とした手段として検討されてきたものだという認識は、共有させていただければと思います。(むろん、その目的を実現するための手段が「コンテンツ翻訳からの機械翻訳の排除」で果たしてよいのか、という主張があることは、当然だと思います) --紅い目の女の子(会話/履歴) 2022年12月14日 (水) 03:24 (UTC)
- コメント 正直、このページでの議論についてはリンク元のページで説明しているので、「プロジェクト:翻訳検証で行われた議論により、」の部分はいらない気がします。--YellowSmileyFace(会話) 2022年12月4日 (日) 13:17 (UTC)
- 報告 早急な告知が求められていることを鑑み、Wikipedia:管理者伝言板/保護ページ編集にてSitenoticeでの告知を依頼しました。--YellowSmileyFace(会話) 2022年12月4日 (日) 21:51 (UTC)
新規参加者向けのシステム試作 (情報)
新規参加者がごく初期段階の初学者であるときに、やる気の刺激と忠告をバランスさせる対応策が試作中のようです。
- 担当の「Growth」チームとは、経験値に関わらず編集者としてハウツーを深める対策をしてツールを開発、解説文書を書いています。(Growthって成長?深化?)
- 現場はメディアウィキという、ウィキペディアを含むウィキ群に備える機能を扱う空間です。
- いずれ、ウィキメディア財団のウィキに展開する運びと予測します。
なお、翻訳途中のため見通しが悪い状態だとお断りしておきます。--Omotecho(会話) 2022年12月2日 (金) 04:48 (UTC)