syghの新フラグメント置き場

プログラミングTipsやコード断片の保管場所です。お絵描きもときどき載せます。

マイクロソフトの機械翻訳は害悪でしかない最低最悪の品質です

DeepLは比較的精度の高い機械翻訳で、pixivでもときどきお世話になっています。Google翻訳はそれより一段劣りますが、長文の意味をザックリ理解したいときに使うことがあります。
一方、マイクロソフト機械翻訳は比較にならないくらいお粗末で、最低最悪レベルです。エンドユーザー向けのドキュメントの翻訳もクソなんですが、開発者向けのドキュメントの翻訳はそれ以上にクソofクソです。不正確で役に立たないどころか、逆に害悪すらもたらすレベルで、むしろ英語原文を直接読んだほうが手っ取り早い。コイツが垂れ流し続ける邪悪な機械翻訳による検索汚染にはそれこそ毎日のように悩まされ続けています。無能とかいうレベルを遥かに超越している。仕事の邪魔でしかない。激しい頭痛と吐き気がして、PCをズタズタに破壊してレンジでチンしたくなる衝動に駆られます。

現行の英語⇔日本語の機械翻訳における致命的な欠点は、肯定と否定をまるで反対に訳すことがあるという、中学生どころか小学生ですら明らかに間違っていることが分かるようなポカミスを堂々とやらかすことです。マイクロソフトの場合はそういうところが他の機械翻訳サービスと比べて顕著で、極端に低品質です。こんなクソ翻訳をありがたがって使う日本人は情弱以外の何者でもない。

Windowsを休止状態から復帰させると、タスクトレイの通知領域に赤いエクスクラメーションマーク(!)のアイコンが表示されていることがあります。このアイコンにマウスオーバーすると、以下のようなツールヒントメッセージが表示されます。

お使いのデバイスには、重要な更新プログラムがありません

はあ。そうですか。じゃあWindows Updateの必要はないんですね。

「重要な更新プログラムがありません」といったな。あれは嘘だ。

実はこの通知が来たとき、重要な更新プログラムの配信がWindows Updateのバックグラウンドサービスによって検出されています。
なので、本来の意味は「重要な更新プログラムがあるので、早めにWindows Updateを実行してください」ということなんです。

このメッセージ、英語版の原文ではどうなっているかというと、

Your device is missing important updates.

だそうです。
この「miss」という動詞は、「見落とす」「見逃す」「恋しく思う」といった意味を持ちます。要するに、上記メッセージは「見逃している重要な更新がありますよ」ということを意味しています。

しかしながら、あろうことかマイクロソフトは日本語版において「ありません」というヘタクソな表現に翻訳してしまったようです。
日本語を母語とする普通の日本人であれば、「更新プログラムがありません」と言われれば、「更新プログラムがインストールされていません」という意味にはとらえず、「更新プログラムが配信されていません」という意味にとらえるのではないかと思います。
バカな人間が深く考えずに翻訳したのか、それともバカな機械翻訳にかけたのかは知りませんが、こういうアホな翻訳・直訳は昔から日本語版Windowsのあちこちにあります。Microsoft 365(旧Office Online)もグダグダです。特にOneDriveの翻訳がお粗末すぎる。機械翻訳が丸わかり。

情報技術の世界では、日本語は情弱が使うマイナー言語のひとつに過ぎないので、OSのUI言語はいっそ日本語ではなく英語にしたほうがよいかもしれないですね。英語の勉強にもなります。自分は普段使っているモバイルOSの言語を英語にしています。

ちなみにWindowsでは、UI言語とは別にシステムロケールを設定できるようになっており、マルチバイト文字のデフォルトエンコーディングはこのシステムロケールに従います。
Unix系OSでは現在UTF-8が一般的ですが、Windowsではいまだに言語固有のANSIコードページがデフォルトとなっています。Windows 10(バージョン1803以降)ではシステムロケールUTF-8に設定することもできるようになっていますが、いまだベータ版です。
古いWindowsアプリやゲームの中には、システムロケールが日本語(CP932)であることが前提になっているものもあるので、システムロケールは変えないほうがよいと思います。

中国語の漢字と日本語の漢字

ネットが使える人口の比率は不明ですが、日本の総人口は1億ちょい、中国の総人口は14億です。両国とも現在人口が減少しつつあるものの、言語の絶対的なユーザー数は日本語よりも中国語(簡体字)のほうが圧倒的に多いです。しかも日常的に日本語を使っているのはほぼ日本人だけです。Web上における日本語の存在感や重要度は極めて低い。そのためか、Web上のサービスは、記事のタイトル文字列をもとにASCII英数字のURLを生成する際、日本語の記事内容であるにもかかわらず、日本語の読み(kanji)ではなく中国語の漢字(hànzì)すなわちピンイン読みとして機械的に処理してしまう間抜けな実装になっているものがあります。

だからー、URLをローカライズすんなよな。バカなんですか? 死ぬんですか?
Unicodeが普及してからは、URLにマルチバイト文字を含める邪悪なWebサイトが蔓延するようになりましたが、それと大差ないです。URL自体は英語オンリーまたはUUIDにして、en-usやja-jpのような言語IDをURLの一部やパラメータに指定することで変えられるようにすればいいだけなのに。

ちなみにMicrosoftサポートの言語別ページのURLには、タイトルに相当するマルチバイト文字が含まれますが、タイトル部分を引っこ抜いてページUUIDだけにしたURLを使えばリダイレクトされるようになっています。ただしこのサポートページは機械翻訳だらけで、タイトル文字列も誤訳のオンパレードです。英語版は役に立ちますが日本語版は嘘八百だらけでほとんど役に立ちません。
support.microsoft.com