2013年3月26日火曜日

SimplyTerms:日英翻訳の場合

「SimplyTermsを使った翻訳(その1~その5)」では英日翻訳を例に取り上げたので、今回は日英翻訳を試してみます。

基本的な操作は同じですので、復習を兼ねて同じようにやってみましょう。

例として下の点線と点線の間の文章をコピー&ペーストして、新たなWordファイルを作ってください。今回の文章はWikipediaの「非鉄金属」http://ja.wikipedia.org/wiki/%E9%9D%9E%E9%89%84%E9%87%91%E5%B1%9E です(一部改変)。

------
非鉄金属
非鉄金属(ひてつきんぞく、non-ferrous metal)とは、鉄および鉄を主成分とした合金、つまり鋼(ferrous metal)以外の金属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非鉄金属)に区分されている。

分類される理由
日本に限らず世界的に見ても鉄以外の金属の生産総量が鉄鋼の生産量に比べ圧倒的に少ないために、便宜的に「非鉄金属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、鉄を主体とした合金の種類よりもそれ以外の金属元素を主体とした合金の種類の方が圧倒的に多い。

主な非鉄金属
産業的によく使用される非鉄金属を以下に示す。
軽金属・・・アルミニウム、マグネシウム、ナトリウム、リチウム、チタン。
ベースメタル・・・銅、スズ、亜鉛、鉛。
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
レアアース・・・セリウム、ネオジム。
貴金属・・・金、銀、プラチナ。
------

ファイル名は「非鉄金属.docx」とし、適当なフォルダ(例えば「ST日英テスト」)に保存してください。

SimplyTerms(ST)を起動し、「ST日英テスト」を開くと、今作った「非鉄金属.docx」があるはずです。

右側のタブで[抽出~書戻]をクリックし、[処理内容]の一番上の[ファイル種類の変更]を選択し、すぐ右の[ファイルの種類]で、今回は[日本語]を選択します。

※英日翻訳(原稿が英語)の場合は[英語]を選択しましたので、日英翻訳、つまり、原稿が日本語の場合は[日本語]を選択します。

左下部分から原文ファイル「非鉄金属.docx」をドラッグし、[実行]ボタンをポチッ。

ファイル名が「非鉄金属.docx」から「非鉄金属_jpn.docx」に変わったはずです(ファイル名の前には日の丸マーク)。


次に、右上の[抽出~書戻]タブの二番目、[Officeテキスト抽出]を選択し、右下には先ほど名前を変更した「非鉄金属_jpn.docx」がある(残っている)のを確認して、[実行]ボタンをポチッ。


「非鉄金属_jpn.txt」ができました。(ST上でそのままダブルクリックしてもファイルが開くので、中身を確認してみましょう。各段落毎に「段落タグ」が挿入されているはずです。確認したら、ファイルは閉じてください。)

では、用語集を適用します。用語集として、前回使った「化学_trm.txt」を使います。

右上の[抽出~書戻]タブの[処理内容]の三番目、[用語集の適用(一括置換)]を選択します。このとき、右下部分の[処理対象テキストファイル(.txt)]に「非鉄金属_jpn.docx」と「非鉄金属_jpn.txt」が残っていたら、必要のない「非鉄金属_jpn.docx」をクリックして反転させた後、すぐ右上の[Clear]ボタンを押し、「非鉄金属_jpn.txt」のみを残します([Clear]を押すと、この[処理対象テキストファイル(.txt)]内から消えるだけで、ファイル自体は削除されないので安心してください)。

 (一度STを終了するなどした場合は、左下から「非鉄金属_jpn.txt」をドラッグしてください。)

右下部分下側の[適用する用語集(上:高優先順位)]には、前回使った「化学_trm.txt」を持ってきたいので、左上部分で前回の「STテスト」フォルダを探して開き、左下に表示された「化学_trm.txt」をドラッグしてきてください。


※用語集と、用語集を適用するファイルは別のフォルダに入っていてもOKです。

[翻訳方向]という部分は、今回も[自動判別]です。原文のサブ拡張子が「_jpn」、つまり日本語ですので、原文の中に用語集の右側の欄の日本語と一致するものがあれば、それに対応する英語で置換してくれます。

さあ、用語集を適用します。[実行]ボタンをポチッ。

「非鉄金属_eng.txt」はできたでしょうか。秀丸やメモ帳で開いてみましょう。

------
[[BD-1]]
非 iron  gold 属
[[BD-2]]
非 iron  gold 属(ひてつきんぞく、non-ferrous metal)とは、 iron および iron を主成分とした合 gold 、つまり鋼(ferrous metal)以外の gold 属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非 iron  gold 属)に区分されている。
[[BD-3]]
分類される理由
[[BD-4]]
日本に限らず世界的に見ても iron 以外の gold 属の生産総量が iron 鋼の生産量に比べ圧倒的に少ないために、便宜的に「非 iron  gold 属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、 iron を主体とした合 gold の種類よりもそれ以外の gold 属元素を主体とした合 gold の種類の方が圧倒的に多い。
[[BD-5]]
主な非 iron  gold 属
[[BD-6]]
産業的によく使用される非 iron  gold 属を以下に示す。
[[BD-7]]
軽 gold 属・・・ aluminium 、マグネシウム、ナトリウム、リチウム、チタン。
[[BD-8]]
ベースメタル・・・ copper 、スズ、 zinc 、鉛。
[[BD-9]]
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
[[BD-10]]
レアアース・・・セリウム、ネオジム。
[[BD-11]]
貴 gold 属・・・ gold 、 silver 、プラチナ。
------

あらららら。大変なことになりました。原文とよーく見比べてみましょう。

「アルミニウム」、「銅」、「亜鉛」、「銀」はうまく置換されました。しかし、「非鉄金属」は「非 iron  gold 属」となってしまいました。

そう、用語集には「鉄」=「iron」、「金」=「gold」と登録されていたため、「非鉄金属」の中の「鉄」と「金」のみをそれぞれ登録されていた英語に置換したのです。

英日翻訳の場合、英単語と英単語の切れ目にはスペースがあるため、このような、単語をぶった切った置換は起こりません。
しかし、日英翻訳の場合は言葉がつながっているため、このような、意図しない(自分の意図とは異なる)置換が起こりうるのです。

用語集の使い方を誤ると、このような思わぬ事が起こるので要注意です。

(次回、用語集に関する注意点をまとめます。)

では、この文章をなんとか翻訳したとして(翻訳作業をするファイルは「非鉄金属_eng.txt」です。英語にしていくので、サブ拡張子は「_eng」です)、STで書き戻して、Wordファイルを作ります。

STを起動し、右上の[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択し、右下の[テキスト抽出したファイル(MS Word, Excel, Ppt)]部分に、「非鉄金属_jpn.docx」(原稿のファイル。テキストの抽出元ファイル)をドラッグします。

翻訳作業をしたファイル(「非鉄金属_eng.txt」)とテキストの抽出元ファイル(「非鉄金属_jpn.docx」)は、必ず同じフォルダの同じ階層に置いておいてください。別のフォルダ(階層)に存在していた場合、書き戻されません。

[抽出~書戻]タブの[書式タグ処理]は、今回も書式設定(太字や斜体など)はないので、[なし]にしておきます。[実行]ボタンをポチッ。

翻訳後のWordファイル「非鉄金属_eng.docx」ができたはずです。

失敗した場合は、
・一連の作業に関わったファイル名を変更してないか、
・翻訳作業をしたファイルの「段落タグ」をいじってないか、
・翻訳作業をしたファイルの冒頭([[BD-1]])を変更してないか、
・[テキスト抽出したファイル(MS Word, Excel, Ppt)]にドラッグするファイルを間違えてないか、
確認してください。

0 件のコメント:

コメントを投稿