2013年3月29日金曜日

SimplyTerms:用語集を使う場合の注意点

前回、日英翻訳で用語集による一括置換を行ったところ、「非鉄金属」が「非 iron  gold 属」となるなど、不適切な置換が起きてしまいました。今回は、用語集による(一括)置換を行う場合の注意点をまとめたいと思います。

まずは、SimplyTerms(ST)ヘルプの「用語集」には、以下のような注意点が書いてあります。

(引用ここから)
用語集による一括置換には、以下のようなメリットがあります。

・訳語がクライアントごとに異なっていても覚えておく必要がない
・訳語のチェック(用語集の検索)が不要
・登録訳語は入力が不要になる
・英日混じりだが、基本的に原語の論理で読み下せる

しかし、限界と副作用もあります。一番大きいのは、以下の点です。

・文脈によって大きく変化する用語を用語集に登録しておくと、誤訳につながる

このような副作用を避けるため、基本的に、以下のような用語だけを登録することをお勧めします。

・専門用語
・固有名詞
・クライアント固有の用語

これ以外の用語は慎重に取り扱ってください。また、訳していてどうも文脈に合わないと思ったら、必ず、原文に戻って考えてください。
(引用ここまで)

メリットの一つ目、「訳語がクライアントごとに異なっていても覚えておく必要がない」。

これは、例えば、「interface」の訳語として、クライアントAからは「インターフェイス」、別のクライアントBからは「インターフェース」を指定された場合、クライアントAの案件には「interface(tab)インターフェイス」と登録した用語集を使い、クライアントBの案件には「interface(tab)インターフェース」と登録した用語集を使うことで、いちいち「あれ?インターフェイスだったけ?それともインターフェース?」と頭を悩ませる必要がなくなります。

メリットの三つ目、「登録訳語は入力が不要になる」。

これは、訳文を作るときに、置換された後の単語をコピー&ペーストすることで、いちいち入力する手間が省け、また入力ミスも減らせます。
例えば dichlorodiphenyltrichloroethane (ジクロロジフェニルトリクロロエタン:殺虫剤のDDTのことです)と言う単語がでてきたとしましょう。英日でも日英でも、これだけ長いと入力ミスをする可能性があります。こういう長いもの、また綴りが複雑なものは、毎回ポチポチとキーボードから入力するのではなく、置換しておいて、それをコピー&ペーストした方が圧倒的に楽です。

※このコピー&ペーストの作業は、単語をマウスで反転させた後、メニューからコピー(またはペースト)を選ぶ、キーボードのショートカット(Ctrl+C, Ctrl+V)を使う、マウスの右クリックからコピー(またはペースト)を選ぶ、といろいろ方法がありますが、STに同梱されている秀丸マクロ(Copy_Lst)を使えば、コピー&ペーストが一回でできます(後日紹介します)。

デメリットの「文脈によって大きく変化する用語を用語集に登録しておくと、誤訳につながる」。

例えば「agent」という言葉の場合、英和辞書で最初に出てくるのは、代理人、代理店といったものですが、私が専門としている化学では「a chemical agent(化学薬品)」「a reducing agent(還元剤)」というように、薬品、試薬、~剤というように使われます。このような、文脈次第で大きく意味(訳語)が変わる言葉を用語集に登録し、翻訳前に一括で置換すると、訳していくときに「ん?『chemical 代理人』?ああ、化学薬品扱う業者さんね(本当は化学薬品なのに・・・)」という事態になりえます。

なので、やはり、用語集に登録して、翻訳前に一括で置換するのは、

・専門用語
・固有名詞
・クライアント固有の用語


程度に抑えておく方がいいのです(基本的に、活用する動詞などは置換しない方がいい)。
そして、翻訳を進めていって、その文章に何度も出てくる言葉があれば、そのときにその文章上で(全)置換すれば事足ります。

※この全置換を簡単に行う秀丸マクロもSTには同梱されていますので、後日紹介します。全置換しながら、「英語(tab)日本語」という、STで使える形式の用語集を作っていくという優れものです。

ここで、STの用語集のフォーマットの基本を説明しましょう。

英語(tab)日本語

これだけです。もし、後で用語集を見た人(自分や他の人)に何かメモを残したいときは、日本語のあとにタブを入れて、メモを書くことができます(置換の際は無視されます)。つまり、

英語(tab)日本語(tab)メモ

とすることができます。

このような単純な形なので、例えばこれまでに自分で蓄積してきたExcelの用語集や、インターネットで見つけた用語集なども、割と簡単に変換して使うことができます。

※英語側の末尾は基本的に単数形にしておきましょう。単数形にしておいても、英日翻訳で原文側が複数形のときには、最後に「@@pl」が付加され、複数形であったことがわかるかたちで置換されます。(不規則変化する用語は対応していないので、複数形も登録する必要があります。)

何度か用語集を使い、慣れてきたら、STヘルプの「用語集」の項目に目を通すことをおすすめします。英語側に二つ以上の単語からなる用語を入れた場合、どのように置換されるか、など書いてあるので、「あれ?用語集にあるはずなのに置換されてない・・・」などというときに読むと、原因が分かるかもしれません。


用語集を適用する際には、他に、「同じ綴りで意味が異なる単語」に注意する必要があります。

例えば、英日翻訳をするときに、1月(January)から12月(December)まで月の名前を登録した用語集を適用したとしましょう。そうすると、原文に助動詞のmayが含まれていた場合、その部分が「5月」と置換されてしまうのです。

なので、用語集を適用するとき、特に、自分で作ったのではない用語集を使う場合は、おかしな置換につながりそうなものはないか、事前に用語集の中に目を通してください。

「On the Backstage 翻訳者のための情報源」では、暦や地名、元素、サッカー用語などがSTで使える形で配布されています(ここ↓の【アーカイブ(用語集)】です)。
http://home.att.ne.jp/blue/onback/index.html

ただし、実際に使用する前に、必ず自分で、内容に目を通してください。

私は化学を専門としているので、元素の用語集を使う際の注意点をいくつか(自分の失敗例です^^;)。

・英日の場合
silicon(ケイ素):siliconだとケイ素(Si)ですが、siliconeだとシリコーン樹脂(-SiO2-)になります。SimplyTermsの一括置換では、複数形も自動的に置換してくれるのですが、「silicones」を「ケイ素@@pl」と置換してしまうので要注意です。

lead(鉛):動詞のleadも鉛と置換されてしまうので、例えば「All roads lead to Rome.」が「All roads 鉛 to Rome.」となります。

・日英の場合、
金、銀、銅、鉄、鉛など日本語が一文字のもの:「SimplyTerms:日英翻訳の場合」でもあったように、文章によっては思わぬ置換が起こるので要注意です。

2013年3月26日火曜日

SimplyTerms:日英翻訳の場合

「SimplyTermsを使った翻訳(その1~その5)」では英日翻訳を例に取り上げたので、今回は日英翻訳を試してみます。

基本的な操作は同じですので、復習を兼ねて同じようにやってみましょう。

例として下の点線と点線の間の文章をコピー&ペーストして、新たなWordファイルを作ってください。今回の文章はWikipediaの「非鉄金属」http://ja.wikipedia.org/wiki/%E9%9D%9E%E9%89%84%E9%87%91%E5%B1%9E です(一部改変)。

------
非鉄金属
非鉄金属(ひてつきんぞく、non-ferrous metal)とは、鉄および鉄を主成分とした合金、つまり鋼(ferrous metal)以外の金属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非鉄金属)に区分されている。

分類される理由
日本に限らず世界的に見ても鉄以外の金属の生産総量が鉄鋼の生産量に比べ圧倒的に少ないために、便宜的に「非鉄金属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、鉄を主体とした合金の種類よりもそれ以外の金属元素を主体とした合金の種類の方が圧倒的に多い。

主な非鉄金属
産業的によく使用される非鉄金属を以下に示す。
軽金属・・・アルミニウム、マグネシウム、ナトリウム、リチウム、チタン。
ベースメタル・・・銅、スズ、亜鉛、鉛。
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
レアアース・・・セリウム、ネオジム。
貴金属・・・金、銀、プラチナ。
------

ファイル名は「非鉄金属.docx」とし、適当なフォルダ(例えば「ST日英テスト」)に保存してください。

SimplyTerms(ST)を起動し、「ST日英テスト」を開くと、今作った「非鉄金属.docx」があるはずです。

右側のタブで[抽出~書戻]をクリックし、[処理内容]の一番上の[ファイル種類の変更]を選択し、すぐ右の[ファイルの種類]で、今回は[日本語]を選択します。

※英日翻訳(原稿が英語)の場合は[英語]を選択しましたので、日英翻訳、つまり、原稿が日本語の場合は[日本語]を選択します。

左下部分から原文ファイル「非鉄金属.docx」をドラッグし、[実行]ボタンをポチッ。

ファイル名が「非鉄金属.docx」から「非鉄金属_jpn.docx」に変わったはずです(ファイル名の前には日の丸マーク)。


次に、右上の[抽出~書戻]タブの二番目、[Officeテキスト抽出]を選択し、右下には先ほど名前を変更した「非鉄金属_jpn.docx」がある(残っている)のを確認して、[実行]ボタンをポチッ。


「非鉄金属_jpn.txt」ができました。(ST上でそのままダブルクリックしてもファイルが開くので、中身を確認してみましょう。各段落毎に「段落タグ」が挿入されているはずです。確認したら、ファイルは閉じてください。)

では、用語集を適用します。用語集として、前回使った「化学_trm.txt」を使います。

右上の[抽出~書戻]タブの[処理内容]の三番目、[用語集の適用(一括置換)]を選択します。このとき、右下部分の[処理対象テキストファイル(.txt)]に「非鉄金属_jpn.docx」と「非鉄金属_jpn.txt」が残っていたら、必要のない「非鉄金属_jpn.docx」をクリックして反転させた後、すぐ右上の[Clear]ボタンを押し、「非鉄金属_jpn.txt」のみを残します([Clear]を押すと、この[処理対象テキストファイル(.txt)]内から消えるだけで、ファイル自体は削除されないので安心してください)。

 (一度STを終了するなどした場合は、左下から「非鉄金属_jpn.txt」をドラッグしてください。)

右下部分下側の[適用する用語集(上:高優先順位)]には、前回使った「化学_trm.txt」を持ってきたいので、左上部分で前回の「STテスト」フォルダを探して開き、左下に表示された「化学_trm.txt」をドラッグしてきてください。


※用語集と、用語集を適用するファイルは別のフォルダに入っていてもOKです。

[翻訳方向]という部分は、今回も[自動判別]です。原文のサブ拡張子が「_jpn」、つまり日本語ですので、原文の中に用語集の右側の欄の日本語と一致するものがあれば、それに対応する英語で置換してくれます。

さあ、用語集を適用します。[実行]ボタンをポチッ。

「非鉄金属_eng.txt」はできたでしょうか。秀丸やメモ帳で開いてみましょう。

------
[[BD-1]]
非 iron  gold 属
[[BD-2]]
非 iron  gold 属(ひてつきんぞく、non-ferrous metal)とは、 iron および iron を主成分とした合 gold 、つまり鋼(ferrous metal)以外の gold 属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非 iron  gold 属)に区分されている。
[[BD-3]]
分類される理由
[[BD-4]]
日本に限らず世界的に見ても iron 以外の gold 属の生産総量が iron 鋼の生産量に比べ圧倒的に少ないために、便宜的に「非 iron  gold 属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、 iron を主体とした合 gold の種類よりもそれ以外の gold 属元素を主体とした合 gold の種類の方が圧倒的に多い。
[[BD-5]]
主な非 iron  gold 属
[[BD-6]]
産業的によく使用される非 iron  gold 属を以下に示す。
[[BD-7]]
軽 gold 属・・・ aluminium 、マグネシウム、ナトリウム、リチウム、チタン。
[[BD-8]]
ベースメタル・・・ copper 、スズ、 zinc 、鉛。
[[BD-9]]
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
[[BD-10]]
レアアース・・・セリウム、ネオジム。
[[BD-11]]
貴 gold 属・・・ gold 、 silver 、プラチナ。
------

あらららら。大変なことになりました。原文とよーく見比べてみましょう。

「アルミニウム」、「銅」、「亜鉛」、「銀」はうまく置換されました。しかし、「非鉄金属」は「非 iron  gold 属」となってしまいました。

そう、用語集には「鉄」=「iron」、「金」=「gold」と登録されていたため、「非鉄金属」の中の「鉄」と「金」のみをそれぞれ登録されていた英語に置換したのです。

英日翻訳の場合、英単語と英単語の切れ目にはスペースがあるため、このような、単語をぶった切った置換は起こりません。
しかし、日英翻訳の場合は言葉がつながっているため、このような、意図しない(自分の意図とは異なる)置換が起こりうるのです。

用語集の使い方を誤ると、このような思わぬ事が起こるので要注意です。

(次回、用語集に関する注意点をまとめます。)

では、この文章をなんとか翻訳したとして(翻訳作業をするファイルは「非鉄金属_eng.txt」です。英語にしていくので、サブ拡張子は「_eng」です)、STで書き戻して、Wordファイルを作ります。

STを起動し、右上の[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択し、右下の[テキスト抽出したファイル(MS Word, Excel, Ppt)]部分に、「非鉄金属_jpn.docx」(原稿のファイル。テキストの抽出元ファイル)をドラッグします。

翻訳作業をしたファイル(「非鉄金属_eng.txt」)とテキストの抽出元ファイル(「非鉄金属_jpn.docx」)は、必ず同じフォルダの同じ階層に置いておいてください。別のフォルダ(階層)に存在していた場合、書き戻されません。

[抽出~書戻]タブの[書式タグ処理]は、今回も書式設定(太字や斜体など)はないので、[なし]にしておきます。[実行]ボタンをポチッ。

翻訳後のWordファイル「非鉄金属_eng.docx」ができたはずです。

失敗した場合は、
・一連の作業に関わったファイル名を変更してないか、
・翻訳作業をしたファイルの「段落タグ」をいじってないか、
・翻訳作業をしたファイルの冒頭([[BD-1]])を変更してないか、
・[テキスト抽出したファイル(MS Word, Excel, Ppt)]にドラッグするファイルを間違えてないか、
確認してください。

2013年3月22日金曜日

SimplyTermsを使った翻訳(その5:テキストの書き戻し)

さて、「1,2-Dichloroethane_jpn.txt」の翻訳は終わったでしょうか。

ここ↓にあるのが翻訳後のファイルの中身としましょう。ファイル名は、「1,2-Dichloroethane_jpn.txt」のままにしておいてください。
------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
二塩化エチレン(ethylene dichloride: EDC)という昔の名前で一般に知られている1,2-ジクロロエタン(DCA)は塩素化炭化水素の一種で、ポリ塩化ビニル(polyvinyl chloride: PVC)の原料である塩化ビニルモノマー(vinyl chloride monomer: VCM)(別名クロロエテン)の生産に主に使われます。ほにゃららほにゃらら。
[[BD-3]]
安全性
[[BD-4]]
1,2-ジクロロエタンは有毒で(蒸気圧が高いので、特に吸入しないよう注意)非常に引火しやすい、発がん性の物質です。ほにゃららほにゃららほにゃららほにゃらら。
------

これを、STで書き戻して、Wordファイルを作ります。

まず、STを起動し、「STテスト」フォルダを開きます。このフォルダの中には
「1,2-Dichloroethane_eng.docx」(原稿のファイル。テキストの抽出元ファイル)
「1,2-Dichloroethane_eng.txt」(原稿↑からテキストを抽出したテキストファイル)
「1,2-Dichloroethane_jpn.txt」(翻訳したテキストファイル)
「化学_trm.txt」(用語集)
の4つがあるはずです。

右上の[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択します。右下部分は[テキスト抽出したファイル(MS Word, Excel, Ppt)]となります。

ここに「1,2-Dichloroethane_eng.docx」(原稿のファイル。テキストの抽出元ファイル)
をドラッグします。今回の例の場合は、最初に準備したWordのファイルです。
※STを使ってみるときに、一番つまずく人が多いのがここだと思います。翻訳作業をしたテキストファイルではありません。Wordのファイルです。

そして、[抽出~書戻]タブの[書式タグ処理]は、今回は書式設定(太字や斜体など)はないので、[なし]にしておきます。

さあ、訳文を書き戻します。[実行]ボタンをポチッ。


「1,2-Dichloroethane_eng.docx」の他に、「1,2-Dichloroethane_jpn.docx」ができたはずです。

できたばかりの「1,2-Dichloroethane_jpn.docx」をWordで開いてみましょう。

------
1,2-ジクロロエタン
二塩化エチレン(ethylene dichloride: EDC)という昔の名前で一般に知られている1,2-ジクロロエタン(DCA)は、ポリ塩化ビニル(polyvinyl chloride: PVC)の原料である塩化ビニルモノマー(vinyl chloride monomer: VCM)(またはクロロエテン)の生産に主に使われる塩素化炭化水素です。ほにゃららほにゃらら。

安全性
1,2-ジクロロエタンは有毒で(蒸気圧が高いので、特に吸入しないよう注意)引火しやすい、発がん性の物質です。ほにゃららほにゃららほにゃららほにゃらら。
------

無事に書き戻されたでしょうか。

ここで書き戻されていない場合、間違った可能性が高いポイントは

・ファイル名を変更した(その1からその4に出てきた「1,2-Dichloroethane」で始まるファイルの名前は、すべて変更してはいけません)。
・翻訳作業をした「1,2-Dichloroethane_jpn.txt」の「段落タグ」をいじった。
・翻訳作業をした「1,2-Dichloroethane_jpn.txt」の冒頭(今回の場合、[[BD-1]])を変更した(行頭に改行を入れたり、他の文字を入れたりすると、書き戻されません)。
・[テキスト抽出したファイル(MS Word, Excel, Ppt)]にドラッグするファイルを間違えた(ドラッグするのは、原稿に「ファイル種類の変更」でサブ拡張子をくっつけたWordのファイルです)。

です。書き戻しに失敗した方は、このあたりをチェックして、もう一度試して下さい。

これで、「元の原稿のファイル名を変更→テキストを抽出→用語集を適用→(翻訳)→テキストの書き戻し」が一通りできました。

次回からは、細かい注意点や同梱の秀丸マクロなどについて書いていきたいと思います。


SimplyTermsを使った翻訳(その4:置換と翻訳)

前回の最後でできた「1,2-Dichloroethane_jpn.txt」は、このようなものでした。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical 化合物 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated 炭化水素, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical 化合物@@pl and as a 溶媒@@溶剤. It forms azeotropes with many other 溶媒@@溶剤@@pl, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. ジオキソラン and トルエン are possible substitutes as 溶媒@@溶剤@@pl. ジクロロエタン is unstable in the presence of アルミニウム metal and, when moist, with 亜鉛 and 鉄.
------

原稿にあった「dichloroethane」は、ちゃんとすべて「ジクロロエタン」に置換されています。
一括置換せずに、人の手で毎回入力していくとなると、原稿を見間違えて「ジクロロタン」としてしまったり、手がすべって「ジクロロエタン」と入力したりするかもしれません。このような間違いを防ぐ(減らす)ために、人よりもコンピュータの方が得意なところはコンピュータにやってもらいましょう、というのがSTを使った翻訳の考え方です。

置換された部分を見てみると、「ジクロロエタン」のようにそのまま置換されている部分と、「化合物@@pl」「溶媒@@溶剤」と用語集通りではない部分があります。

この用語集通りではない部分は何かというと・・・
そう、英語が複数形であった場合、訳語(日本語)のあとに「@@pl」がくっつきます。
また、用語集で一つの英語に対して複数の訳語が登録されていた場合、その複数の訳語が「@@」を挟んで連結されます。

用語集に登録されていた単語は置換されたので、残りの部分は地道に翻訳をしていきましょう。この「1,2-Dichloroethane_jpn.txt」のファイルに直接訳文を書き込んでいきます。ファイル名はこのまま、決して変更しないで下さい。
(翻訳作業に秀丸を使う場合、同梱の秀丸マクロを使えば、辞書を引く手間が減ったり、入力間違いが減ったりします。これはまた後日。)

翻訳をする際の重要なポイントは、【「段落タグ」をいじらない!】です。

※「段落タグ」を消すとどうなるかは、後日詳しく説明します(場合によっては消すときもあるんです!)

★用語集を適用しない場合の注意

用語集を適用すると、「1,2-Dichloroethane_eng.txt」から「1,2-Dichloroethane_jpn.txt」が自動的に作られるので、この「1,2-Dichloroethane_jpn.txt」を書き換えていきます。
用語集が無い(用語集を適用しない)場合は、いったん、「1,2-Dichloroethane_eng.txt」を秀丸等で開いて、「名前を付けて保存...」を選び、「1,2-Dichloroethane_jpn.txt」(サブ拡張子が「_jpn」)を自分で作り、この「1,2-Dichloroethane_jpn.txt」ファイルの英文を書き換えていきます。
翻訳作業をするテキストファイルのサブ拡張子は、常にターゲット言語にしておきます。つまり、英日翻訳をしているときは、「原稿ファイル名_jpn.txt」というファイルで作業をしていて、日英翻訳をしているときは、「原稿ファイル名_eng.txt」というファイルで作業をしてください(同梱の秀丸マクロには、このサブ拡張子を判別して違う動作をしているものがあるので、間違わないように!)。

次回は、翻訳後のファイルを書き戻して、Wordファイルを作ります。

SimplyTermsを使った翻訳(その3:用語集の適用)

今回は、前回用意したテキストファイル(「1,2-Dichloroethane_eng.txt」)の中の単語を、用語集を使って一括置換してみましょう。

初めて受けた種類の案件では、用語集がない場合が(圧倒的に)多いのですが、SimplyTerms(ST)の核となる機能ですので、試してみましょう。
(用語集を適用しない場合については、次回の「★用語集を適用しない場合の注意」を良く読んで下さい。)

用語集として、下の点線と点線の間の文章を自分で秀丸やメモ帳に貼り付けて、「化学_trm.txt」(※)というファイル名で、「STテスト」フォルダにテキスト形式で保存してください。ただし、英語と日本語の間はタブ(1つ)にしてください(このブログではタブを入れられなかったので、スペース4つになってます)。(「英語(tab)日本語」というのが、STで使う用語集のフォーマットです。)
 ※「化学」の部分はなんでもいいですが、サブ拡張子の「_trm」をつけて、必ずテキスト形式で保存してください。

------
dichloromethane    ジクロロメタン
dichloroethane    ジクロロエタン
dichloroethylene    ジクロロエチレン
hydrocarbon    炭化水素
solvent    溶媒
solvent    溶剤
compound    化合物
dioxolane    ジオキソラン
toluene    トルエン
aluminium    アルミニウム
zinc    亜鉛
iron    鉄
gold    金
silver    銀
copper    銅
------

STで「STテスト」フォルダを開くと、左下部分には
「1,2-Dichloroethane_eng.docx」(ファイル名の前に地球マーク)
「1,2-Dichloroethane_eng.txt」(ファイル名の前に地球マーク)
「化学_trm.txt」(ファイル名の前に用例カード(?)のマーク)
という3つのファイルがあるはずです。

右上の[抽出~書戻]タブの[処理内容]の三番目、[用語集の適用(一括置換)]を選択すると、右下部分が二つにわかれ、[処理対象テキストファイル(.txt)]と[適用する用語集(上:高優先順位)]となります。
この[処理対象テキストファイル(.txt)]に「1,2-Dichloroethane_eng.txt」を、[適用する用語集(上:高優先順位)]に「化学_trm.txt」をそれぞれドラッグします。
そして、[抽出~書戻]タブの[翻訳方向]という部分は[自動判別]を選択します。[自動判別]では、サブ拡張子が「_eng」の場合は、そのファイル内に用語集の英語と一致するものがあれば、その英語を日本語に置換します。サブ拡張子が「_jpn」の場合はその逆です。([英→日]、[日→英]は、翻訳途中で別の用語集を追加で適用したい場合などに使います。)



さあ、用語集を適用します。[実行]ボタンをポチッ。

はい、あっという間に「1,2-Dichloroethane_jpn.txt」(ファイル名の前に日の丸マーク)という新たなテキストファイルができたはずです。


ここで、とりあえずSTは終了します([ファイル]→[終了]か、右上隅のxをクリック)。

そして、できあがったばかりの「1,2-Dichloroethane_jpn.txt」を、秀丸やメモ帳で開いてみましょう。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical 化合物 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated 炭化水素, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical 化合物@@pl and as a 溶媒@@溶剤. It forms azeotropes with many other 溶媒@@溶剤@@pl, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. ジオキソラン and トルエン are possible substitutes as 溶媒@@溶剤@@pl. ジクロロエタン is unstable in the presence of アルミニウム metal and, when moist, with 亜鉛 and 鉄.
------

用語集に登録されていた単語が置換されていますね。
詳しくは次回。

2013年3月21日木曜日

SimplyTermsを使った翻訳(その2:テキストの抽出)

では、「1,2-Dichloroethane.docx」というファイルに書かれた英文を翻訳(英日翻訳)する流れを見ていきましょう。

まず、SimplyTerms(ST)を起動します。
左側が、フォルダ間を移動したり、フォルダを開いたりするところです。

左上部分で、前回作った「STテスト」フォルダを探し、ダブルクリックすると、左下部分にフォルダの中身が表示されます。
(この時点で、「1,2-Dichloroethane.docx」というファイルが表示され、[言語]欄は空白、[種類]欄には「docx」と表示されているはずです。)


次に、右側に目を向けます。
右上に[抽出~書戻][用語集][整形・編集][その他]というタブが並んでいます。最初に使うのは[抽出~書戻]ですので、これをクリックします(起動直後は基本的にこれが一番上に出ています)。
そして、[処理内容]の一番上の[ファイル種類の変更]を選択し、すぐ右の[ファイルの種類]で[英語]を選択します。
右下部分は[処理対象ファイル]となっているはずなので、ここに、左下部分から原文ファイル(「1,2-Dichloroethane.docx」)をドラッグしてきます。


ここまで準備できたら、右上タブの右側にある[実行]ボタンをポチッと押します。
そうすると、ファイル名が「1,2-Dichloroethane.docx」から「1,2-Dichloroethane_eng.docx」となり、ファイル名の前には地球マークが表示され、[言語]欄は「英語」になったはずです(名前が変更されただけで、中身は変わっていません)。

※この、ファイル名に追加された「_eng」の部分を、STでは「サブ拡張子」と呼びます。最初のうちは、「_eng」(中身が英語)、「_jpn」(中身が日本語)、「_trm」(ST用の用語集)の3つを覚えておいて下さい。

次に、右上の[抽出~書戻]タブの二番目、[Officeテキスト抽出]を選択します。右下部分が[テキストを抽出するファイル(MS Word, Excel, Ppt)]となり、先ほど名前を変更した「1,2-Dichloroethane_eng.docx」が残っているはずです。そのファイルをそのままにしておいて、右上タブの右側にある[実行]ボタンをポチッと押します。

すると、「1,2-Dichloroethane_eng.txt」というファイルができているはずです(ファイル名の前には地球マーク)。

それを秀丸などのテキストエディタ(無い場合はWindowsのアクセサリの「メモ帳」でもOK)で開いてみると、下のようになっているはずです。

------
[[BD-1]]
1,2-Dichloroethane
[[BD-2]]
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

そう、[[BD-1]]や[[BD-2]]といった[[]]で囲まれた行が、各段落の上に挿入されています。STのヘルプを見ても、これに名前はついてないようなので、このブログでは「段落タグ」と呼ぶことにします(ExcelやPowerPointなどでは段落毎につくわけではないのですが、便宜的にこう呼ぶことにします)。

※この「段落タグ」の中は絶対に書き換えてはいけません(うまく書き戻されなくなります)。
原稿ファイルの「1,2-Dichloroethane_eng.docx」は、絶対に、中身を書き換えたり、ファイル名を変えたりしないで下さい(うまく書き戻されなくなります)。

次回は、用語集を使って、用語集にある英単語を一括で置換します。

SimplyTermsを使った翻訳(その1:ファイルの準備)

では、SimplyTerms(以下、ST)を使った翻訳作業を、順を追って説明していきます。

例として、下のような文章の書かれたWordファイルに上書きで翻訳(英→日)する場合を見てみましょう。(ちなみに、この文章はWikipedia(英語版)の1,2-Dichloroethaneの一部です http://en.wikipedia.org/wiki/1,2-Dichloroethane)。

ファイル名「1,2-Dichloroethane.docx」
------
1,2-Dichloroethane
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]

Safety
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

使い方を理解するためには、STを実際に使ってみるのが一番なので、同じように操作してみましょう。

まず、どこか適当にフォルダ(例えば「STテスト」)を作ります。
上の点線と点線の間の文章を自分でWordファイルに貼り付けて、「1,2-Dichloroethane.docx」(※)というファイル名で「STテスト」フォルダに保存します。

この時点では、「STテスト」フォルダの中に「1,2-Dichloroethane.docx」が一つだけある状態です。

これで、翻訳会社から原稿(のみ)をもらった状態ができました。
次回は、STを使ってこのファイルからテキストを抽出します。

※STで扱えるOfficeのファイル形式(拡張子)は、Word(.doc、.docx)、Excel(.xls、.xlsx)、PowerPoint(.ppt、.pptx)です。今回例で扱うのは「.docx」としましたが、「.doc」でもSTの操作は全く同じです。

SimplyTermsってなに?

・SimplyTermsって時々目(耳)にするけど、何?
・SimplyTermsをダウンロードしてみたけど、使い方がよくわからない・・・
・SimplyTermsで何が出来るの?
という翻訳者(の卵さん)の一助となるよう、何回かにわたり使い方を紹介していきます。

SimplyTermsとは?

SimplyTermsとは、Buckeyeさんが作成された、「用語集による一括置換を核とした翻訳支援ソフト」です。
入手先はココ↓
http://homepage2.nifty.com/buckeye/software/index.htm

中心となる機能は、「WordやExcel、PowerPointなどのMS Office製品で渡された原文ファイルからテキスト(文字データ)のみを抜き出し」、(他のテキストエディタやWord、Trados等で翻訳した後)「元のファイルに書き戻す」機能です。
ですから、SimplyTermsで翻訳するわけではなく、SimplyTermsに翻訳を「支援」してもらうのです。

では、どういうときに威力を発揮するかというと、例えば
・図や表、写真がたっぷり含まれるWordファイル
・ちまちましたテキストボックスが大量に貼り付けてあるPowerPointファイル
に訳文を上書きして下さい、と言われたとき。

WordやPowerPointは確かに便利なソフトです。でも、
・突然、フリーズする。落ちる。保存できない。
・貼り付けてあった図がどこかに消える。
・(初期設定のままだと)お節介すぎる。
・(テキストエディタに比べて)動きが遅い。
ということがあり、作業をしているとイライラすることが多々あります。

そこで、SimplyTermsと秀丸等のテキストエディタの出番です。

SimplyTermsでWordなどのMS Officeファイルからテキスト(文字データ)のみを抜き出し、(動作の軽快な)テキストエディタで翻訳し、元のMS Officeファイルに書き戻すことで、書式や段落を保ったままの、(つまり、そのまま上書きしていったような)訳文ファイルができあがるのです。

翻訳作業は、テキストエディタではなく、WordやTrados等でされている方もいらっしゃるようですが、私はテキストエディタである秀丸を使っています。というのも、SimplyTermsにはBuckeyeさんが作られた、翻訳作業に役立つ秀丸マクロが同梱されてるからです。この秀丸マクロによって、辞書を引く手間が減ったり、入力間違いが減ったりするので、ぜひ、秀丸を使うことをおすすめします。

秀丸はシェアウェア(4200円)で、こちら↓からダウンロードできます(試用期間あり)。
http://hide.maruo.co.jp/software/hidemaru.html

最後に、SimplyTermsを実際に使う前に、ぜひ、SimplyTermsの[ヘルプ]の「翻訳作業とツール」、「TM/MT vs. 手作業」に目を通してください。なぜツールを使うのか、どういうときにツールを使えばいいのか、そして、どのようにツールを使えばいいのか、ということがわかります。

ブログを開設しました。

こんにちは。
フリーランス翻訳者のyukariと申します。
主に化学や材料、その他理系の論文や報告書の翻訳をしています。

気が付けば翻訳を始めて今年で6年目。この間、翻訳者の先輩方のブログや翻訳フォーラム、最近ではTwitterなどのSNSから多くを学び、翻訳や翻訳周りの知識(というほど大げさなものではないのですが。有用な情報ってところかな?)を得てきました。これを自分の中に溜めておくのではなく、少しでも他の方に渡せたらいいな、と思い、ブログを始めることにしました。

情報は発信した人のところに集まってくる、ということを良く耳にするので、私も発信することでさらに勉強したいと思います。

今のところ、↓のような内容を書いていこうと思います。

1.翻訳支援ソフト「SimplyTerms」(Buckeyeさん作)について

 私がとてもお世話になっているソフトです。同梱の秀丸マクロも含めて、なくてはならない存在です。とても便利なのですが、「試しに使ってみよう!→あれ?どうするの??→放置」となっている方をブログなどで時々見かけてきました。
使い方は全部ヘルプに書いてあり、一、二度実際に使ってみればあとは簡単なのですが、ちょっと試すには、ヘルプのどこを読めばいいのかわからないのか、量が多すぎるのか、つまずく方がいるようなので、実際に操作しながら学べるように、基本的な使い方についてまとめます。

2.テキストエディタ「秀丸」を使った翻訳

Buckeyeさんは翻訳作業を楽にする秀丸マクロを「SimplyTerms」に同梱して配布されています。このマクロのうち、私が使っているものを中心に紹介します。
また、「秀丸」には翻訳をしていて便利だな、と思う機能があります。これも少しずつ紹介していきたいと思います。

3.論文や報告書の翻訳、科学英語に関するあれこれ

私が主に手がけている、論文や報告書などの翻訳関連で何かあれば書いていきたいと思います。

4.その他

1~3以外のことで何かあれば、ちょこちょこと。

それでは、よろしくお願いします!