2013年10月3日木曜日

秀丸の設定:ファイルタイプ別の設定(その1)

テキストエディタ「秀丸」を使って翻訳(執筆)をするときに、これは便利だなという設定や機能を紹介します。

まずは、秀丸を使って翻訳(執筆)をするときに設定しておいた方が良いものをいくつか挙げます。(メニューの[その他]→[ファイルタイプ別の設定]から設定します。)

[体裁]→[詳細]

「カーソル位置の自動復元(最後のカーソル位置を覚える)」

これにチェックをいれておけば、一度ファイルを閉じて、次にファイルを開いたときに、前回カーソルがあったところ(前回翻訳を終えたところ)が表示されます

[デザイン]→[表示]

・「改行文字、タブ文字、全角空白、半角空白を記号で表示」
これらはWordでも表示するようにしておいた方が良いと思います。(Wordの[ファイル]→[オプション]→[表示]→「常に画面表示する編集記号」で表示したいものにチェックを入れる。)

・「対応する括弧を強調表示」
これを設定しておくと、括弧の直前にカーソルを置いたときに、対応する一組(前後)の括弧が太く強調されます。対応する括弧が無い場合は強調表示されませんので、括弧の閉じ忘れ(入力し忘れ)に気付くことができます。複雑な分子式や組成式を扱うときに役立ちます。

・「最後に編集した所を表示」
秀丸マクロ:最後に編集した位置へコピーするマクロ」を使う場合には、表示させておいた方が良いです。


[デザイン]→[強調表示]


翻訳をする場合、数字の転記ミスは絶対に避けなければならないので、数字は目立たせておいた方が良いと思います。また、逆に、目立たないようにしたいものもあります。ここでは、それらの設定方法を紹介します。


強調表示の設定の仕方は、
①「強調表示一覧」の右側の「追加」をクリックする。

②「文字列」の部分に、下に紹介する文字列を入力する。
③「検索方法」で必要な項目にチェックを入れる(今回紹介するものはすべて正規表現を使っているので、「正規表現」に必ずチェックを入れてください)。
④「表示方法」で強調の仕方を選ぶ。(どのように強調するかは、別のところで変更できます。後記。)
  • 数字を目立たせる
文字列:[0-90-9]
(前の方の0と9は半角、後ろの方の0と9は全角です。ハイフンは半角。)
検索方法:「正規表現」にチェックを入れる。
[その他]→[ファイルタイプ別の設定]→[デザイン]の「場所の一覧」で「数値」にチェックを入れた場合、全角の数字英字に直接続く半角数字 (C6H12O6などに含まれる数字)は強調されないので、私はこのように強調表示で設定をしています。
  • 書式設定タグを目立たせる
文字列:<[a-z/]+>
(すべて半角)
検索方法:「正規表現」にチェックを入れる。

SimplyTerms(ST)特有の書式設定タグは、転記し忘れないように、青色+太字で目立つようにしています。
  • 段落タグを目立たせる(目立たないようにする)
文字列:\[\[[A-Z\-0-9]+\]\]
(すべて半角。バックスラッシュで表示されているものがあったら、円マークと読み替えてください。)
検索方法:「大文字/小文字の区別」と「正規表現」にチェックを入れる。

ST特有の段落タグは「英大文字+ハイフン(-)+半角数字」でできているので、この正規表現で段落タグを探し、目立たないように薄い色で表示するように設定しています。
***************************************************
強調表示の色やスタイルを変えたいときは、[その他]→[ファイルタイプ別の設定]→[デザイン]の「場所の一覧」で変更したい強調表示を選択し、右の「プロパティ」で色やスタイルを好みのものに変更します。目立たせたいときは、濃い色にしてボールドや下線等を設定し、逆に目立たせたくないときは、薄い色を設定すれば良いと思います。


2013年8月2日金曜日

秀丸マクロ:書式設定用タグ入力マクロ

前回、括弧を挿入するマクロを紹介しましたが、今回はSimplyTerms(ST)の書式設定用タグを挿入するマクロを紹介します。

普通、秀丸等のテキストエディタでは太字や斜体字、上付き文字、下付き文字などの文字修飾は使えません。しかし、STを使えば、Officeファイルに元々あったこれらの文字修飾(書式)の情報を保持したままテキストを抽出し、秀丸で翻訳後、Officeファイルに書き戻すと同時に自動で書式を設定することができます(「SimplyTerms:書式が設定された文章を扱う」参照)。

このとき、書式情報を保持するために使われているのが、下の「書式設定用タグ」です。
上付き文字:<sup>対象文字</sup>
下付き文字:<sub>対象文字</sub>
太字:    <b>対象文字</b>
斜体字:   <i>対象文字</i>
下線:    <u>対象文字</u>
※「書式タグ」はすべて半角の英字。
これらのタグを簡単に入力(挿入)するためのマクロが「Ins_FormatTags.mac」です。

使い方は、前回紹介した括弧挿入マクロのなかの「Ins_Parens.mac」と同じで、とても簡単です。
マクロを実行すると、メニューが出るので、入力したいタグを選びます。また、範囲選択の有無でマクロの動作が違います。
  • 単語(またはフレーズ)を選択している場合
選択範囲の前後にタグを挿入します。
  • 何も選択していない場合
カーソル位置にタグを入力し、前のタグと後ろのタグの間にカーソルを置きます。
このマクロのメニューでは、上に挙げた「書式設定用タグ」の他に、以下の
段落内改行:<lbr>
改ページ:<pbr>
マルC(©):<ch>(C)</ch>
マルR(®):<ch>(R)</ch>
TM(™):<ch>(TM)</ch>
も選ぶことができます。これらを入力したいときは、入力したい箇所にカーソルを置き、何も選択しないで、マクロを実行します。

2013年7月17日水曜日

秀丸マクロ:括弧挿入マクロ

今回紹介するSimplyTerms(ST)同梱マクロは、丸括弧やカギ括弧などを、両側(前後)いっぺんに入力(挿入)するマクロ(Ins_Paren().mac、Ins_Paren「」.mac、Ins_Parens.mac)です。

それぞれのマクロの基本的な動作は以下の通りです。
Ins_Paren().mac: _jpn.txtでは全角の()、_eng.txtでは半角の()を挿入します。 
Ins_Paren「」.mac:_jpn.txtでは全角の「」、_eng.txtでは半角の""を挿入します。 
Ins_Parens.mac:メニュー(『』、「」、〈〉、《》、{}、()、〔〕、[]、【】、“”、"")が出るので、挿入したい括弧を選びます。

※サブ拡張子がついていないテキストファイルでも使えます。その場合は基本的に全角の括弧が挿入されると思ってください。詳しくはSTの秀丸マクロヘルプをご覧ください。
 
また、範囲選択の有無でマクロの動作が違います。
  • 単語(またはフレーズ)を選択している場合
選択範囲の前後に括弧を挿入し、後ろの括弧の後ろにカーソルを置きます。
例えば、「世界保健機関WHOは、・・・」のWHOを範囲選択して、Ins_Paren().macを実行すると、「世界保健機関(WHO)は、・・・」と一発で前後の括弧を挿入することができます。
  • 選択していない場合
カーソル位置に両側の括弧を挿入し、括弧の内側にカーソルを置きます。

これらのマクロは、地味だけどとても便利です。特に、「マクロ実行後のカーソル位置」がよく考えられていると思います。ぜひ一度、試してみてください。私は丸括弧を使うことが多いので、Ins_Paren().mac はショートカットキーを割り当てて使っています。

2013年6月28日金曜日

秀丸マクロ:最後に編集した位置へコピーするマクロ

今回紹介するSimplyTerms(ST)同梱マクロは、置換した語句などを簡単にコピー&ペーストする「Copy_LST」です。

訳文を入力するときに、一括置換した用語を見ながらキーボードから入力し直すと、入力のための手間暇もかかるし、入力ミスや誤変換をする可能性もあります。このマクロを使えば、一括置換した用語や「AddTerm」マクロで置換した用語を簡単に訳文に貼り込むことができるので、手間暇は減り、入力ミスや誤変換も減らすことができます。

マクロの動作

  • 単語(またはフレーズ)を選択している場合
選択した範囲を、最後に編集した位置に貼り込みます。(toやandなどのいくつかの前置詞や接続詞、句読点を選択範囲した場合は、「から」「と」などと変換されて入力されます。詳細は後述)
  • 範囲選択していない場合
カーソル位置が最終編集位置とは異なる場合は、そのカーソル前後のスペースやテン、カンマ、改行、@などで挟まれた部分を、最後に編集した位置に貼り込みます。
カーソル位置が最終編集位置のママの場合は、現在編集中のテキストファイルのサブ拡張子が「_eng」の場合、「, 」(カンマ+半角スペース)を挿入し、それ以外のファイルの場合は、「の」を挿入します。

※秀丸で「最後に編集した位置」を一目見てわかるようにするには、メニューの[その他]→[ファイルタイプ別の設定]→[デザイン]→[表示]で「最後に編集したところを表示」にチェックを入れます。「Copy_LST」マクロを使う前に設定を確認してください。



では、このマクロを下の文章の英日翻訳で試しに使ってみましょう。Wikipediaの「Cresol」のページの一部です(http://en.wikipedia.org/wiki/Cresol)。

---------
In its chemical structure, a molecule of cresol has a methyl group substituted onto the ring of phenol. There are three forms (isomers) of cresol: ortho-cresol (o-cresol), meta-cresol (m-cresol), and para-cresol (p-cresol). These forms occur separately or as a mixture.
---------

テクニカルタームを一括置換したものが、下の文章です。

---------
In its chemical structure, a molecule of クレゾール has a メチル基 substituted onto the ring of フェノール. There are three forms (異性体) of クレゾール: ortho-クレゾール (o-クレゾール), meta-クレゾール (m-クレゾール), and para-クレゾール (p-クレゾール). These forms occur separately or as a mixture.
---------

訳文を作っていきます。下の文章は、一文目を訳し終わったところです。
(↓この文章をコピーして「クレゾール_jpn.txt」などの名前でテキストファイルを作ってから、マクロを試してみてください。)

---------
クレゾール分子は、フェノールの環上の水素の一つがメチル基に置換された構造をしています。

There are three forms (異性体) of クレゾール: ortho-クレゾール (o-クレゾール), meta-クレゾール (m-クレゾール), and para-クレゾール (p-クレゾール). These forms occur separately or as a mixture.
---------

一文目に引き続き、二文目を「クレゾールには、o-クレゾール、m-クレゾール、p-クレゾール、と三つの異なる形(異性体)があります。」と入力したいと思います。

まず、一文目の最後の「。」のあとに「最後に編集した位置」マークがあることを確かめます。


(他の所に「最後に編集した位置」マークある場合、この一文目の最後の「。」のあとにスペースを入力して、バックスペースで消せば、そこが「最後に編集した位置」になります。)←この括弧内の動作をマクロにしたものが、後述の「MoveEditPoint2CurCursor」マクロ。

そして、英文の「There are three forms (異性体) of クレゾール:」の「クレゾール」を範囲選択し、「Copy_LST」マクロを実行します。

---------
クレゾール分子は、フェノールの環上の水素の一つがメチル基に置換された構造をしています。クレゾール

There are three forms (異性体) of クレゾール: ortho-クレゾール (o-クレゾール), meta-クレゾール (m-クレゾール), and para-クレゾール (p-クレゾール). These forms occur separately or as a mixture.
---------

クレゾール」が一瞬でコピー&ペーストされました。カーソルは、いまコピー&ペーストされた「クレゾール」のあとにあるので、そのまま「には、」とキーボードから入力します。そして今度は「o-クレゾール」を範囲選択し、「Copy_LST」マクロを実行すると、また一瞬で「o-クレゾール」がコピー&ペーストされました。このように、キーボードからの入力と、すでに置換してある用語のコピー&ペーストを繰り返すと、二文目の入力が終わります。

---------
クレゾール分子は、フェノールの環上の水素の一つがメチル基に置換された構造をしています。クレゾールには、o-クレゾールm-クレゾールp-クレゾール、と三つの異なる形(異性体)があります。

There are three forms (異性体) of クレゾール: ortho-クレゾール (o-クレゾール), meta-クレゾール (m-クレゾール), and para-クレゾール (p-クレゾール). These forms occur separately or as a mixture.
---------

今回は、範囲選択をしてから「Copy_LST」マクロを実行しましたが、範囲選択しない場合は次のような動作をします。
  • カーソル位置が最終編集位置とは異なる場合
そのときカーソルがある前後の、スペースやテン、カンマ、改行、括弧、@などで挟まれた部分がコピー&ペーストされます。今回の例の場合、最初の「クレゾール」のときに範囲選択せずに「クレゾール」の「レゾー」あたりにカーソルをおいて「Copy_LST」マクロを実行すると、「クレゾール」だけがコピー&ペーストされますが、二箇所目の「o-クレゾール」のときに範囲選択せずに「レゾー」あたりにカーソルをおいて「Copy_LST」マクロを実行すると、「(o-クレゾール)」がコピー&ペーストされます。
 ※日英翻訳の場合、ST(または「AddTerm」マクロ)で置換した英単語の前後にはスペースが挿入されているはずなので、基本的に英単語のみがコピー&ペーストされます。

  • カーソル位置が最終編集位置のままの場合
現在編集中のテキストファイルのサブ拡張子が「_eng」の場合、「, 」(カンマ+半角スペース)を挿入し、それ以外のファイルの場合は、「の」を挿入します。


範囲選択してから「Copy_LST」マクロを実行する場合、以下の左側の語と記号は右側のように変換されてからペーストされます。
to → から
or → や
and → と
at → における
. → 。
, → 、
。 → . (ピリオド+半角スペース)
、 → , (カンマ+半角スペース)

(このように変換されて欲しくないときは、「Copy_LST.mac」の104行目から113行目を書き換えます。)

このように、このマクロを使うと、すでにある語句を簡単にコピー&ペーストすることができますので、翻訳のみならず、原稿やブログを書くときにも使えます。私はこのマクロをマウスの親指から二番目に近いボタンに割り当てて使っています(一番近いところには、「辞書引きをするマクロ(Dic_DDJamming.mac)」)。

******************
この「Copy_LST」マクロを使うときに一緒に使うと便利なのが、上でちょっと触れた「MoveEditPoint2CurCursor」マクロです。
改行の直前でマクロを実行すると、そこが「最後に編集した位置」になります。
(スペースを入力して、それをバックスペースで消しています。)
文の途中など、改行の直前ではないところでこのマクロを実行すると、改行をしてから、その改行の直前が「最後に編集した位置」になります。

この「MoveEditPoint2CurCursor」マクロにも入力しやすい位置のショートカットを割り当てておくと便利です。

2013年6月21日金曜日

秀丸マクロ:用語統一(一括置換&用語集生成)マクロ

SimplyTerms(ST)に同梱されているマクロの中で、次に紹介するのは用語統一用のマクロ、「AddTerm」です。

このマクロを使うと、秀丸標準の[置換]機能よりも簡単に「(一括)置換」ができ、それと同時に、置換した原語と訳語をセットにした用語集を(ほとんど自動的に)作っていくことができます。

基本的な使い方は、
(訳語を訳文に入力→)訳語をクリップボードにコピー→原語を範囲選択→マクロ実行→(用語集に原語と訳語のセットが自動的に登録される)→マクロ実行
ですが、これだけではわかりづらいと思うので、「SimplyTermsを使った翻訳(その1)~(その5)」で使った「1,2-Dichloroethane.docx」の翻訳(英日翻訳)で実際に試してみましょう。

下の点線と点線の間をコピーして、「1,2-Dichloroethane_jpn.txt」という名前のテキストファイルを秀丸で作ってください。(もとの原稿にサブ拡張子をつけて、テキスト抽出して、サブ拡張子を変更して、英日翻訳をするためのテキストファイルが準備できた状態です。)

サブ拡張子は常にターゲット言語にしておいてください。今回のマクロでは、このサブ拡張子も関係してきます。

------
[[BD-1]]
1,2-Dichloroethane
[[BD-2]]
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

では、始めましょう。

※どのように翻訳作業を進めるか、例えば原文の上側に訳文を書いていく、下側に書いていく、原文訳文と交互に書いていくなど、やり方はそれぞれだと思うので、これは一つの例です。

ざっと内容に目を通し、ひとまず、最初の段落(小見出し)を訳しました。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

次の段落の最初の方にまた「dichloroethane」を見つけました。この後も何度も出てくるようです。これを一括置換しましょう。
まず「ジクロロエタン」(訳語)を範囲選択し、コピーします(これでクリップボードに「ジクロロエタン」(訳語)がコピーされました)。
次に、「dichloroethane」(原語)を範囲選択します。
そして(範囲選択したままの状態で)、「AddTerm」マクロを実行します。

すると、自動で新しい秀丸ファイルが開き、一行目に
dichloroethane    ジクロロエタン
と入力されました。そのままの状態で、もう一度「AddTerm」マクロを実行します。

翻訳をしていた「1,2-Dichloroethane_jpn.txt」のファイルに自動的に戻り、[置換の確認]という小さいウィンドウが現れ、dichloroethaneとDichloroethaneがハイライトされています。(大文字と小文字は区別されません。)

今回はそのまま全部置換しても大丈夫なので、[一気]をクリックします。すると、下のように、すべて置換されました。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical compound 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. ジクロロエタン is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

これが、このマクロの基本的な動きです。

先ほど自動でできた秀丸ファイルを見てみると、ファイル名は「1,2-Dichloroethane_trm.txt」(「元のファイル名_trm.txt」)となっています。サブ拡張子が「_trm」で「英語(tab)日本語」という形式、つまりSTの用語集形式になっていますので、次回似たような案件を依頼されたときに用語集として使えます。

次の単語をまた「AddTerm」で置換すると、今できた「1,2-Dichloroethane_trm.txt」の用語集に追加されます。実際に試してみましょう。

「compound」を「化合物」と置換してみます。
------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
化合物

The chemical compound 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. ジクロロエタン is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

まず「化合物」と入力し、これをコピーし、「compound」を範囲選択し、「AddTerm」を実行します。
先ほどの「1,2-Dichloroethane_trm.txt」の1行目に、「compound」と「化合物」のセットが追加され、先ほどあった「dichloroethane」と「ジクロロエタン」のセットは2行目に移動しました。
compound    化合物
dichloroethane    ジクロロエタン
もう一度「AddTerm」マクロを実行すると、また、[置換の確認]という小さいウィンドウが現れ、どのように置換するか聞いてきますので、自分の望む置換方法を選びます。
[一気]で置換した結果は、下のようになります。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
化合物

The chemical 化合物 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical 化合物@@pl and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. ジクロロエタン is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

※STで用語集を適用したときと同じように、英語が複数形であった箇所には、訳語(日本語)のあとに「@@pl」が自動的につけられます。

これがこのマクロの基本的な動きです。頻繁に使うものなので、入力しやすいショートカットキーを割り当てるといいと思います(マウスを右手で使うなら、左手で簡単に入力できるところがおすすめです)。

[置換の確認]ウィンドウの各項目は、以下のような動きをします。(各項目は、マウスでクリックするだけではなく、括弧に入ったアルファベットを入力することでも選べます。このアルファベットの入力の方が断然早いと思います。)
置換(R)・・・いま選択されている(反転している)箇所のみを置換します。
置換+次(C)・・・いま選択されている(反転している)箇所を置換したあと、次の対象箇所に移動します。
一気(A)・・・対象となる箇所(ハイライトされている箇所)すべてを置換します。
上候補(P)・・・いま選択されている(反転している)箇所を置換せずに、前(上)の対象箇所に移動します。
下候補(N)・・・いま選択されている(反転している)箇所を置換せずに、次(下)の対象箇所に移動します。
キャンセル・・・何も置換せずに終わります。

このマクロを使うときに注意する点は、
  • サブ拡張子を必ずターゲット言語にしておく(英日翻訳の場合は「_jpn」)。このマクロは、自動的に生成される用語集が「英語(tab)日本語」の順番になるように、サブ拡張子を参照して判断しているので、サブ拡張子を間違うと、1列目(英語)と2列目(日本語)が逆になった用語集ができてしまいます。
  • 「AddTerm」マクロを一度実行し用語集ファイルに移動したときに、(英語の複数形など)必要に応じて用語を修正する。英語が複数形だった場合、マクロ実行直後はその複数形(と思われる)部分が範囲選択されている状態なので、削除したり、書き換えたり、等、簡単に修正ができます。
何度か使って慣れてきたら、STの[ヘルプ]→[同梱秀丸マクロのヘルプ]→[個別マクロの操作方法]→[用語統一]をぜひ読んで下さい。


***************************************
実は私はこのマクロをそのまま使うのではなく、一部書き換えて使っています。こういうふうにも使えるよ、ということで、参考に書いておきます。

「AddTerm」マクロの場合、最初に訳語をクリップボードにコピーするために、訳語を訳文中にあらかじめ入力しなければなりません。つまり、次のような流れになります。
(訳語を訳文に入力→)訳語をクリップボードにコピー→原語を範囲選択→マクロ実行→(用語集に原語と訳語のセットが自動的に登録される→)マクロ実行
これを、私の翻訳の進め方に合うように、
原語を範囲選択→マクロ実行→訳語をウィンドウに入力→OKをクリック→(用語集に原語と訳語のセットが自動的に登録される→)マクロ実行
という流れになるようにマクロを変更しました。変更した箇所は次の通りです。

AddTerm.mac(抽出単語を追加するマクロ Ver 3.00)の232行目から253行目
-------------------------------------------------------------------------
    //置換元単語を$$originalwordにコピー
    $$originalword = gettext(seltopx, seltopy, selendx, selendy);
    call ReplaceStr $$originalword, " ", " ";
    $$originalword = $$return;

    //フレーズが登録されているファイルをオープンし、最初に移動。
    call Another_File $PhrsFile;
    escape;
    gofiletop;

    //以下の形式で登録
    //   英語    日本語(リターン)
    if ($TransDir == "EtoJ"){
        insert $$originalword + "\t" +"\n";
        left;
        poppaste;
    } else {
        insert "\t" + $$originalword + "\n";
        gofiletop;
        poppaste ;
    }
    save;
-------------------------------------------------------------------------

-------------------------------------------------------------------------
    //置換元単語を$$originalwordにコピー
    $$originalword = gettext(seltopx, seltopy, selendx, selendy);
    call ReplaceStr $$originalword, " ", " ";
    $$originalword = $$return;
//変更!訳語を入力する
    $jpnword = input("訳語を入力してください");


    //フレーズが登録されているファイルをオープンし、最初に移動。
    call Another_File $PhrsFile;
    escape;
    gofiletop;

    //以下の形式で登録
    //   英語    日本語(リターン)
    if ($TransDir == "EtoJ"){
        insert $$originalword + "\t" +"\n";
        left;
//変更!    poppaste;
        insert $jpnword;


    } else {
        insert "\t" + $$originalword + "\n";
        gofiletop;
//変更!    poppaste ;
        insert $jpnword;

    }
    save;
-------------------------------------------------------------------------

2013年6月14日金曜日

秀丸マクロ:辞書引きマクロ

SimplyTerms(ST)に同梱されているマクロの中で、一番役立つのは「辞書引きマクロ」だと思います。秀丸エディタを使って翻訳をしているときに、カーソル位置の単語、あるいは選択範囲の用語について、JammingやDDWinで辞書を引くことができます。

使う場合には、自分の環境に合わせて数カ所書き換える(カスタマイズする)必要があります。バージョンアップ時に不用意に上書きしないよう、カスタマイズするときに別名で保存しておくことをおすすめします(最近はマクロ自体はバージョンアップされていないようですが、念のため)。

マクロの動作

単語(またはフレーズ)を選択している場合
  • その選択範囲をJammingやDDWinで調べます。
選択していない場合
  • 英語の文章では、カーソルがある位置の単語を調べます。カーソルが改行やピリオドの所にある場合、ファイルの前方にさかのぼっていって最初に出会った単語を調べます。
  • 日本語の文章では、カーソルがある位置の「漢字の連なり」を調べます。ひらがなやカタカタ、改行や句読点のところにカーソルがある場合は、直後が漢字ならその漢字、漢字で無い場合はファイルの前方にさかのぼっていって最初に出会った漢字(の連なり)を調べます。

また、このマクロは英単語の語尾(ed, ing, ies, es, er, est, ness など)を補正してくれます。ただし、機械的に判別しているので、正しく補正できないものもあるので注意してください(例えば、putting→putt, species→specy となってしまうなど)。

カスタマイズ方法

マクロを保存しているフォルダにある、「Dic_DDJamming.mac」(中身は普通のテキスト)を秀丸で開き、
//●●●●●カスタマイズ部分-ここから●●●●

//●●●●●カスタマイズ部分-ここまで●●●●
で挟んである部分を書き換えて、(別名で)保存します。書き換え方はそのカスタマイズ部分の上に書いてあります。

カスタマイズ箇所は以下の通りです。私はJammingだけしか使ってないので、DDWinについてはよくわかりませんm(_ _)m。

・110行目から(必須

使用する辞書ブラウザを指定します。このマクロでは、Jammingのみ、DDWinのみ、あるいは両方を使うことができます。

・118行目から

終了時のフォーカスを「辞書画面のまま」にするか、または「秀丸に戻す」かを選びます。

・135行目から(DDWinを使う場合のみ)

「通常のフレーズ検索」か「プラプラ検索」とするかを選びます。

・155行目から(DDWinを使う場合のみ。「実行ファイルのある場所」は必須

DDWinの実行ファイルのある場所やグループ指定、検索条件などを書き換えます(指定方法などは、DDWinのヘルプで確認してください)。

・171行目から(Jammingを使う場合のみ。「実行ファイルのある場所」は必須

青字の部分(Jammingの実行ファイルのある場所と辞書グループの指定、検索条件など)を書き換えます。

run "c:\\program files\\Jamming\\Jamming.exe -w\"" + $$word + "\" -m\"一網打尽\" -n\"第1グループ\" -#1 -f";

  • 「c:\\program files\\Jamming\\Jamming.exe」の部分→自分の環境で、Jammingの実行ファイルのある場所に書き換えます。(文字化けしているかもしれませんが)円マーク(\)を二つ重ねることを忘れずに。
  • 「一網打尽」→Jammingの検索方法を指定します。「一網打尽」か「前方一致」にするといいと思います。(私は普段は「前方一致」で検索しておいて、必要なときだけ、Jamming側で検索方法を「一網打尽」にして調べています。)
  • 「第1グループ」→Jammingを複数立ち上げ、いつも決まった「辞書セット」(Jammingの辞書ウィザードで設定できます)で辞書を引く場合、この部分を自分が使う「辞書セット」の名前にしておけば、その辞書セットで辞書を引いてくれます。辞書セットを案件毎に変えたりする場合は、この部分は書き換えずに、Jamming側で自分で辞書セットを指定すれば大丈夫です。

 ----------------------
Jammingは現在では単体での新規ライセンス販売は終了していますが、Logophileの正規ユーザーには無料オプションとしてライセンスが発行されるようです。

また、Logophileでこのマクロと同じような機能を使いたいという方は、「On the Backstage 翻訳者のための情報源」で秀丸からLogophile(のみ)を引くマクロが公開されています。
(「【PC】役に立つソフトウェア」→「2. 翻訳業務に役立つソフトウェア」→「◎Logophile」の「秀丸エディタとの連携マクロをこちらで公開しています」)
58, 59行目の、「Logophileの実行ファイルのある場所」を(必要に応じて)自分の環境に合わせて書き換えれば使えます。

2013年6月7日金曜日

秀丸マクロ:準備編

SimplyTerms(ST)には、便利な秀丸マクロが多数同梱されています。その中から特に便利なものを何回かに分けて紹介したいと思います・・・がその前に、今回は秀丸でマクロを使えるようにするための準備を説明したいと思います。

秀丸ですでにマクロを使ってる方は、今回は読み飛ばしてください。
秀丸を最近インストールしたばかりという方や、ちょっとだけ使って放置だったわー、マクロ使ったことないわー、という方は、まずはこの設定をしてください。

※今回の内容の大半は、STの[ヘルプ]→[同梱秀丸マクロのヘルプ]の「秀丸で使えるようにする」の項目に書いてあります。

Step 1 マクロファイル用のフォルダを指定する

まず、秀丸でマクロファイルを入れておくフォルダを指定します。ここで指定したフォルダが、秀丸のメニューで[マクロ]→[マクロ実行...]を選んだときに表示されます。

①マクロファイル用のフォルダを作る(または、マクロファイルが入ったフォルダを持ってくる)。

マクロファイル用のフォルダをどこに置くかですが、Buckeyeさんが書かれた秀丸マクロヘルプには

1. 秀丸をインストールしたフォルダ(ふつうはprogram files\hidemaru)の下に"macros"など、適当な名前のフォルダを作る。
2. まったく別の場所にマクロ用フォルダを作る。

と選択肢が書いてあり、Buckeyeさんは2だそうです(私は1の秀丸のフォルダに作ってます)。
②[その他]→[動作環境]→[環境]の[パス]欄の[マクロファイル用のフォルダ]の右にある[参照]をクリックする。

③①で作ったマクロファイル用のフォルダを指定する。
④[OK]をクリックする。
⑤①で作ったマクロファイル用のフォルダが空の場合、マクロファイルを入れる。

Step 2 マクロを登録する

マクロファイル用のフォルダを指定したので、秀丸のメニューの[マクロ]→[マクロ実行...]を選ぶと、ずらずらっとマクロが表示されます。表示されたものの中から使いたいマクロを選んで、[OK]をポチッとすると、マクロが実行されますが、頻繁に使うマクロはショートカットキーを割り当てたり、マウスの右クリックメニューから実行できるようにした方が便利です。そのためにはまず、マクロを登録しなければなりません。

①秀丸メニューで[マクロ]→[マクロ登録...]を選ぶ。
②対象の欄で「1~10」または「11~20」を選ぶ。
「1~10」を選んだ場合、秀丸メニューで[マクロ]を選んだときに、[マクロ実行...]の下側にずらずらっとマクロが並び、さらに、自動的に「Ctrl+数字」がショートカットキーとして自動で割り当てられます。頻繁に使うものは指が届きやすいキーに割り当てた方が便利だと思うので、まずは「11~20」に登録して、使いやすいショートカットキーを割り当てる方がおすすめです。「11~20」に登録した場合、「1~10」に登録したマクロのさらに下側に、[グループ名]と横向き三角が現れ、横向き三角をたどると、マクロを選んで実行できます。
③[対象]の欄で「11~20」を選んだ場合、[グループ名]を入力する。
④[タイトル]欄にマクロの名前を考えて書く(短くて分かりやすい名前がおすすめ)。
⑤[ファイル名]欄の右端の▼をクリックして、登録したいマクロを選ぶ。
⑥④と⑤を繰り返してマクロを登録したら、[OK]をクリックする。

無事マクロを登録できたので、メニューで[マクロ]→[(使いたいマクロ)]と選んでマクロが実行できるようになりました。

頻繁に使うマクロは、次のStep 3の設定をして、さらに簡単に使えるようにしましょう。

Step 3 短い手順で実行できるようにする

簡単に使う方法として、まずマクロにショートカットキーを割り当てて、それを「キーボードで入力する」「マウスの右クリックメニューに追加する」「マウス(多ボタンマウス)のボタンに割り当てて使う」、があります。

まずはすべての基本となる、マクロにショートカットキーを割り当てる方法を説明します。

①秀丸メニューで[その他]→[キー割り当て...]を選ぶ。
②左側の[キー]のところで、割り当てたいキーの組み合わせを選びます。
私の場合、右手はマウスとキーボードを行ったり来たりするので、よく使うショートカットは左手で操作できる範囲に設定し、「Altとアルファベット」または「Ctrlとアルファベット」の組み合わせを使っています。(ショートカットキーを押しやすくするために、KeySwapをいうフリーソフトを使って、スペースバーの両隣をAltキーに、CapslockキーをCtrlキーに変更しています。)
③右側の[コマンド]の下のプルダウンメニューから、[メニュー/マクロ]を選び、割り当てたいマクロを選びます。
④[OK]をクリックし、ウィンドウを閉じます。
⑤キーボードでいま割り当てた組み合わせのキーを入力すると、マクロが実行されます。

これで、マクロに割り当てたショートカットキーを「キーボードで入力」して、簡単に実行できるようになりました。

次に「マウスの右クリックメニューに追加する」方法です。
ここでは、秀丸で右クリックしたときに出るメニュー(コピーや切り抜き、貼り付けが出てくるやつ)にマクロを追加する方法を説明します。

①メニューから[その他]→[メニュー編集...]を選び、[ユーザーメニュー]タブをクリックする。
②[メニュー]の右隣のプルダウンメニューから、「メニュー8:右ボタン」または「選択中右ボタン」を選ぶ。
③[追加]ボタンをクリックし、出てきた[追加]ウィンドウの[コマンド]下のプルダウンメニューから、「メニュー/マクロ」を選ぶ。
④追加したいマクロを選択して[追加]ボタンをクリックする。
⑤そうすると[内容]の下の部分に追加されるので、[1つ上に移動][1つ下に移動]等を使って、使いやすい位置に移動させる。

最後に「マウス(多ボタンマウス)のボタンに割り当てて使う」方法。

シンプルなマウスには、右ボタン、左ボタン、スクロールホイールぐらいしかついていませんが、世の中にはたくさんボタンがついているマウス(多ボタンマウス)というものがあり、たいてい、ボタンに任意のキーの組み合わせ(つまり、マクロを登録したショートカットキーも可)を割り当てることができます。

いま私が使っているマウスは13個ボタンがある、LogicoolのG700です。(今は生産終了となり、後継機種のG700sが出ているようですが、機能ほとんど同じようです。)ちょっと高いので、初めて多ボタンマウスを試される方は、もう少し安くてボタンの少ないもので試されてもいいかも。私もG700の前はG400(8個ボタン。後継機種はG400s)を使っていて、その前はMicrosoftの4ボタンマウスでした。G700はゲーム用マウスらしく、私にはよく分からない機能(解像度が変えられるとか・・・)がついているし、ちょっと大きいので、もうちょっと小ぶりで、安い多ボタンマウスがあるといいのですが・・・。親指に一番近いところには、一番使用頻度の高い、ST同梱の「辞書引きをするマクロ(Dic_DDJamming.mac)」を割り当てています。
Logicool G700
 ともあれ、マウスでポチッとするだけでJammingが引けるようになると、辞書を引くのが億劫にならず、少ない労力でたくさん辞書が引け、良い翻訳につながると思います。

マウスのボタンにショートカットキーを割り当てる方法は、それぞれのマウスについてくる説明書や設定用のソフトをご覧ください。

次回からは、STに同梱されている便利なマクロを紹介していきたいと思います。

2013年5月9日木曜日

SimplyTerms:「ワードカウント」機能

前回はSimplyTerms(ST)の「整形・編集」機能について取り上げましたが、今回は「ワードカウント」機能について取り上げます。

Wordには文字カウント機能があるので簡単に文字数や単語数を調べることができますが、ExcelやPowerPointにはそのような機能はありません。しかし、原文をExcelやPowerPointで渡されて、どの程度の量なのか把握しなければならないことがあると思います。STでは、Wordはもちろんのこと、ExcelやPowerPointでも文字(単語)数をカウントすることができます
※ただし、画像で埋め込まれた文字はカウントできません。

「ワードカウント」機能を初めて使う前に、設定を確認しておきます。
STを起動し、[ツール]→[オプション...]を開き、[ワードカウント]タブをクリックします。


チェック項目は、初期設定の「すべてチェックなし」でWordの文字カウント結果とほぼ一致しますので、普段Wordの文字カウントで見積もり等をされている方は、そのままでいいと思います。

また、

200ワード/ページ
400文字/ページ

という部分は、自分が普段何ワード(何文字)あたり1ページと数えているかを入力してください。


では、実際に「ワードカウント」機能を使ってみましょう。
STを起動し、[その他]タブをクリックします。

[処理内容]の[ワードカウント(一覧)]または[ワードカウント(詳細)]を選択します。([ファイルリスト]と[ファイルマージ]は別の機能なので、今回は取り上げません。)

カウントしたいファイルを右下の[処理対象ファイル(txt, doc, xls, ppt)]にドラッグします。カウントできるファイルはテキストファイルとWordファイル(docとdocx)、Excelファイル(xlsとxlsx)、PowerPointファイル(pptとpptx)です。
ファイルは一つでも複数でも構いませんし、ファイル形式が混ざっていても構いません。

※Excel 2010では、現在のところ、テキストボックスの中身が抽出されない不具合がありますが、カウントもされないようですので、Excelファイルでテキストボックスがある場合は注意してください。

[実行]をクリックすると、カウント結果が別ウィンドウで表示されます。このカウント結果はテキストファイルとして保存できます。


では実際に、ある3つの英文ファイルをカウントした結果を見てみましょう。

[ワードカウント(詳細)]では、下のように、それぞれのファイルについて詳しく数字が示されます。(1行目はファイルパスとファイル名です。)

D:\翻訳\ブログ\1,2-Dichloroethane.docx
文字数(含むスペース)    :1359
半角英語の単語数      :204
全角文字+半角カナ     :0
トータル文字数(Word互換)  :204
トータル文字数(単純文字数) :1359
トータル文字数(半角2→全角1):679
トータル文字数(半2→全1、改行タブ含む):683


D:\翻訳\ブログ\Dichloromethane.docx
文字数(含むスペース)    :996
半角英語の単語数      :152
全角文字+半角カナ     :5
トータル文字数(Word互換)  :157
トータル文字数(単純文字数) :996
トータル文字数(半角2→全角1):500
トータル文字数(半2→全1、改行タブ含む):511


D:\翻訳\ブログ\Toluene.docx
文字数(含むスペース)    :2010
半角英語の単語数      :315
全角文字+半角カナ     :0
トータル文字数(Word互換)  :315
トータル文字数(単純文字数) :2010
トータル文字数(半角2→全角1):1005
トータル文字数(半2→全1、改行タブ含む):1022
トータル文字数(Word互換)」という行の数字が、Wordの文字カウントで示される値とほぼ一致するものです。

これを[ワードカウント(一覧)]でカウントすると、下のように表示されます。

ワードカウント一覧
  各ファイルを英語のファイルとしてカウントした結果
------------------------------------------------------------
1,2-Dichloroethane.docx         204 ワード        1.02 ページ
Dichloromethane.docx         152 ワード        0.76 ページ
Toluene.docx         315 ワード        1.58 ページ
全ファイルの合計:         671 ワード        3.36 ページ




文字数カウント一覧
  各ファイルを日本語のファイルとしてカウントした結果
------------------------------------------------------------
1,2-Dichloroethane.docx         204 文字        0.51 ページ
Dichloromethane.docx         157 文字        0.39 ページ
Toluene.docx         315 文字        0.79 ページ
全ファイルの合計:         676 文字        1.69 ページ


[ワードカウント(一覧)]の場合、そのファイルが英語なのか日本語なのかはSTには判別できないので、
「各ファイルを英語のファイルとしてカウントした結果」は「半角英語の単語数」を、
「各ファイルを日本語のファイルとしてカウントした結果」は「トータル文字数(Word互換)」(=「半角英語の単語数」+「半角英語の単語数」)
の数字を機械的に表示し、それを元にページ数を計算しています。実際に自分がドラッグしたファイルの中身が英語なのか日本語なのかはわかっていると思うので、該当する方を見てください(この例の場合、3つとも英文なので、上の「各ファイルを英語のファイルとしてカウントした結果」を見ます)。
また、ここの「ページ数」の計算に、[オプション...]で設定した1ページあたりのワード(文字)数が使われています。

エージェントやクライアントから原文のファイルが10個も20個も送られてきた場合、一つ一つ開いて文字をカウントするのは大変ですが、STのワードカウント機能を使えば、まとめてあっという間にカウントすることができます。

2013年4月22日月曜日

SimplyTerms:「整形・編集」機能

これまではSimplyTerms(ST)によるテキストの抽出と書き戻しを主に扱ってきましたが、他にもいろいろな機能が組み込まれています。今回はその中の「整形・編集」について取り上げます。

[整形・編集]タブでは、原稿の整形表記の統一などの編集を行います。
STを起動して、[整形・編集]タブをクリックすると、[処理内容]として8項目ありますが、右半分は自分で登録するものなので、今回は左半分のみ扱います。左半分の4項目それぞれにいくつも機能がありますが、その中からいくつか紹介します。
それぞれの機能を紹介する前に、基本的な使い方を説明します。

1.処理したいファイル(テキストファイル。拡張子が.txtのもの)を[処理対象ファイル(テキスト)]にドラッグします。

2.[処理内容]の[ハイライトリスト...]、[抽出リスト...]、[置換(汎用)...]、[置換(使用注意)...]のどれかを選択します。

3.右下部分で機能を選択します(反転表示させます)。

4.[実行]をクリックします。
※[置換(汎用)...]と[置換(使用注意)...]の中の機能は、実行するとファイルを上書きします。
では、それぞれの機能をいくつか紹介します。

○[置換(汎用)]の[整形-改行テキスト(英語)_reg.txt]、[整形-改行テキスト(日本語)_reg.txt]
・(テキスト抽出前の)原稿を整えます。

OCRで読み込んだ原稿やPDFからテキストを書き出した原稿では、文の途中に改行が入り、切れ切れになっているものがあります。それらの余分な改行を削除します。ただし、完璧ではないため、後で原稿と突き合わせながら調整が必要です。


○[置換(汎用)]の[文字-全角→半角(カナ、英数字、英数字記号)]、[文字-半角→全角(カナ、英数字、英数字記号)]
・翻訳作業前(または後)に一括で置換します。

原稿中のカタカナや英数字、記号を全角から半角、または逆に半角から全角に変換します。(変換して欲しくないものがある場合、正規表現ファイルを自分でカスタマイズすることができるので、この投稿の下の方でその方法を説明します。)
※英数字と記号を半角から全角に変換すると、段落タグまで全角になってしまいますが、その場合は、[置換(使用注意)...]の[SimplyTermsタグ全角→半角]で段落タグのみ半角に戻せます。

○[置換(汎用)]の[1桁数字の全角化]
・翻訳作業前(または後)に一括で置換します。

2桁以上の数字は半角のまま残し、1桁の数字のみ全角にします。
分野によっては、(見た目を良くするため?)1桁の数字のみ全角にするものがあるので、そのような場合に役立ちます。

○[置換(汎用)]の[書式-全半角間スペース挿入]、[書式-全半角間スペース削除]
・翻訳作業後に使います。

英日翻訳(または日本語の記事の執筆)で、固有名詞など英語で表記した部分とその前後の日本語との間に半角スペースを挿入します([書式-全半角間スペース挿入])。翻訳(執筆)段階で挿入しておいた半角スペースが不必要になった場合は、[書式-全半角間スペース削除]で削除できます。

○[ハイライトリスト]の[英文ファイルの固有名詞]
・翻訳作業前(または後)に固有名詞をチェックします。

文書(英語)の中で、固有名詞の可能性があるところ、つまり、文頭(およびダブルクォーテーションの直後)以外で大文字で始まる英単語、が別ウィンドウに赤字で表示されます。(ダブルクォーテーションマークで挟まれた、大文字で始まる固有名詞は赤字にならないので注意が必要です。)

○[ハイライトリスト]の[文書用-算用数字・漢数字]
・翻訳作業後に、数字の転記(入力)ミスがないか確認するときに役立ちます。

文書(英語・日本語両方)の中の算用数字(全角・半角)と漢数字がすべて、別ウィンドウに赤字で表示されます。

○[抽出リスト]の[英文ファイルの固有名詞]

・翻訳作業前(または後)に固有名詞をチェックします。

文書(英語)の中で、固有名詞の可能性があるところ、つまり、文頭(およびダブルクォーテーションの直後)以外で大文字で始まる英単語が別ウィンドウにリストアップされ、出現回数とともに、文字コード順にソートされて表示されます。([ハイライトリスト]の[英文ファイルの固有名詞]で赤字で表示されるものがリストアップされます。)

○[抽出リスト]の[文書用-カタカナ語]、[文書用-英単語]

・英日翻訳(または日本語の記事の執筆)作業後のチェックに使います。

文書(日本語)の中のカタカナ語または英単語が別ウィンドウにリストアップされ、出現回数とともに、文字コード順にソートされて表示されます。
ソートされるので、カタカナ語の表記の揺れや間違い、英単語のスペルミスが発見できます。
※[文書用-英単語]を使用すると、(括弧などの記号ではなく)アルファベットから始まるものは2回カウントされているようなので、エクスプローラーで[st]→[System]→[Functions]→[ListUp]から「文書用-英単語_reg.txt」を開き、

m/[A-Za-z][ -~]*/km
m/[ -~]*[A-Za-z]/km

赤字部分を削除するか、下のように行頭に「# 」をつけてコメントアウトするとうまくいくようです。

m/[A-Za-z][ -~]*/km
# m/[ -~]*[A-Za-z]/km



[整形・編集]タブの中のいくつかの機能について紹介しましたが、その他にもいろいろあるので、[st]→[System]→[Functions]→[Highlight][ListUp][ReplaceNorm][ReplaceRisky]の各フォルダを開いて、中にある正規表現ファイル(ファイル名の末尾が「_reg.txt」のもの)をテキストエディタで開いてみてください。最初の方に簡単な説明が書いてあるので、気になるものを自分で試してみるといいと思います。
また、正規表現が分かる人は、自分で機能を追加できます。詳しくはSTヘルプの[操作方法]→[機能タブ別説明]→[「整形・編集」タブ]をご覧ください。


***************************************
正規表現ファイルのカスタマイズ例

私は日英翻訳をするとき、まず最初に英数字と記号を全角から半角に変換するのですが、元からある[文字-全角→半角(英数字記号)]では変換して欲しくないものまで変換されていたので、正規表現ファイルを一部書き換え、変換されないようにしました。
このカスタマイズは簡単なので、ここで紹介します。

stのフォルダを下のようにたどります。
[st]→[System]→[Functions]→[ReplaceNorm]
この[ReplaceNorm]の中の「文字-全角→半角(英数字記号)_reg.txt」をテキストエディタで開くと下のようになっています。

------
# 英数字&記号:全角→半角

# 数字
tr/0123456789/0123456789/kgm

# アルファベット
tr/ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/kgm

# 記号類
# 記述記号
tr/,.:;?!^ ̄_|~/,.:;?!^~_|-/kgm
tr#/#/#kgm

# 括弧記号(ギュメ(二重ギュメは除く)は半角不等号で代用)
tr/(){}[]〈〉/(){}[]<>/kgm

# その他の記号
tr/+-=<>¥$%#&*@/+\-=<>\\$%#&*@/kgm

# スペース
tr/ / /kgm

# 句読点・カギ括弧など……英日で関係のあるもののみ
tr/。、「」-/.,""-/kgm
------
行頭に#がついているところはコメント行です。コメント行の下が正規表現で、

tr/(置換前)/(置換後)/kgm

となっています。(置換前)の部分と(置換後)の部分は(基本的に)前から順に一対一で置換されるので、置換して欲しくないものを(置換前)(置換後)両方で削除すれば、置換されなくなります。
※カスタマイズする前に、別名で保存しておくことをおすすめします。保存する場合、そのままの場所([ReplaceNorm])に保存すると、[処理内容]の[置換(汎用)...]に表示され、[st]→[User]→[Functions]→[Replace_A]に保存すると、[処理内容]の[ユーザー置換-A]に表示されます。
例えば、「、」と「。」はそれぞれ「,」と「.」に置換されますが、置換して欲しくない場合、「# 句読点・カギ括弧など……英日で関係のあるもののみ」の下の行の

tr/。、「」-/.,""-/kgm

から、それらを削除して、

tr/「」-/""-/kgm

とすれば、置換されなくなります。


SimplyTerms:Excel、PowerPointの場合

SimplyTerms(ST)はWordファイルだけでなく、ExcelファイルPowerPointファイルも扱えます。テキストを抽出する操作などは、Wordファイルの場合と全く一緒です。復習をかねて、英語の原稿ファイル「原稿.xlsx」を(英日)翻訳する場合の流れをざっと書くと、下のようになります。

1.「原稿.xlsx」→[ファイル種類の変更][英語]→「原稿_eng.xlsx」
2.「原稿_eng.xlsx」→[Officeテキスト抽出]→「原稿_eng.txt」
3.「原稿_eng.txt」→[用語集の適用(一括置換)]→「原稿_jpn.txt」
4.「原稿_jpn.txt」を秀丸などで翻訳。
5.「原稿_eng.xlsx」→[Officeテキスト書き戻し]→「原稿_jpn.xlsx」

※Excelファイルは、拡張子が「xls」でも操作は同じです。またPowerPointファイルの場合も、上の「xlsx」の部分が「pptx(またはppt)」となるだけで、操作は同じです。

WordファイルとExcelファイル、PowerPointファイルとの違いは、テキストを抽出して作られるテキストファイル内の「段落タグ」です。

○Wordファイルの場合

----------
[[BD-1]]
本文1段落目。本文はBDで始まる段落タグです。脚注を入れると[[FN-1]]のような記号が挿入され、ファイルの最後の方に脚注の内容が抜き出されます。この、挿入された記号は、必ず訳文でも入れておいてください(入れ忘れると、下の方の脚注の内容が書き戻されません)。
[[BD-2]]
本文2段落目。Wordで文末脚注を挿入すると[[EN-1]]のような記号が挿入され、最後の方に文末脚注の内容が抜き出されます。この、挿入された記号は、必ず訳文でも入れておいてください(入れ忘れると、下の方の文末脚注の内容が書き戻されません)。
[[BD-3]]
あいうえおあいうえおあいうえお
[[TB-1]]
テキストボックスがあると、このように、TBで始まる段落タグがつけられて、本文のあとにまとめて抜き出されます。
[[TB-2]]
テキストボックス。テキストボックス。(Wordファイルの見た目の順番とは必ずしも一致しないそうなので、印刷した原稿などと良く見比べながら翻訳を進めてください。)
[[FN-1]]
脚注(footnote)はFNで始まる段落タグがつけられます。
[[EN-1]]
文末脚注(endnote)はENで始まる段落タグがつけられます。
----------

○Excelファイルの場合

----------
[[S1_CL-A1]]
1枚目のシートの段落タグはS1で始まり、そのあとにセル(CL)の位置が「列(アルファベット)」「行(数字)」という形で続きます。
[[S1_CL-A2]]
あいうえおあいうえおあいうえお
[[S1_CL-C2]]
テキストが抽出される順番は、各シートの中で「行(数字)の昇順」→「列(アルファベット)の昇順」です。
[[S1_CL-A3]]
空白のセルは無視され、セル内に何か文字がある場合にのみ、その文字が抽出されます。
[[S1_CL-E5]]
かきくけこかきくけこかきくけこ
[[S2_CL-G5]]
2枚目のシートの段落タグはS2で始まります。
[[S2_CL-I5]]
さしすせそさしすせそさしすせそ
[[S2_CL-G7]]
シートの名前に関係無く、段落タグはS1、S2、S3・・・となります。しかし・・・
[[S4_CL-C9]]
何も書き込まれてないシートは無視されます。3枚目のシートのセルには何も書き込まれてなく、次の4枚目にはセル内に何か文字がある場合、S3で始まる段落タグはなく、S4で始まる段落タグで4枚目の内容が抽出されます。
[[S4_CL-D11]]
たちつてとたちつてとたちつてと
----------

※現在、Excel 2010ではテキストボックスの中身が抽出されないようです(Excel 2003では大丈夫なようです)。ST作成者のBuckeyeさんもこの問題を把握しておられるので、対応を待っているところです。

○PowerPointファイルの場合

----------
[[S1_BD-1]]
1枚目のスライドの段落タグはS1で始まり、BDと続くのはテキストボックスです。
[[S1_BD-2]]
あいうえおあいうえおあいうえお
[[S1_NT-1]]
スライド番号の後にNTと続くものは、ノートの中身です。ノートには最初からスライド番号が入ってる場合があります。
[[S1_NT-2]]
1
[[S2_BD-1]]
2枚目のスライドの段落タグはS2で始まります。
[[S2_BD-2]]
テキストボックスは上にあるものから順に抽出されて並びます。
[[S2_BD-3]]
矢印や吹き出しなどの中のテキストも、普通のテキストボックスと同様に扱われるので、段落タグではBDがつきます。
[[S2_BD-4]]
かきくけこかきくけこかきくけこ
[[S2_BD-5]]
文章に<b>太字</b>や<i>斜体</i>などの書式が設定されていると、書式タグ(<b>や</b>、<i>、</i>など)がくっついてくることがあります。書式タグについては、2013年4月3日の投稿「SimplyTerms:書式が設定された文章を扱う」をご覧ください。
[[S2_NT-1]]
2
----------

このように、元のファイルに応じていろいろな「段落タグ」がありますが、基本的には、抽出されたテキスト部分のみを(秀丸などで)書き換えていくので、元のファイルがWordであろうとExcelであろうとPowerPointであろうと、いつも同じように翻訳作業を行うことができます。

また、Excelの表の数値部分や、PowerPointのノートのスライド番号など、まったくいじる必要のない部分は、翻訳する前に「段落タグ」とその内容をまるごと削除することで、間違えて書き換えてしまうことを防げます(2013年4月11日投稿「SimplyTerms:「段落タグ」を削除するとどうなる?」を参照)。

2013年4月12日金曜日

SimplyTerms:「段落タグ」は残して、その段落の内容を削除するとどうなる?

前回は、「段落タグ」とそれに続く段落の内容を削除するとどうなるか、について書きました(答えは→原文ママ残る)。

では、「段落タグ」は残して、その段落の内容を削除するとどうなるか。

前回のファイルを使い回して、どうなるのか試してみます。

これは、書き戻したときに画像が残されるようにした(つまり、原文の4段落目に相当する「段落タグ」とそれに続く内容を削除した)ものです。
------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

これの、原文の2段落目に相当する段落を、「段落タグ」は残し、段落の内容を消しみます。
------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)



------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

[[BD-2]]の下にはすぐ[[BD-3]]があります。つまり、段落の内容が何もありません。これを書き戻すと、

------
Polyethylene terephthalate is a polymer resin of the polyester family and ...
It is synthesized from ethylene glycol and terephthalic acid ...
Because it has aromatic rings and ...
------(PET_wiki_eng.doc)
何もありません。もちろん、原文も残っていません。つまり、「何もない」が書き戻されてしまったのです。

この、「段落タグ」のみ残し、段落の内容を消す、という操作を使う場面はそう多くないと思います(※)。それよりも、原文のまま残したくて「段落タグ」と内容を消すつもりが、
 「段落タグ」を消し忘れた!原文が消えちゃった・・・
というトラブルが起こる可能性の方が高いので、「段落タグ」まわりをいじるときは細心のご注意を

(前回の例で言うと、[[BD-4]]とそれに続く「/」を消すことで、原稿の画像を残したつもりだったのに、「/」は消したけど[[BD-4]]を残しちゃった→画像が消えちゃった・・・という事態に陥ります。)


※私が遭遇する「段落タグ」のみ残し、段落の内容を消す場合
たまに、文の途中で改行され段落が変に分かれてしまっている原稿があります(印刷したときの見栄え優先のレイアウトの都合だったり、単なるミスだったり)。

例えば、こういうもの。
------ 
ポリエチレンテレフタラート(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをしてポリエチレンテレフタレートと呼ば
れることも多い。
その頭文字からPETと略称される。ペットボトルの名称はこれに由来する。
------

これをテキスト抽出すると、下のようになります。

------
[[BD-1]]
<b>ポリエチレンテレフタラート</b>(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをして<b>ポリエチレンテレフタレート</b>と呼ば
[[BD-2]]
れることも多い。
[[BD-3]]
その頭文字から<b>PET</b>と略称される。ペットボトルの名称はこれに由来する。
------

こういう場合に、

------
[[BD-1]]
(<b>ポリエチレンテレフタラート</b>(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをして<b>ポリエチレンテレフタレート</b>と呼ばれることも多い。)の訳文
[[BD-2]]
[[BD-3]]
(その頭文字から<b>PET</b>と略称される。ペットボトルの名称はこれに由来する。)の訳文
------

とすることで、一続きの訳文が、あるべきところにおさまります。

2013年4月11日木曜日

SimplyTerms:「段落タグ」を削除するとどうなる?

これまで、SimplyTerms(ST)の「段落タグ」は基本的にいじらないと書いてきましたが、今回は、「段落タグ」を削除するとどうなるか、について書きたいと思います。

※今回の内容は、STヘルプの[MS Officeのテキスト抽出・書き戻し]→[抽出テキストの翻訳(上級編)]の「◎原文ママ残したいセクション」に書いてあります。

例えば、下のような原稿(Wordファイル)をもらったとしましょう。(ウィキペディアの「ポリエチレンテレフタラート」の項です。http://ja.wikipedia.org/wiki/%E3%83%9D%E3%83%AA%E3%82%A8%E3%83%81%E3%83%AC%E3%83%B3%E3%83%86%E3%83%AC%E3%83%95%E3%82%BF%E3%83%A9%E3%83%BC%E3%83%88
------
ポリエチレンテレフタラート(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをしてポリエチレンテレフタレートと呼ばれることも多い。
その頭文字からPETと略称される。ペットボトルの名称はこれに由来する。
下式のようにエチレングリコール(HO-CH2-CH2-OH)とテレフタル酸の脱水縮合により作られ、エステル結合が連なっているポリエステルとなる。このエステル結合の生成は、テレフタル酸ジメチルとのエステル交換反応でも可能である。
芳香環を有するとともに分子鎖が直線になりやすいことから、分子鎖が流動性をもつ温度では芳香環や分子鎖の配向が起こりやすく、結晶部分を作りやすい。
------(PET_wiki_jpn.doc)

4段落目には反応式の画像が入ってます。これをSTでテキストを抽出すると、下のようになりました。

-------
[[BD-1]]
<b>ポリエチレンテレフタラート</b>(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをして<b>ポリエチレンテレフタレート</b>と呼ばれることも多い。
[[BD-2]]
その頭文字から<b>PET</b>と略称される。ペットボトルの名称はこれに由来する。
[[BD-3]]
下式のようにエチレングリコール(HO-CH<sub>2</sub>-CH<sub>2</sub>-OH)とテレフタル酸の脱水縮合により作られ、エステル結合が連なっているポリエステルとなる。このエステル結合の生成は、テレフタル酸ジメチルとのエステル交換反応でも可能である。
[[BD-4]]
/
[[BD-5]]
芳香環を有するとともに分子鎖が直線になりやすいことから、分子鎖が流動性をもつ温度では芳香環や分子鎖の配向が起こりやすく、結晶部分を作りやすい。
------(PET_wiki_jpn.txt)

(前回扱った太字や下付き文字は、ちゃんと「書式タグ」で挟まれています。)
画像だった4段落目が「/」となっています(WordやOSのバージョンによっては、違う文字・記号かもしれません)。

多くの場合、文字部分のみを上書きして訳す(つまり画像はいじらずにそのままにする)よう指示されると思うので、上のテキスト抽出したファイルの[[BD-4]]の段落以外(つまり、[[BD-1]]、[[BD-2]]、[[BD-3]]、[[BD-5]])を訳します。

------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated to <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-4]]
/
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

訳しました。これを書き戻してみましょう。すると・・・

------
Polyethylene terephthalate is a polymer resin of the polyester family and ...
It is commonly abbreviated to PET ...
It is synthesized from ethylene glycol and terephthalic acid ...
/
Because it has aromatic rings and ...
------(PET_wiki_eng.doc)

と、元々あった画像がなくなり、「/」が挿入されてしまいました。
これでは困ります。

では、どうするかというと、「PET_wiki_eng.txt」の「[[BD-4]]」タグとそれに続く段落の内容を削除してしまうのです。つまり、下の赤字部分を丸ごと削除し、

------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-4]]
/

[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)



------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

このようにして、書き戻すのです。

そうすると、
------
Polyethylene terephthalate is a polymer resin of the polyester family and ...
It is commonly abbreviated PET ...
It is synthesized from ethylene glycol and terephthalic acid ...
Because it has aromatic rings and ...
------(PET_wiki_eng.doc)

画像はそのまま残りました。

これは何も画像や図に限ったことではなく、文章でも同じです。

例えば、
・文章の一部の段落が既に翻訳されていて、残りの部分を翻訳してください、と頼まれた。
・WordやExcel、PowerPointの原稿に表が含まれていて、表の中の数字はいじる必要がない(そのまま残したい)。
といった場合に使えます。

まとめると、
原文ママ残したい部分は、「段落タグ」とその段落の内容を削除する
です。

※「段落タグ」は残したけど、その段落の内容を削除した場合にはどうなるか、次回取り上げます。

2013年4月3日水曜日

SimplyTerms:書式が設定された文章を扱う

秀丸等のテキストエディタで翻訳作業を行う場合、太字斜体字、上付き文字、下付き文字などが扱えないという短所があります。(例えば、Wordファイルで太字斜体字、上付き文字、下付き文字などがあり、その文章を秀丸にコピー&ペーストした場合、秀丸ではこれらの文字修飾(書式)は保持されず、普通の文字になります。)
しかし、翻訳をしていると、例えばCO2(二酸化炭素。2が下付き文字)やEscherichia coli(大腸菌)、Nipponia nippon(トキ)といった、化学式や生物の学名などで、下付き文字や斜体字が出てきますし、また、語句を強調するために、太字下線が使われることもよくあります。

書式は保持したい、でも動作が軽快な秀丸で作業をしたい。そういうときには、SimplyTerms(ST)を使えば、これらの書式の情報を保持したままテキストを抽出し、秀丸で翻訳後、Officeファイルに書き戻すと同時に自動で書式を設定することができます。

具体的な手順は以下の通りです。

まずは、準備としてSTの設定をします。
STを起動し、[ツール]→[オプション...]を開き、[テキスト抽出]タブの[MsOffice製品からのテキスト抽出項目]の[書式タグ]にチェックを付けます。(STの設定終わり)

この設定後、Officeファイルからテキストを抽出すると、太字斜体字、上付き文字、下付き文字など書式設定された文字がST独自の「書式タグ」で挟まれて抽出されます。
上付き文字:<sup>対象文字</sup>
下付き文字:<sub>対象文字</sub>
太字    :<b>対象文字</b>
斜体字   :<i>対象文字</i>
下線     :<u>対象文字</u>
※「書式タグ」はすべて半角の英字。
上の方で挙げたものは、CO<sub>2</sub>、<i>Escherichia coli</i>、<i>Nipponia nippon</i>というふうに抽出されます。他にも、6.02×10<sup>23</sup>(アボガドロ数。上付き文字の例)、Li<sub>1+x+y</sub>Al<sub>x</sub>Ti<sub>2-x</sub>Si<sub>y</sub>P<sub>3-y</sub>O<sub>12</sub>(x=0.3、y=0.2)(ガラスセラミック電解質。下付き文字が多数ある例)というように、「書式タグ」がついてなかったら数字や文字が連続してしまいよくわからなくなるものも、(多少見づらいかもしれませんが)秀丸で扱えるようになります。

翻訳するときには、このような「書式タグ」で挟まれて抽出された語句を「書式タグ」で挟んだまま翻訳(または、化学式や学名などはそのままコピー&ペースト)します。
そして、STで書き戻すときに、[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択し、[書式タグ処理]を[あり]にして、書き戻します。

こうすることで、書式は保持しつつ動きが軽いテキストエディタで翻訳し、最終的にWordファイルを作ることができます。

※この「書式タグ」の処理は、[Officeテキスト書き戻し]と同時ではなく、別に行うこともできます([抽出~書戻]タブの[処理内容]の五番目、[Office書式タグ処理])。なので、翻訳に限らず、自分で何か文章を書くときにも、
秀丸で「書式タグ」をつけて文章を書く→Wordにコピー&ペースト→STで[Office書式タグ処理]→書式が設定されたWordファイルのできあがり!
というふうに利用できます。

ここで出てきた「書式タグ」は、毎回自分でポチポチ入力してもいいのですが、面倒ですし、入力ミスをする可能性があります。抽出した文からコピー&ペーストすれば入力間違いはなくなりますが、もっと簡単に「書式タグ」をつける方法があります。

同梱の秀丸マクロ「Ins_FormatTags」を使うのです。

例えば、「CO2」の「2」の部分を下付きの記号で挟みたい場合、「2」の部分を選択して「Ins_FormatTags」マクロを実行して[下付]を選択すると、「2」の前後に下付き文字用の「書式タグ」が挿入され、「CO<sub>2</sub>」となります。
私はこのマクロをよく使うので、キーボードのショートカットを割り当てて、簡単な操作で「書式タグ」を挿入できるようにしています。

この秀丸マクロについては後日また詳しく取り上げます。

2013年3月29日金曜日

SimplyTerms:用語集を使う場合の注意点

前回、日英翻訳で用語集による一括置換を行ったところ、「非鉄金属」が「非 iron  gold 属」となるなど、不適切な置換が起きてしまいました。今回は、用語集による(一括)置換を行う場合の注意点をまとめたいと思います。

まずは、SimplyTerms(ST)ヘルプの「用語集」には、以下のような注意点が書いてあります。

(引用ここから)
用語集による一括置換には、以下のようなメリットがあります。

・訳語がクライアントごとに異なっていても覚えておく必要がない
・訳語のチェック(用語集の検索)が不要
・登録訳語は入力が不要になる
・英日混じりだが、基本的に原語の論理で読み下せる

しかし、限界と副作用もあります。一番大きいのは、以下の点です。

・文脈によって大きく変化する用語を用語集に登録しておくと、誤訳につながる

このような副作用を避けるため、基本的に、以下のような用語だけを登録することをお勧めします。

・専門用語
・固有名詞
・クライアント固有の用語

これ以外の用語は慎重に取り扱ってください。また、訳していてどうも文脈に合わないと思ったら、必ず、原文に戻って考えてください。
(引用ここまで)

メリットの一つ目、「訳語がクライアントごとに異なっていても覚えておく必要がない」。

これは、例えば、「interface」の訳語として、クライアントAからは「インターフェイス」、別のクライアントBからは「インターフェース」を指定された場合、クライアントAの案件には「interface(tab)インターフェイス」と登録した用語集を使い、クライアントBの案件には「interface(tab)インターフェース」と登録した用語集を使うことで、いちいち「あれ?インターフェイスだったけ?それともインターフェース?」と頭を悩ませる必要がなくなります。

メリットの三つ目、「登録訳語は入力が不要になる」。

これは、訳文を作るときに、置換された後の単語をコピー&ペーストすることで、いちいち入力する手間が省け、また入力ミスも減らせます。
例えば dichlorodiphenyltrichloroethane (ジクロロジフェニルトリクロロエタン:殺虫剤のDDTのことです)と言う単語がでてきたとしましょう。英日でも日英でも、これだけ長いと入力ミスをする可能性があります。こういう長いもの、また綴りが複雑なものは、毎回ポチポチとキーボードから入力するのではなく、置換しておいて、それをコピー&ペーストした方が圧倒的に楽です。

※このコピー&ペーストの作業は、単語をマウスで反転させた後、メニューからコピー(またはペースト)を選ぶ、キーボードのショートカット(Ctrl+C, Ctrl+V)を使う、マウスの右クリックからコピー(またはペースト)を選ぶ、といろいろ方法がありますが、STに同梱されている秀丸マクロ(Copy_Lst)を使えば、コピー&ペーストが一回でできます(後日紹介します)。

デメリットの「文脈によって大きく変化する用語を用語集に登録しておくと、誤訳につながる」。

例えば「agent」という言葉の場合、英和辞書で最初に出てくるのは、代理人、代理店といったものですが、私が専門としている化学では「a chemical agent(化学薬品)」「a reducing agent(還元剤)」というように、薬品、試薬、~剤というように使われます。このような、文脈次第で大きく意味(訳語)が変わる言葉を用語集に登録し、翻訳前に一括で置換すると、訳していくときに「ん?『chemical 代理人』?ああ、化学薬品扱う業者さんね(本当は化学薬品なのに・・・)」という事態になりえます。

なので、やはり、用語集に登録して、翻訳前に一括で置換するのは、

・専門用語
・固有名詞
・クライアント固有の用語


程度に抑えておく方がいいのです(基本的に、活用する動詞などは置換しない方がいい)。
そして、翻訳を進めていって、その文章に何度も出てくる言葉があれば、そのときにその文章上で(全)置換すれば事足ります。

※この全置換を簡単に行う秀丸マクロもSTには同梱されていますので、後日紹介します。全置換しながら、「英語(tab)日本語」という、STで使える形式の用語集を作っていくという優れものです。

ここで、STの用語集のフォーマットの基本を説明しましょう。

英語(tab)日本語

これだけです。もし、後で用語集を見た人(自分や他の人)に何かメモを残したいときは、日本語のあとにタブを入れて、メモを書くことができます(置換の際は無視されます)。つまり、

英語(tab)日本語(tab)メモ

とすることができます。

このような単純な形なので、例えばこれまでに自分で蓄積してきたExcelの用語集や、インターネットで見つけた用語集なども、割と簡単に変換して使うことができます。

※英語側の末尾は基本的に単数形にしておきましょう。単数形にしておいても、英日翻訳で原文側が複数形のときには、最後に「@@pl」が付加され、複数形であったことがわかるかたちで置換されます。(不規則変化する用語は対応していないので、複数形も登録する必要があります。)

何度か用語集を使い、慣れてきたら、STヘルプの「用語集」の項目に目を通すことをおすすめします。英語側に二つ以上の単語からなる用語を入れた場合、どのように置換されるか、など書いてあるので、「あれ?用語集にあるはずなのに置換されてない・・・」などというときに読むと、原因が分かるかもしれません。


用語集を適用する際には、他に、「同じ綴りで意味が異なる単語」に注意する必要があります。

例えば、英日翻訳をするときに、1月(January)から12月(December)まで月の名前を登録した用語集を適用したとしましょう。そうすると、原文に助動詞のmayが含まれていた場合、その部分が「5月」と置換されてしまうのです。

なので、用語集を適用するとき、特に、自分で作ったのではない用語集を使う場合は、おかしな置換につながりそうなものはないか、事前に用語集の中に目を通してください。

「On the Backstage 翻訳者のための情報源」では、暦や地名、元素、サッカー用語などがSTで使える形で配布されています(ここ↓の【アーカイブ(用語集)】です)。
http://home.att.ne.jp/blue/onback/index.html

ただし、実際に使用する前に、必ず自分で、内容に目を通してください。

私は化学を専門としているので、元素の用語集を使う際の注意点をいくつか(自分の失敗例です^^;)。

・英日の場合
silicon(ケイ素):siliconだとケイ素(Si)ですが、siliconeだとシリコーン樹脂(-SiO2-)になります。SimplyTermsの一括置換では、複数形も自動的に置換してくれるのですが、「silicones」を「ケイ素@@pl」と置換してしまうので要注意です。

lead(鉛):動詞のleadも鉛と置換されてしまうので、例えば「All roads lead to Rome.」が「All roads 鉛 to Rome.」となります。

・日英の場合、
金、銀、銅、鉄、鉛など日本語が一文字のもの:「SimplyTerms:日英翻訳の場合」でもあったように、文章によっては思わぬ置換が起こるので要注意です。

2013年3月26日火曜日

SimplyTerms:日英翻訳の場合

「SimplyTermsを使った翻訳(その1~その5)」では英日翻訳を例に取り上げたので、今回は日英翻訳を試してみます。

基本的な操作は同じですので、復習を兼ねて同じようにやってみましょう。

例として下の点線と点線の間の文章をコピー&ペーストして、新たなWordファイルを作ってください。今回の文章はWikipediaの「非鉄金属」http://ja.wikipedia.org/wiki/%E9%9D%9E%E9%89%84%E9%87%91%E5%B1%9E です(一部改変)。

------
非鉄金属
非鉄金属(ひてつきんぞく、non-ferrous metal)とは、鉄および鉄を主成分とした合金、つまり鋼(ferrous metal)以外の金属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非鉄金属)に区分されている。

分類される理由
日本に限らず世界的に見ても鉄以外の金属の生産総量が鉄鋼の生産量に比べ圧倒的に少ないために、便宜的に「非鉄金属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、鉄を主体とした合金の種類よりもそれ以外の金属元素を主体とした合金の種類の方が圧倒的に多い。

主な非鉄金属
産業的によく使用される非鉄金属を以下に示す。
軽金属・・・アルミニウム、マグネシウム、ナトリウム、リチウム、チタン。
ベースメタル・・・銅、スズ、亜鉛、鉛。
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
レアアース・・・セリウム、ネオジム。
貴金属・・・金、銀、プラチナ。
------

ファイル名は「非鉄金属.docx」とし、適当なフォルダ(例えば「ST日英テスト」)に保存してください。

SimplyTerms(ST)を起動し、「ST日英テスト」を開くと、今作った「非鉄金属.docx」があるはずです。

右側のタブで[抽出~書戻]をクリックし、[処理内容]の一番上の[ファイル種類の変更]を選択し、すぐ右の[ファイルの種類]で、今回は[日本語]を選択します。

※英日翻訳(原稿が英語)の場合は[英語]を選択しましたので、日英翻訳、つまり、原稿が日本語の場合は[日本語]を選択します。

左下部分から原文ファイル「非鉄金属.docx」をドラッグし、[実行]ボタンをポチッ。

ファイル名が「非鉄金属.docx」から「非鉄金属_jpn.docx」に変わったはずです(ファイル名の前には日の丸マーク)。


次に、右上の[抽出~書戻]タブの二番目、[Officeテキスト抽出]を選択し、右下には先ほど名前を変更した「非鉄金属_jpn.docx」がある(残っている)のを確認して、[実行]ボタンをポチッ。


「非鉄金属_jpn.txt」ができました。(ST上でそのままダブルクリックしてもファイルが開くので、中身を確認してみましょう。各段落毎に「段落タグ」が挿入されているはずです。確認したら、ファイルは閉じてください。)

では、用語集を適用します。用語集として、前回使った「化学_trm.txt」を使います。

右上の[抽出~書戻]タブの[処理内容]の三番目、[用語集の適用(一括置換)]を選択します。このとき、右下部分の[処理対象テキストファイル(.txt)]に「非鉄金属_jpn.docx」と「非鉄金属_jpn.txt」が残っていたら、必要のない「非鉄金属_jpn.docx」をクリックして反転させた後、すぐ右上の[Clear]ボタンを押し、「非鉄金属_jpn.txt」のみを残します([Clear]を押すと、この[処理対象テキストファイル(.txt)]内から消えるだけで、ファイル自体は削除されないので安心してください)。

 (一度STを終了するなどした場合は、左下から「非鉄金属_jpn.txt」をドラッグしてください。)

右下部分下側の[適用する用語集(上:高優先順位)]には、前回使った「化学_trm.txt」を持ってきたいので、左上部分で前回の「STテスト」フォルダを探して開き、左下に表示された「化学_trm.txt」をドラッグしてきてください。


※用語集と、用語集を適用するファイルは別のフォルダに入っていてもOKです。

[翻訳方向]という部分は、今回も[自動判別]です。原文のサブ拡張子が「_jpn」、つまり日本語ですので、原文の中に用語集の右側の欄の日本語と一致するものがあれば、それに対応する英語で置換してくれます。

さあ、用語集を適用します。[実行]ボタンをポチッ。

「非鉄金属_eng.txt」はできたでしょうか。秀丸やメモ帳で開いてみましょう。

------
[[BD-1]]
非 iron  gold 属
[[BD-2]]
非 iron  gold 属(ひてつきんぞく、non-ferrous metal)とは、 iron および iron を主成分とした合 gold 、つまり鋼(ferrous metal)以外の gold 属のすべてを指す。日本工業規格 (JIS) では、部門記号 H(非 iron  gold 属)に区分されている。
[[BD-3]]
分類される理由
[[BD-4]]
日本に限らず世界的に見ても iron 以外の gold 属の生産総量が iron 鋼の生産量に比べ圧倒的に少ないために、便宜的に「非 iron  gold 属」という名称を与えて1つのグループにまとめたものである。従って、工業的/経済的理由での分類に過ぎず、それ以上の特別な意味はない。物理や化学といった科学的な特性での分類ではないので、科学分野では余り用いられない用語である。生産量とは逆に種類で見れば、 iron を主体とした合 gold の種類よりもそれ以外の gold 属元素を主体とした合 gold の種類の方が圧倒的に多い。
[[BD-5]]
主な非 iron  gold 属
[[BD-6]]
産業的によく使用される非 iron  gold 属を以下に示す。
[[BD-7]]
軽 gold 属・・・ aluminium 、マグネシウム、ナトリウム、リチウム、チタン。
[[BD-8]]
ベースメタル・・・ copper 、スズ、 zinc 、鉛。
[[BD-9]]
レアメタル・・・ニッケル、クロム、マンガン、モリブデン、タングステン、ビスマス、カドミウム、コバルト。
[[BD-10]]
レアアース・・・セリウム、ネオジム。
[[BD-11]]
貴 gold 属・・・ gold 、 silver 、プラチナ。
------

あらららら。大変なことになりました。原文とよーく見比べてみましょう。

「アルミニウム」、「銅」、「亜鉛」、「銀」はうまく置換されました。しかし、「非鉄金属」は「非 iron  gold 属」となってしまいました。

そう、用語集には「鉄」=「iron」、「金」=「gold」と登録されていたため、「非鉄金属」の中の「鉄」と「金」のみをそれぞれ登録されていた英語に置換したのです。

英日翻訳の場合、英単語と英単語の切れ目にはスペースがあるため、このような、単語をぶった切った置換は起こりません。
しかし、日英翻訳の場合は言葉がつながっているため、このような、意図しない(自分の意図とは異なる)置換が起こりうるのです。

用語集の使い方を誤ると、このような思わぬ事が起こるので要注意です。

(次回、用語集に関する注意点をまとめます。)

では、この文章をなんとか翻訳したとして(翻訳作業をするファイルは「非鉄金属_eng.txt」です。英語にしていくので、サブ拡張子は「_eng」です)、STで書き戻して、Wordファイルを作ります。

STを起動し、右上の[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択し、右下の[テキスト抽出したファイル(MS Word, Excel, Ppt)]部分に、「非鉄金属_jpn.docx」(原稿のファイル。テキストの抽出元ファイル)をドラッグします。

翻訳作業をしたファイル(「非鉄金属_eng.txt」)とテキストの抽出元ファイル(「非鉄金属_jpn.docx」)は、必ず同じフォルダの同じ階層に置いておいてください。別のフォルダ(階層)に存在していた場合、書き戻されません。

[抽出~書戻]タブの[書式タグ処理]は、今回も書式設定(太字や斜体など)はないので、[なし]にしておきます。[実行]ボタンをポチッ。

翻訳後のWordファイル「非鉄金属_eng.docx」ができたはずです。

失敗した場合は、
・一連の作業に関わったファイル名を変更してないか、
・翻訳作業をしたファイルの「段落タグ」をいじってないか、
・翻訳作業をしたファイルの冒頭([[BD-1]])を変更してないか、
・[テキスト抽出したファイル(MS Word, Excel, Ppt)]にドラッグするファイルを間違えてないか、
確認してください。

2013年3月22日金曜日

SimplyTermsを使った翻訳(その5:テキストの書き戻し)

さて、「1,2-Dichloroethane_jpn.txt」の翻訳は終わったでしょうか。

ここ↓にあるのが翻訳後のファイルの中身としましょう。ファイル名は、「1,2-Dichloroethane_jpn.txt」のままにしておいてください。
------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
二塩化エチレン(ethylene dichloride: EDC)という昔の名前で一般に知られている1,2-ジクロロエタン(DCA)は塩素化炭化水素の一種で、ポリ塩化ビニル(polyvinyl chloride: PVC)の原料である塩化ビニルモノマー(vinyl chloride monomer: VCM)(別名クロロエテン)の生産に主に使われます。ほにゃららほにゃらら。
[[BD-3]]
安全性
[[BD-4]]
1,2-ジクロロエタンは有毒で(蒸気圧が高いので、特に吸入しないよう注意)非常に引火しやすい、発がん性の物質です。ほにゃららほにゃららほにゃららほにゃらら。
------

これを、STで書き戻して、Wordファイルを作ります。

まず、STを起動し、「STテスト」フォルダを開きます。このフォルダの中には
「1,2-Dichloroethane_eng.docx」(原稿のファイル。テキストの抽出元ファイル)
「1,2-Dichloroethane_eng.txt」(原稿↑からテキストを抽出したテキストファイル)
「1,2-Dichloroethane_jpn.txt」(翻訳したテキストファイル)
「化学_trm.txt」(用語集)
の4つがあるはずです。

右上の[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択します。右下部分は[テキスト抽出したファイル(MS Word, Excel, Ppt)]となります。

ここに「1,2-Dichloroethane_eng.docx」(原稿のファイル。テキストの抽出元ファイル)
をドラッグします。今回の例の場合は、最初に準備したWordのファイルです。
※STを使ってみるときに、一番つまずく人が多いのがここだと思います。翻訳作業をしたテキストファイルではありません。Wordのファイルです。

そして、[抽出~書戻]タブの[書式タグ処理]は、今回は書式設定(太字や斜体など)はないので、[なし]にしておきます。

さあ、訳文を書き戻します。[実行]ボタンをポチッ。


「1,2-Dichloroethane_eng.docx」の他に、「1,2-Dichloroethane_jpn.docx」ができたはずです。

できたばかりの「1,2-Dichloroethane_jpn.docx」をWordで開いてみましょう。

------
1,2-ジクロロエタン
二塩化エチレン(ethylene dichloride: EDC)という昔の名前で一般に知られている1,2-ジクロロエタン(DCA)は、ポリ塩化ビニル(polyvinyl chloride: PVC)の原料である塩化ビニルモノマー(vinyl chloride monomer: VCM)(またはクロロエテン)の生産に主に使われる塩素化炭化水素です。ほにゃららほにゃらら。

安全性
1,2-ジクロロエタンは有毒で(蒸気圧が高いので、特に吸入しないよう注意)引火しやすい、発がん性の物質です。ほにゃららほにゃららほにゃららほにゃらら。
------

無事に書き戻されたでしょうか。

ここで書き戻されていない場合、間違った可能性が高いポイントは

・ファイル名を変更した(その1からその4に出てきた「1,2-Dichloroethane」で始まるファイルの名前は、すべて変更してはいけません)。
・翻訳作業をした「1,2-Dichloroethane_jpn.txt」の「段落タグ」をいじった。
・翻訳作業をした「1,2-Dichloroethane_jpn.txt」の冒頭(今回の場合、[[BD-1]])を変更した(行頭に改行を入れたり、他の文字を入れたりすると、書き戻されません)。
・[テキスト抽出したファイル(MS Word, Excel, Ppt)]にドラッグするファイルを間違えた(ドラッグするのは、原稿に「ファイル種類の変更」でサブ拡張子をくっつけたWordのファイルです)。

です。書き戻しに失敗した方は、このあたりをチェックして、もう一度試して下さい。

これで、「元の原稿のファイル名を変更→テキストを抽出→用語集を適用→(翻訳)→テキストの書き戻し」が一通りできました。

次回からは、細かい注意点や同梱の秀丸マクロなどについて書いていきたいと思います。


SimplyTermsを使った翻訳(その4:置換と翻訳)

前回の最後でできた「1,2-Dichloroethane_jpn.txt」は、このようなものでした。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical 化合物 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated 炭化水素, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical 化合物@@pl and as a 溶媒@@溶剤. It forms azeotropes with many other 溶媒@@溶剤@@pl, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. ジオキソラン and トルエン are possible substitutes as 溶媒@@溶剤@@pl. ジクロロエタン is unstable in the presence of アルミニウム metal and, when moist, with 亜鉛 and 鉄.
------

原稿にあった「dichloroethane」は、ちゃんとすべて「ジクロロエタン」に置換されています。
一括置換せずに、人の手で毎回入力していくとなると、原稿を見間違えて「ジクロロタン」としてしまったり、手がすべって「ジクロロエタン」と入力したりするかもしれません。このような間違いを防ぐ(減らす)ために、人よりもコンピュータの方が得意なところはコンピュータにやってもらいましょう、というのがSTを使った翻訳の考え方です。

置換された部分を見てみると、「ジクロロエタン」のようにそのまま置換されている部分と、「化合物@@pl」「溶媒@@溶剤」と用語集通りではない部分があります。

この用語集通りではない部分は何かというと・・・
そう、英語が複数形であった場合、訳語(日本語)のあとに「@@pl」がくっつきます。
また、用語集で一つの英語に対して複数の訳語が登録されていた場合、その複数の訳語が「@@」を挟んで連結されます。

用語集に登録されていた単語は置換されたので、残りの部分は地道に翻訳をしていきましょう。この「1,2-Dichloroethane_jpn.txt」のファイルに直接訳文を書き込んでいきます。ファイル名はこのまま、決して変更しないで下さい。
(翻訳作業に秀丸を使う場合、同梱の秀丸マクロを使えば、辞書を引く手間が減ったり、入力間違いが減ったりします。これはまた後日。)

翻訳をする際の重要なポイントは、【「段落タグ」をいじらない!】です。

※「段落タグ」を消すとどうなるかは、後日詳しく説明します(場合によっては消すときもあるんです!)

★用語集を適用しない場合の注意

用語集を適用すると、「1,2-Dichloroethane_eng.txt」から「1,2-Dichloroethane_jpn.txt」が自動的に作られるので、この「1,2-Dichloroethane_jpn.txt」を書き換えていきます。
用語集が無い(用語集を適用しない)場合は、いったん、「1,2-Dichloroethane_eng.txt」を秀丸等で開いて、「名前を付けて保存...」を選び、「1,2-Dichloroethane_jpn.txt」(サブ拡張子が「_jpn」)を自分で作り、この「1,2-Dichloroethane_jpn.txt」ファイルの英文を書き換えていきます。
翻訳作業をするテキストファイルのサブ拡張子は、常にターゲット言語にしておきます。つまり、英日翻訳をしているときは、「原稿ファイル名_jpn.txt」というファイルで作業をしていて、日英翻訳をしているときは、「原稿ファイル名_eng.txt」というファイルで作業をしてください(同梱の秀丸マクロには、このサブ拡張子を判別して違う動作をしているものがあるので、間違わないように!)。

次回は、翻訳後のファイルを書き戻して、Wordファイルを作ります。

SimplyTermsを使った翻訳(その3:用語集の適用)

今回は、前回用意したテキストファイル(「1,2-Dichloroethane_eng.txt」)の中の単語を、用語集を使って一括置換してみましょう。

初めて受けた種類の案件では、用語集がない場合が(圧倒的に)多いのですが、SimplyTerms(ST)の核となる機能ですので、試してみましょう。
(用語集を適用しない場合については、次回の「★用語集を適用しない場合の注意」を良く読んで下さい。)

用語集として、下の点線と点線の間の文章を自分で秀丸やメモ帳に貼り付けて、「化学_trm.txt」(※)というファイル名で、「STテスト」フォルダにテキスト形式で保存してください。ただし、英語と日本語の間はタブ(1つ)にしてください(このブログではタブを入れられなかったので、スペース4つになってます)。(「英語(tab)日本語」というのが、STで使う用語集のフォーマットです。)
 ※「化学」の部分はなんでもいいですが、サブ拡張子の「_trm」をつけて、必ずテキスト形式で保存してください。

------
dichloromethane    ジクロロメタン
dichloroethane    ジクロロエタン
dichloroethylene    ジクロロエチレン
hydrocarbon    炭化水素
solvent    溶媒
solvent    溶剤
compound    化合物
dioxolane    ジオキソラン
toluene    トルエン
aluminium    アルミニウム
zinc    亜鉛
iron    鉄
gold    金
silver    銀
copper    銅
------

STで「STテスト」フォルダを開くと、左下部分には
「1,2-Dichloroethane_eng.docx」(ファイル名の前に地球マーク)
「1,2-Dichloroethane_eng.txt」(ファイル名の前に地球マーク)
「化学_trm.txt」(ファイル名の前に用例カード(?)のマーク)
という3つのファイルがあるはずです。

右上の[抽出~書戻]タブの[処理内容]の三番目、[用語集の適用(一括置換)]を選択すると、右下部分が二つにわかれ、[処理対象テキストファイル(.txt)]と[適用する用語集(上:高優先順位)]となります。
この[処理対象テキストファイル(.txt)]に「1,2-Dichloroethane_eng.txt」を、[適用する用語集(上:高優先順位)]に「化学_trm.txt」をそれぞれドラッグします。
そして、[抽出~書戻]タブの[翻訳方向]という部分は[自動判別]を選択します。[自動判別]では、サブ拡張子が「_eng」の場合は、そのファイル内に用語集の英語と一致するものがあれば、その英語を日本語に置換します。サブ拡張子が「_jpn」の場合はその逆です。([英→日]、[日→英]は、翻訳途中で別の用語集を追加で適用したい場合などに使います。)



さあ、用語集を適用します。[実行]ボタンをポチッ。

はい、あっという間に「1,2-Dichloroethane_jpn.txt」(ファイル名の前に日の丸マーク)という新たなテキストファイルができたはずです。


ここで、とりあえずSTは終了します([ファイル]→[終了]か、右上隅のxをクリック)。

そして、できあがったばかりの「1,2-Dichloroethane_jpn.txt」を、秀丸やメモ帳で開いてみましょう。

------
[[BD-1]]
1,2-ジクロロエタン
[[BD-2]]
The chemical 化合物 1,2-ジクロロエタン (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated 炭化水素, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-ジクロロエタン is also used generally as an intermediate for other organic chemical 化合物@@pl and as a 溶媒@@溶剤. It forms azeotropes with many other 溶媒@@溶剤@@pl, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-ジクロロエタン is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-ジクロロエタン into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. ジオキソラン and トルエン are possible substitutes as 溶媒@@溶剤@@pl. ジクロロエタン is unstable in the presence of アルミニウム metal and, when moist, with 亜鉛 and 鉄.
------

用語集に登録されていた単語が置換されていますね。
詳しくは次回。

2013年3月21日木曜日

SimplyTermsを使った翻訳(その2:テキストの抽出)

では、「1,2-Dichloroethane.docx」というファイルに書かれた英文を翻訳(英日翻訳)する流れを見ていきましょう。

まず、SimplyTerms(ST)を起動します。
左側が、フォルダ間を移動したり、フォルダを開いたりするところです。

左上部分で、前回作った「STテスト」フォルダを探し、ダブルクリックすると、左下部分にフォルダの中身が表示されます。
(この時点で、「1,2-Dichloroethane.docx」というファイルが表示され、[言語]欄は空白、[種類]欄には「docx」と表示されているはずです。)


次に、右側に目を向けます。
右上に[抽出~書戻][用語集][整形・編集][その他]というタブが並んでいます。最初に使うのは[抽出~書戻]ですので、これをクリックします(起動直後は基本的にこれが一番上に出ています)。
そして、[処理内容]の一番上の[ファイル種類の変更]を選択し、すぐ右の[ファイルの種類]で[英語]を選択します。
右下部分は[処理対象ファイル]となっているはずなので、ここに、左下部分から原文ファイル(「1,2-Dichloroethane.docx」)をドラッグしてきます。


ここまで準備できたら、右上タブの右側にある[実行]ボタンをポチッと押します。
そうすると、ファイル名が「1,2-Dichloroethane.docx」から「1,2-Dichloroethane_eng.docx」となり、ファイル名の前には地球マークが表示され、[言語]欄は「英語」になったはずです(名前が変更されただけで、中身は変わっていません)。

※この、ファイル名に追加された「_eng」の部分を、STでは「サブ拡張子」と呼びます。最初のうちは、「_eng」(中身が英語)、「_jpn」(中身が日本語)、「_trm」(ST用の用語集)の3つを覚えておいて下さい。

次に、右上の[抽出~書戻]タブの二番目、[Officeテキスト抽出]を選択します。右下部分が[テキストを抽出するファイル(MS Word, Excel, Ppt)]となり、先ほど名前を変更した「1,2-Dichloroethane_eng.docx」が残っているはずです。そのファイルをそのままにしておいて、右上タブの右側にある[実行]ボタンをポチッと押します。

すると、「1,2-Dichloroethane_eng.txt」というファイルができているはずです(ファイル名の前には地球マーク)。

それを秀丸などのテキストエディタ(無い場合はWindowsのアクセサリの「メモ帳」でもOK)で開いてみると、下のようになっているはずです。

------
[[BD-1]]
1,2-Dichloroethane
[[BD-2]]
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]
[[BD-3]]
Safety
[[BD-4]]
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

そう、[[BD-1]]や[[BD-2]]といった[[]]で囲まれた行が、各段落の上に挿入されています。STのヘルプを見ても、これに名前はついてないようなので、このブログでは「段落タグ」と呼ぶことにします(ExcelやPowerPointなどでは段落毎につくわけではないのですが、便宜的にこう呼ぶことにします)。

※この「段落タグ」の中は絶対に書き換えてはいけません(うまく書き戻されなくなります)。
原稿ファイルの「1,2-Dichloroethane_eng.docx」は、絶対に、中身を書き換えたり、ファイル名を変えたりしないで下さい(うまく書き戻されなくなります)。

次回は、用語集を使って、用語集にある英単語を一括で置換します。

SimplyTermsを使った翻訳(その1:ファイルの準備)

では、SimplyTerms(以下、ST)を使った翻訳作業を、順を追って説明していきます。

例として、下のような文章の書かれたWordファイルに上書きで翻訳(英→日)する場合を見てみましょう。(ちなみに、この文章はWikipedia(英語版)の1,2-Dichloroethaneの一部です http://en.wikipedia.org/wiki/1,2-Dichloroethane)。

ファイル名「1,2-Dichloroethane.docx」
------
1,2-Dichloroethane
The chemical compound 1,2-dichloroethane (or DCA) commonly known by its old name of ethylene dichloride (EDC), is a chlorinated hydrocarbon, mainly used to produce vinyl chloride monomer (VCM, chloroethene), the major precursor for PVC production. It is a colourless liquid with a chloroform-like odour. 1,2-Dichloroethane is also used generally as an intermediate for other organic chemical compounds and as a solvent. It forms azeotropes with many other solvents, including water (b.p. 70.5 C) and other chlorocarbons.[1]

Safety
1,2-Dichloroethane is toxic (especially by inhalation due to its high vapour pressure), highly flammable,[4] and carcinogenic. Its high solubility and 50-year half-life in anoxic aquifers make it a perennial pollutant and health risk that is very expensive to treat conventionally, requiring a method of bioremediation.[5] While the chemical is banned from use by U.S. manufacturers,[6] a case was reported in 2009 of molded plastic consumer products (toys and holiday decorations) from China that released 1,2-dichloroethane into homes at levels high enough to produce cancer risk.[7] Substitutes are recommended and will vary according to application. Dioxolane and toluene are possible substitutes as solvents. Dichloroethane is unstable in the presence of aluminium metal and, when moist, with zinc and iron.
------

使い方を理解するためには、STを実際に使ってみるのが一番なので、同じように操作してみましょう。

まず、どこか適当にフォルダ(例えば「STテスト」)を作ります。
上の点線と点線の間の文章を自分でWordファイルに貼り付けて、「1,2-Dichloroethane.docx」(※)というファイル名で「STテスト」フォルダに保存します。

この時点では、「STテスト」フォルダの中に「1,2-Dichloroethane.docx」が一つだけある状態です。

これで、翻訳会社から原稿(のみ)をもらった状態ができました。
次回は、STを使ってこのファイルからテキストを抽出します。

※STで扱えるOfficeのファイル形式(拡張子)は、Word(.doc、.docx)、Excel(.xls、.xlsx)、PowerPoint(.ppt、.pptx)です。今回例で扱うのは「.docx」としましたが、「.doc」でもSTの操作は全く同じです。