2013年4月11日木曜日

SimplyTerms:「段落タグ」を削除するとどうなる?

これまで、SimplyTerms(ST)の「段落タグ」は基本的にいじらないと書いてきましたが、今回は、「段落タグ」を削除するとどうなるか、について書きたいと思います。

※今回の内容は、STヘルプの[MS Officeのテキスト抽出・書き戻し]→[抽出テキストの翻訳(上級編)]の「◎原文ママ残したいセクション」に書いてあります。

例えば、下のような原稿(Wordファイル)をもらったとしましょう。(ウィキペディアの「ポリエチレンテレフタラート」の項です。http://ja.wikipedia.org/wiki/%E3%83%9D%E3%83%AA%E3%82%A8%E3%83%81%E3%83%AC%E3%83%B3%E3%83%86%E3%83%AC%E3%83%95%E3%82%BF%E3%83%A9%E3%83%BC%E3%83%88
------
ポリエチレンテレフタラート(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをしてポリエチレンテレフタレートと呼ばれることも多い。
その頭文字からPETと略称される。ペットボトルの名称はこれに由来する。
下式のようにエチレングリコール(HO-CH2-CH2-OH)とテレフタル酸の脱水縮合により作られ、エステル結合が連なっているポリエステルとなる。このエステル結合の生成は、テレフタル酸ジメチルとのエステル交換反応でも可能である。
芳香環を有するとともに分子鎖が直線になりやすいことから、分子鎖が流動性をもつ温度では芳香環や分子鎖の配向が起こりやすく、結晶部分を作りやすい。
------(PET_wiki_jpn.doc)

4段落目には反応式の画像が入ってます。これをSTでテキストを抽出すると、下のようになりました。

-------
[[BD-1]]
<b>ポリエチレンテレフタラート</b>(Polyethylene terephthalate)は、ポリエステルの一種である。英語読みをして<b>ポリエチレンテレフタレート</b>と呼ばれることも多い。
[[BD-2]]
その頭文字から<b>PET</b>と略称される。ペットボトルの名称はこれに由来する。
[[BD-3]]
下式のようにエチレングリコール(HO-CH<sub>2</sub>-CH<sub>2</sub>-OH)とテレフタル酸の脱水縮合により作られ、エステル結合が連なっているポリエステルとなる。このエステル結合の生成は、テレフタル酸ジメチルとのエステル交換反応でも可能である。
[[BD-4]]
/
[[BD-5]]
芳香環を有するとともに分子鎖が直線になりやすいことから、分子鎖が流動性をもつ温度では芳香環や分子鎖の配向が起こりやすく、結晶部分を作りやすい。
------(PET_wiki_jpn.txt)

(前回扱った太字や下付き文字は、ちゃんと「書式タグ」で挟まれています。)
画像だった4段落目が「/」となっています(WordやOSのバージョンによっては、違う文字・記号かもしれません)。

多くの場合、文字部分のみを上書きして訳す(つまり画像はいじらずにそのままにする)よう指示されると思うので、上のテキスト抽出したファイルの[[BD-4]]の段落以外(つまり、[[BD-1]]、[[BD-2]]、[[BD-3]]、[[BD-5]])を訳します。

------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated to <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-4]]
/
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

訳しました。これを書き戻してみましょう。すると・・・

------
Polyethylene terephthalate is a polymer resin of the polyester family and ...
It is commonly abbreviated to PET ...
It is synthesized from ethylene glycol and terephthalic acid ...
/
Because it has aromatic rings and ...
------(PET_wiki_eng.doc)

と、元々あった画像がなくなり、「/」が挿入されてしまいました。
これでは困ります。

では、どうするかというと、「PET_wiki_eng.txt」の「[[BD-4]]」タグとそれに続く段落の内容を削除してしまうのです。つまり、下の赤字部分を丸ごと削除し、

------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-4]]
/

[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)



------
[[BD-1]]
<b>Polyethylene terephthalate</b> is a polymer resin of the polyester family and ...
[[BD-2]]
It is commonly abbreviated <b>PET</b> ...
[[BD-3]]
It is synthesized from ethylene glycol and terephthalic acid ...
[[BD-5]]
Because it has aromatic rings and ...
------(PET_wiki_eng.txt)

このようにして、書き戻すのです。

そうすると、
------
Polyethylene terephthalate is a polymer resin of the polyester family and ...
It is commonly abbreviated PET ...
It is synthesized from ethylene glycol and terephthalic acid ...
Because it has aromatic rings and ...
------(PET_wiki_eng.doc)

画像はそのまま残りました。

これは何も画像や図に限ったことではなく、文章でも同じです。

例えば、
・文章の一部の段落が既に翻訳されていて、残りの部分を翻訳してください、と頼まれた。
・WordやExcel、PowerPointの原稿に表が含まれていて、表の中の数字はいじる必要がない(そのまま残したい)。
といった場合に使えます。

まとめると、
原文ママ残したい部分は、「段落タグ」とその段落の内容を削除する
です。

※「段落タグ」は残したけど、その段落の内容を削除した場合にはどうなるか、次回取り上げます。

0 件のコメント:

コメントを投稿