記事の更新をサボっていると広告が表示されてしまうので、今回は、簡単なものを 1 つ紹介したいと思います。用語集の設定については、もう少しお待ちください。
今回は、数字と単位記号と間のスペースです。上図のように、原文は「4km」だけど、訳文は「4 △
km」するというようなケースです。スタイルガイドで、スペースを入れてくださいとか、入れないでくださいとか、ノーブレークスペースにしてくださいとか、細かいことを指定されることがあると思います。このような処理は、プロジェクトの設定で自動化できます。設定してしまえば、QuickPlace (Ctrl+Alt+下矢印) や繰り返しの自動反映で入力するときに自動的にスペースが調整されます。細かいことですが、数字と単位記号は自分でタイプせずに入力することが多いので結構便利です。
さて、ではその設定がどこにあるかですが、以下にあります。
[プロジェクトの設定] > [言語ペア] > [ 特定の言語ペア
] > [翻訳メモリと自動翻訳] > [自動置換] > [単位]
[ 言語ペア] の下で、[ すべての言語ペア] ではなく、[ Japanese (Japan) 〜] などの特定の言語ペアを選択する必要があります。私は多言語プロジェクトの経験はほとんどないのでこの2つの設定の違いがよくわからないのですが、言語固有の設定の場合は、その言語を選択して設定する必要があるようです。
デフォルトの設定は、一番上の「 同じスペースを使用」です。このため、原文が「4km」なら、訳文も「4km」になります。訳文でスペースを入れたい場合は、真ん中あたりの「 通常のスペースを挿入」を選択します。これで、「4km」が「4 △
km」になります。
ほかにもスペースの種類を選べますが、私は、スタイルガイドで特に指定されない限り「通常のスペース」にしています。訳文が最終的にどのような形式で使われるのか翻訳者の段階ではわからないことも多いので、あまりいろいろなことはしないのが安全です。
なお、この機能が有効に働くのは Trados が単位として認識できる一般的な単位のみです。特殊な単位には効きません。たとえば、GB (ギガバイト) や TB (テラバイト) までは認識してくれますが、PB (ペタバイト) はだめでした。また、bps (bits per second) や pps (packets per socond) もだめでした。設定してもうまく機能しないときは、私はあまり考えず諦めることにしています。
最後に、この設定は「プロジェクトの設定」なので、パッケージで設定できるものです。つまり、パッケージを作る人がスタイルガイドに合わせて設定してきてくれれば、翻訳者は何もしなくていいんですよね〜。でも、翻訳会社さんはそんなことまではまずしてくれません。そこで、自分で設定するんですが、「ファイルが追加になりました」などと言われて新しいパッケージを開くと、設定が上書きされてしまい、設定のやり直しになります。「プロジェクトの設定」の中の設定は、パッケージで指定されている設定が優先なので、パッケージを開いたら、やり直しです。
今回は、以上です。ここで紹介した特定の言語ペアの下にある [ 自動置換] には、単位のスペースのほかにもいろいろ便利そうな設定があります。それについては、また次回の機会に取り上げたいと思います。
Tweet
2019年06月07日
2019年04月30日
【後編】マイクロソフトの用語集を使いたい
前編
に引き続き、マイクロソフトの用語集を Trados で使えるように変換する方法を説明します。今回こそ具体的な手順を説明しますが、Glossary Converter の使い方に詳しい方は前編の概要だけでだいたいわかって頂けるかと思うので読み飛ばしてください。
説明する手順は、前編で説明したとおり、こんな感じです。
1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。
2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。
3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。
4. 出力された用語ベース (sdltb) を、英語でマージする。
5. マージした用語ベース (sdltb) を、さらに日本語でマージする。
まず、Glossary Converter のステップ全体に共通する点を説明します。
◆ [settings] で設定してから、ドラッグ アンド ドロップする
Glossary Converter の基本的な使い方は、以下のとおりです。
どんなファイルを変換するときも、この手順は変わりません。そして、Glossary Converter は、一度行った設定を覚えています。同じ変換を何回もするときは設定を覚えていてくれる機能も便利ですが、今回はいろいろな変換をするので、各ステップで、設定を変えてからファイルをドラッグ アンド ドロップします。
なお、ドラッグ アンド ドロップできないときは、Alt+O でファイル選択のダイアログボックスが表示されるので、ファイルを指定して変換を開始します。
◆ 時間がかかる
マイクロソフトの用語集はとても大きいので、変換にものすごく時間がかかります。止まっているんじゃないかと心配になりますが、ステータスバーを見ながら、気長に、気長に、お待ちください。
tbx 形式の用語集ファイルはそのままでは編集しにくいので、なんとか Excel で編集できる形にします。tbx ファイルを直接 Excel で開くこともできますが、XML の知識がないと編集しやすい形にするのは難しいため、今回は ?@ tbx ファイルを Trados の用語ベースに変換、 ?A 用語ベースを Excel ファイルに変換という 2 段階の方法を取ります。2 段階はちょっと手間ですが、この方法なら複雑なことを自分で考えなくても Glossary Converter が適当に変換してくれます。
?@ tbx ファイルを用語ベースに変換
・設定
最初は、設定不要です。
・変換
tbx ファイルをドラッグ アンド ドロップします。これだけで、Trados の用語ベース (sdltb) が生成されます。
?A 用語ベースを Excel ファイルに変換
・設定
今度は、[ settings] で少し設定を変えます。[ General] タブで、「 Excel 2007 Workbook」が選択されていることを確認します (デフォルトで選択されているはず)。
[ Spreadsheet] タブで、「 Multi-line format (one row per synonym)」を選択します。さらに、[ Repeat source term] チェックボックスもオンにします。これで、複数の訳語がある場合にそれぞれが別レコードとして複数の行が生成され、各行に原語が入力されます。[ Column/Language name] は、今回は空白で大丈夫です。空白にしておくと、最初の列が原語として使われます。
・変換
設定ができたら、用語ベース (sdltb) をドラッグ アンド ドロップします。これで、Excel ファイルが生成されます。
生成された Excel ファイルを開いて、定義などの不要な列を削除し、英語と日本語の 2 列だけにします。
英語と日本語の 2 列だけにした Excel ファイルを、用語ベース (sdltb) の形に戻します。
・設定
このステップでは不要です。
・変換
Excel ファイルをドラッグ アンド ドロップします。これで、用語ベース (sdltb) が生成されます。
この時点の用語ベース (sdltb) は、まだ複数の訳語が別レコードとして残っている状態なので、まず英語でマージして重複する訳語を削除します。英日または日英のどちらか一方向だけで使うときは、その方向で 1 回だけマージすれば大丈夫です。
・設定
[ General] タブで、「 MultiTerm Termbase」を選択します。これで、用語ベース (sdltb) を用語ベース (sdltb) に変換する、という設定になります。
[ Merging] タブで、[ Merge Files] チェックボックスをオンにします。[ Merge on this Field] は空白のままにします。空白にしておくと、変換処理が始まってからプロンプトが表示されるのでそこで設定します。
・変換
下図のように「 merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトが表示されるので、英語 (English) を選択します。変換が終わると、元のファイル名に「.output」を追加した名前で新しい用語ベースが生成されます。
英語でマージした用語ベースをさらに日本語でマージします。(もしかしたら、このステップは不要なんじゃないかとも思うのですが、念のためしておきます。)
・設定
[ General] タブで、「 MultiTerm Termbase」が選択されていることを確認します。前のステップで選択したので、その設定がそのまま残っていると思います。
[ Merging] タブで、[ Merge Files] チェックボックスが選択されていることを確認します。これも、前のステップで選択しているのでそのままオンになっているはずです。[ Merge on this Field] は、前のステップの 「English」 が残っていたら、空白に戻します。
・変換
前のステップと同じように「 merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトがまた表示されるので、今度は日本語 (Japanese) を選択します。変換が終わると、元のファイル名にさらに「.output」を追加した名前で新しい用語ベースが生成されます。これで、完成です。
これでマイクロソフトの用語集の準備は完了です。ステップが多くなっていますが、今回の方法は試行錯誤の末、なるべく安全な方法として考えました。今さらですが、マージ機能は用語ベースから用語ベースへの変換でなくても、Excel から用語ベースへの変換でも使えます。なので、ステップ 3 の Excel から用語ベースへの変換は省略することも可能だと思います。が、実際にやってみると、微妙にうまくいきませんでした。重複している訳語の中で抜けてしまうものがあったりして、なんとなく信用ならない感じでした。何が抜けるのか、なぜ抜けるのかなどを考えるのがちょっと面倒になり、少々ステップは増えますが、今回の方法にしました。
また、Excel を間に含めたのには、もう 1 つ理由があります。Excel でいろいろ細かい編集がしたかったのです。マイクロソフトの用語集はマイクロソフトのスタイルガイドに従っているので、カタカナの連語の間にはスペースが入っていますし、全角文字と半角文字の間にもスペースが入っています。これが、別会社の翻訳に使うときにはちょっと面倒なんです。Excel ファイルにしてしまえば、この辺りをスタイルガイドに合わせて編集することができます。数式や正規表現を使って (皆さん、お得意ですよね??) いろいろ加工ができます。
次回は、この用語ベースを Trados のエディタで使うときに気を付ける設定などを紹介したいと思います。
Tweet
説明する手順は、前編で説明したとおり、こんな感じです。
1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。
2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。
3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。
4. 出力された用語ベース (sdltb) を、英語でマージする。
5. マージした用語ベース (sdltb) を、さらに日本語でマージする。
まず、Glossary Converter のお約束
まず、Glossary Converter のステップ全体に共通する点を説明します。
◆ [settings] で設定してから、ドラッグ アンド ドロップする
Glossary Converter の基本的な使い方は、以下のとおりです。
- [ settings] で設定する
- 変換元のファイルをドラッグ アンド ドロップする
- 変換元のファイルと同じフォルダーに変換後のファイルが生成される
どんなファイルを変換するときも、この手順は変わりません。そして、Glossary Converter は、一度行った設定を覚えています。同じ変換を何回もするときは設定を覚えていてくれる機能も便利ですが、今回はいろいろな変換をするので、各ステップで、設定を変えてからファイルをドラッグ アンド ドロップします。
なお、ドラッグ アンド ドロップできないときは、Alt+O でファイル選択のダイアログボックスが表示されるので、ファイルを指定して変換を開始します。
◆ 時間がかかる
マイクロソフトの用語集はとても大きいので、変換にものすごく時間がかかります。止まっているんじゃないかと心配になりますが、ステータスバーを見ながら、気長に、気長に、お待ちください。
1. マイクロソフトの用語集ファイルを用語ベースに変換、さらに Excel ファイルに変換
tbx 形式の用語集ファイルはそのままでは編集しにくいので、なんとか Excel で編集できる形にします。tbx ファイルを直接 Excel で開くこともできますが、XML の知識がないと編集しやすい形にするのは難しいため、今回は ?@ tbx ファイルを Trados の用語ベースに変換、 ?A 用語ベースを Excel ファイルに変換という 2 段階の方法を取ります。2 段階はちょっと手間ですが、この方法なら複雑なことを自分で考えなくても Glossary Converter が適当に変換してくれます。
?@ tbx ファイルを用語ベースに変換
・設定
最初は、設定不要です。
・変換
tbx ファイルをドラッグ アンド ドロップします。これだけで、Trados の用語ベース (sdltb) が生成されます。
?A 用語ベースを Excel ファイルに変換
・設定
今度は、[ settings] で少し設定を変えます。[ General] タブで、「 Excel 2007 Workbook」が選択されていることを確認します (デフォルトで選択されているはず)。
[ Spreadsheet] タブで、「 Multi-line format (one row per synonym)」を選択します。さらに、[ Repeat source term] チェックボックスもオンにします。これで、複数の訳語がある場合にそれぞれが別レコードとして複数の行が生成され、各行に原語が入力されます。[ Column/Language name] は、今回は空白で大丈夫です。空白にしておくと、最初の列が原語として使われます。
・変換
設定ができたら、用語ベース (sdltb) をドラッグ アンド ドロップします。これで、Excel ファイルが生成されます。
2. Excel で、定義などの不要な列を削除
生成された Excel ファイルを開いて、定義などの不要な列を削除し、英語と日本語の 2 列だけにします。
3. Excel ファイルを用語ベースに再度変換する
英語と日本語の 2 列だけにした Excel ファイルを、用語ベース (sdltb) の形に戻します。
・設定
このステップでは不要です。
・変換
Excel ファイルをドラッグ アンド ドロップします。これで、用語ベース (sdltb) が生成されます。
4. 出力された用語ベースを、英語でマージ
この時点の用語ベース (sdltb) は、まだ複数の訳語が別レコードとして残っている状態なので、まず英語でマージして重複する訳語を削除します。英日または日英のどちらか一方向だけで使うときは、その方向で 1 回だけマージすれば大丈夫です。
・設定
[ General] タブで、「 MultiTerm Termbase」を選択します。これで、用語ベース (sdltb) を用語ベース (sdltb) に変換する、という設定になります。
[ Merging] タブで、[ Merge Files] チェックボックスをオンにします。[ Merge on this Field] は空白のままにします。空白にしておくと、変換処理が始まってからプロンプトが表示されるのでそこで設定します。
・変換
下図のように「 merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトが表示されるので、英語 (English) を選択します。変換が終わると、元のファイル名に「.output」を追加した名前で新しい用語ベースが生成されます。
5. 用語ベースを、さらに日本語でマージ
英語でマージした用語ベースをさらに日本語でマージします。(もしかしたら、このステップは不要なんじゃないかとも思うのですが、念のためしておきます。)
・設定
[ General] タブで、「 MultiTerm Termbase」が選択されていることを確認します。前のステップで選択したので、その設定がそのまま残っていると思います。
[ Merging] タブで、[ Merge Files] チェックボックスが選択されていることを確認します。これも、前のステップで選択しているのでそのままオンになっているはずです。[ Merge on this Field] は、前のステップの 「English」 が残っていたら、空白に戻します。
・変換
前のステップと同じように「 merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトがまた表示されるので、今度は日本語 (Japanese) を選択します。変換が終わると、元のファイル名にさらに「.output」を追加した名前で新しい用語ベースが生成されます。これで、完成です。
これでマイクロソフトの用語集の準備は完了です。ステップが多くなっていますが、今回の方法は試行錯誤の末、なるべく安全な方法として考えました。今さらですが、マージ機能は用語ベースから用語ベースへの変換でなくても、Excel から用語ベースへの変換でも使えます。なので、ステップ 3 の Excel から用語ベースへの変換は省略することも可能だと思います。が、実際にやってみると、微妙にうまくいきませんでした。重複している訳語の中で抜けてしまうものがあったりして、なんとなく信用ならない感じでした。何が抜けるのか、なぜ抜けるのかなどを考えるのがちょっと面倒になり、少々ステップは増えますが、今回の方法にしました。
また、Excel を間に含めたのには、もう 1 つ理由があります。Excel でいろいろ細かい編集がしたかったのです。マイクロソフトの用語集はマイクロソフトのスタイルガイドに従っているので、カタカナの連語の間にはスペースが入っていますし、全角文字と半角文字の間にもスペースが入っています。これが、別会社の翻訳に使うときにはちょっと面倒なんです。Excel ファイルにしてしまえば、この辺りをスタイルガイドに合わせて編集することができます。数式や正規表現を使って (皆さん、お得意ですよね??) いろいろ加工ができます。
次回は、この用語ベースを Trados のエディタで使うときに気を付ける設定などを紹介したいと思います。
Tweet
2019年04月27日
【前編】マイクロソフトの用語集を使いたい
記事の更新が久しぶりになってしまいました。ちょこちょこと書きたいことはあったのですが、仕事が忙しかったり、なかなか考えがまとまらなかったりで、1 か月以上も過ぎていました。
さて今回は、マイクロソフトから提供されている用語集を Trados で使う方法を紹介したいと思います。この用語集はとても便利ですが、とにかくデータ量が多いので Trados で効果的に使うには少し工夫が必要です。私はずいぶん昔から試行錯誤していたんですが、最近ようやく、Glossary Converter を使ったら便利かもしれないということに思いあたりました。今回は、Glossary Converter のマージ機能を使った方法を紹介します。何かもっとこうした方が良いというアドバイスなどありましたら、ぜひぜひお聞かせください。
この記事は「前編」として概要だけ説明します。細かい Glossary Converter の使い方などは 後編 で書きたいと思います。
この用語集には、IT 分野で使える用語が大量に入っています。マイクロソフト提供のものですが、製品の UI などは別で提供されていて (おそらく、一般人は無料では手に入らない)、この用語集には一般的な用語のみが格納されています。
各国語のデータが用意されているので、日本語を選択してダウンロードします。ダウンロードされるデータは tbx 形式のファイルです。tbx とは「Term Base eXchange」のことで、用語データに一般的に使われる XML のデータ形式です。この形式は、Multiterm に付属のコンバーターでもサポートされています。
tbx 形式の用語集は Multiterm 付属のコンバーターで扱うこともできますが、今回は、SDL App Store から無料でダウンロードできるアプリ「 Glossary Converter 」を使います。これは、Trados Studio に組み込まれるプラグインではなく、Trados Studio の外側で動くアプリです。 (現在は、上記のバージョンより新しいものになっています。)
このツールについては、SDL の公式ブログ「 Glossary Converter – Excelから用語ベースおよびTMXへの変換 」でも紹介されています。参考にしてください。
使い方はとても簡単で、アプリを起動したら、そこにファイルをドラッグ アンド ドロップするだけです。変換したいファイルをドロップすると、後は自動で適当に変換してくれます。実際には、以下の 2 つの処理のいずれかになります。
・用語ベース (sdltb) をドロップ --> Excel ファイルなどに変換される。
・用語ベース (sdltb) 以外をドロップ --> 用語ベース (sdltb) に変換される。
ドロップした元ファイルと同じフォルダーに、同じ名前で拡張子だけが違うファイルが生成されます。同名のファイルが既に存在している場合は、上書きするかどうかを尋ねられるので、必要に応じてファイル名を指定できます。
変換先の形式や細かい変換方法を設定したい場合は、ドロップする前に、[settings] から設定を行います。たいていは何も設定しなくてもうまく変換されます。今回の変換で使う設定については、後編の記事で説明します。
今回の変換で私が気を付けたのは、以下の 3 つです。(なんか、どっかのマニュアルみたいですが)
マイクロソフト提供の用語集は、同じ訳語であっても定義の違うものは別レコードとして登録しているので、単純に変換すると、Trados の用語認識ウィンドウに同じ訳語が何回も表示されてきてしまいます。用語の定義を知りたいときはそうした表示も役立ちますが、実際には、Trados の用語認識ウィンドウに訳語の定義を表示しても読みにくく、あまり効率的ではありません。今回の用語ベースは、あくまで入力補助として使うことを前提に、定義の違いは無視して同じ訳語は 1 回だけ表示されるようにしました。
重複を削除するにあたって問題となったのが 2 つ目の大文字小文字の区別です。以前に、「 Excel で重複を削除する方法 」を紹介しましたが、実は、この Excel の「重複の削除」機能は大文字小文字を区別しません。今回のマイクロソフトの用語集では区別できなくても問題ないですが、実際の仕事では、Trados の用語ベースに UI が格納されていることがよくあります。日英翻訳の UI では、一般用語と違って大文字小文字を区別することが必要な場合があるので、今回はそうした用語ベースにも使える方法として Glossary Converter のマージ機能を使ってみることにしました。
Excel で大文字小文字を区別しながら重複を削除する方法も試してみたのですが、私の思い付く限りでは、少し数式を書く必要がありました。その方法は、また次回紹介したいと思います。
最後に、3 つ目の英日と日英のどちらでも使えるようにですが、これはいくつも用語集があると面倒なので、1 つにしたいなあと思っただけです。ただ、これも重複の削除のときに少し注意が必要で、英語の用語が 1 つで日本語の用語が複数の場合と、この逆の場合とが混在していることを意識しておく必要があります。とは言っても、結局、今回の方法にしたら、ほぼ何もしなくてもうまく変換されました。
変換の手順は、こんな感じです。
1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。
2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。
3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。
4. 出力された用語ベース (sdltb) を、英語でマージする。
5. マージした用語ベース (sdltb) を、さらに日本語でマージする。
さて、今回は以上です。概要だけで、何も詳しい手順がなくてすみません。書いていたら予想以上に長くなってしまったので、詳しい手順は 後編 で説明したいと思います。
Tweet
さて今回は、マイクロソフトから提供されている用語集を Trados で使う方法を紹介したいと思います。この用語集はとても便利ですが、とにかくデータ量が多いので Trados で効果的に使うには少し工夫が必要です。私はずいぶん昔から試行錯誤していたんですが、最近ようやく、Glossary Converter を使ったら便利かもしれないということに思いあたりました。今回は、Glossary Converter のマージ機能を使った方法を紹介します。何かもっとこうした方が良いというアドバイスなどありましたら、ぜひぜひお聞かせください。
この記事は「前編」として概要だけ説明します。細かい Glossary Converter の使い方などは 後編 で書きたいと思います。
マイクロソフトの用語集
この用語集には、IT 分野で使える用語が大量に入っています。マイクロソフト提供のものですが、製品の UI などは別で提供されていて (おそらく、一般人は無料では手に入らない)、この用語集には一般的な用語のみが格納されています。
各国語のデータが用意されているので、日本語を選択してダウンロードします。ダウンロードされるデータは tbx 形式のファイルです。tbx とは「Term Base eXchange」のことで、用語データに一般的に使われる XML のデータ形式です。この形式は、Multiterm に付属のコンバーターでもサポートされています。
変換に使用するツール: Glossary Converter
tbx 形式の用語集は Multiterm 付属のコンバーターで扱うこともできますが、今回は、SDL App Store から無料でダウンロードできるアプリ「 Glossary Converter 」を使います。これは、Trados Studio に組み込まれるプラグインではなく、Trados Studio の外側で動くアプリです。 (現在は、上記のバージョンより新しいものになっています。)
このツールについては、SDL の公式ブログ「 Glossary Converter – Excelから用語ベースおよびTMXへの変換 」でも紹介されています。参考にしてください。
使い方はとても簡単で、アプリを起動したら、そこにファイルをドラッグ アンド ドロップするだけです。変換したいファイルをドロップすると、後は自動で適当に変換してくれます。実際には、以下の 2 つの処理のいずれかになります。
・用語ベース (sdltb) をドロップ --> Excel ファイルなどに変換される。
・用語ベース (sdltb) 以外をドロップ --> 用語ベース (sdltb) に変換される。
ドロップした元ファイルと同じフォルダーに、同じ名前で拡張子だけが違うファイルが生成されます。同名のファイルが既に存在している場合は、上書きするかどうかを尋ねられるので、必要に応じてファイル名を指定できます。
変換先の形式や細かい変換方法を設定したい場合は、ドロップする前に、[settings] から設定を行います。たいていは何も設定しなくてもうまく変換されます。今回の変換で使う設定については、後編の記事で説明します。
今回の変換で気を付けたこと
今回の変換で私が気を付けたのは、以下の 3 つです。(なんか、どっかのマニュアルみたいですが)
- 同じ訳語は 1 回だけ表示されるようにする
- ただし、大文字小文字は区別する
- 英日と日英のどちらでも使える用語集にする
マイクロソフト提供の用語集は、同じ訳語であっても定義の違うものは別レコードとして登録しているので、単純に変換すると、Trados の用語認識ウィンドウに同じ訳語が何回も表示されてきてしまいます。用語の定義を知りたいときはそうした表示も役立ちますが、実際には、Trados の用語認識ウィンドウに訳語の定義を表示しても読みにくく、あまり効率的ではありません。今回の用語ベースは、あくまで入力補助として使うことを前提に、定義の違いは無視して同じ訳語は 1 回だけ表示されるようにしました。
重複を削除するにあたって問題となったのが 2 つ目の大文字小文字の区別です。以前に、「 Excel で重複を削除する方法 」を紹介しましたが、実は、この Excel の「重複の削除」機能は大文字小文字を区別しません。今回のマイクロソフトの用語集では区別できなくても問題ないですが、実際の仕事では、Trados の用語ベースに UI が格納されていることがよくあります。日英翻訳の UI では、一般用語と違って大文字小文字を区別することが必要な場合があるので、今回はそうした用語ベースにも使える方法として Glossary Converter のマージ機能を使ってみることにしました。
Excel で大文字小文字を区別しながら重複を削除する方法も試してみたのですが、私の思い付く限りでは、少し数式を書く必要がありました。その方法は、また次回紹介したいと思います。
最後に、3 つ目の英日と日英のどちらでも使えるようにですが、これはいくつも用語集があると面倒なので、1 つにしたいなあと思っただけです。ただ、これも重複の削除のときに少し注意が必要で、英語の用語が 1 つで日本語の用語が複数の場合と、この逆の場合とが混在していることを意識しておく必要があります。とは言っても、結局、今回の方法にしたら、ほぼ何もしなくてもうまく変換されました。
変換の手順
変換の手順は、こんな感じです。
1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。
2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。
3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。
4. 出力された用語ベース (sdltb) を、英語でマージする。
5. マージした用語ベース (sdltb) を、さらに日本語でマージする。
さて、今回は以上です。概要だけで、何も詳しい手順がなくてすみません。書いていたら予想以上に長くなってしまったので、詳しい手順は 後編 で説明したいと思います。
|
|
Tweet
2019年03月25日
メモリについてのオンライン セミナーから
今月は SDL のオンライン セミナーがいくつかありました。いずれも当日参加するつもりで登録していたのですが、なかなか予定が合わず、ようやく先日録画を見ることができました。
初心者向けのセミナーもあり、驚くような新しい情報はなかったのですが、それでもいくつか私が知らない機能などがありました。今回は、メモリ (TM) についてのセミナーから、個人翻訳者として気になったことを紹介したいと思います。
1 つの原文に対して複数の訳文を登録する機能です。私はこんな機能があるのを知りませんでした!! 何年も Trados を使っているのに気付きませんでした (;。;)
訳文を入力したら、たいていは Ctrl+Enter で確定をして訳文を登録します。この場合、既存の訳文があったらそれを上書きするので、メモリに登録される訳文は常に 1 つです。しかし、ここで Ctrl+Shift+U を使うと、既存の訳文を上書きせず、新しい訳文を追加できます。
エディタ上で訳し分けをしても、それをメモリに登録できないので不便だなぁとずっと思っていました。でも、そのための機能がちゃんとあったんですねぇ。
upLift テクノロジーについての説明がかなり詳しくありました。このテクノロジーの設定については、以前の記事 ( 前編 、 後編 ) で紹介しましたが、まだなんとなく理解できていません。ただ、今回のセミナーで気になった点は、upLift そのものではなく、「固定要素」の扱いです。
「IP address」という語句から「MAC address」という一致が見つかっています。これは、「IP」が固定要素とみなされているからだそうです。この動作には驚きました! 何も知らずにこんな動作に遭遇したら、かなり悩んでしまいそうです。
上の図では「IP address」の「IP」に青色の下線が引かれています。これが固定要素です。オンライン セミナーでの簡単な説明によると、固定要素とみなされるものは「アルファベットの略語あるいは数字」だそうです。この固定要素は、実際の中身が何であっても、すべて同じものと解釈されるとのことでした。
Trados は、上のように解釈して「IP address と MAC address は同じ」という結果を出してくるわけです。
これは、もしかしたら便利なんでしょうか。おそらく、この動作はフラグメント一致に限られたものではありません。通常のメモリの検索でも (もしかしたら、料金に関係してくる一致率の計算でも??) この動作になっていると思います。略語 (頭字語) や数字の違いはうっかり見落とす危険があるので、 Trados からの出力は、こうした動作を知ったうえで注意して見ることが必要かと思います。
固定要素については、識別するかどうかの設定や、文字数・ワード数への影響など、私にとってはちょっと不可解なことがいくつかあります。詳しくは、またいつか調べてみたいと思います。(いつか。早めに。なるべく。)
AnyTM の存在は一応知ってはいたのですが、翻訳方向の反転のために使うものかと思っていました。たとえば、日英翻訳をするプロジェクトで英日のメモリを使いたいというときに AnyTM を使えます。
でも実は、こうした反転に限らず、まったく違う言語のメモリを使うことができるそうです。確かに、「Any」という名前が付いているくらいなので、考えてみれば当然ですね。違う言語を使うことが必要になるケースとしてよくあるのは、同じ英語でもアメリカ英語とイギリス英語でメモリが分かれている場合などです。
このほかにも、英日のプロジェクトで独英 (英独?) のメモリを使うというようなことができるそうです。これは、ほかの言語から翻訳された英語をさらに日本語に訳すといった場合にもしかしたら役立つかもしれません。このような場合、まれに、翻訳会社から本当の原文まで参照するように指示されることがあります。まあ、私はほかの言語はよくわからないので、参照してもどうしようもないことが多いですが。
個人翻訳者として気になったところはこんな感じです。これ以外にも、翻訳会社のコーディネーターさんに役立ちそうな情報はいくつかありました。
・メモリ エディタには、「原文分節の長さ」などのフィールドが用意されている。
・バイリンガル ファイルではなく、生成後の訳文からレビュー結果を取り込める。
・アプリなどを使ってメモリを xliff に変換できる。これにより、QA Check やスペルチェックを実行できる。
最後の、メモリに QA Check を実行したいというケースは個人翻訳者でもあるかもしれないので、また次回の機会に紹介したいと思います。
Tweet
初心者向けのセミナーもあり、驚くような新しい情報はなかったのですが、それでもいくつか私が知らない機能などがありました。今回は、メモリ (TM) についてのセミナーから、個人翻訳者として気になったことを紹介したいと思います。
新しい翻訳単位の追加
1 つの原文に対して複数の訳文を登録する機能です。私はこんな機能があるのを知りませんでした!! 何年も Trados を使っているのに気付きませんでした (;。;)
訳文を入力したら、たいていは Ctrl+Enter で確定をして訳文を登録します。この場合、既存の訳文があったらそれを上書きするので、メモリに登録される訳文は常に 1 つです。しかし、ここで Ctrl+Shift+U を使うと、既存の訳文を上書きせず、新しい訳文を追加できます。
エディタ上で訳し分けをしても、それをメモリに登録できないので不便だなぁとずっと思っていました。でも、そのための機能がちゃんとあったんですねぇ。
固定要素は、原則、すべて同じものとして扱われる
upLift テクノロジーについての説明がかなり詳しくありました。このテクノロジーの設定については、以前の記事 ( 前編 、 後編 ) で紹介しましたが、まだなんとなく理解できていません。ただ、今回のセミナーで気になった点は、upLift そのものではなく、「固定要素」の扱いです。
「IP address」という語句から「MAC address」という一致が見つかっています。これは、「IP」が固定要素とみなされているからだそうです。この動作には驚きました! 何も知らずにこんな動作に遭遇したら、かなり悩んでしまいそうです。
上の図では「IP address」の「IP」に青色の下線が引かれています。これが固定要素です。オンライン セミナーでの簡単な説明によると、固定要素とみなされるものは「アルファベットの略語あるいは数字」だそうです。この固定要素は、実際の中身が何であっても、すべて同じものと解釈されるとのことでした。
- IP address ---> [固定要素] address
- MAC address ---> [固定要素] address
Trados は、上のように解釈して「IP address と MAC address は同じ」という結果を出してくるわけです。
これは、もしかしたら便利なんでしょうか。おそらく、この動作はフラグメント一致に限られたものではありません。通常のメモリの検索でも (もしかしたら、料金に関係してくる一致率の計算でも??) この動作になっていると思います。略語 (頭字語) や数字の違いはうっかり見落とす危険があるので、 Trados からの出力は、こうした動作を知ったうえで注意して見ることが必要かと思います。
固定要素については、識別するかどうかの設定や、文字数・ワード数への影響など、私にとってはちょっと不可解なことがいくつかあります。詳しくは、またいつか調べてみたいと思います。(いつか。早めに。なるべく。)
AnyTM はいろいろな言語に使える
AnyTM の存在は一応知ってはいたのですが、翻訳方向の反転のために使うものかと思っていました。たとえば、日英翻訳をするプロジェクトで英日のメモリを使いたいというときに AnyTM を使えます。
でも実は、こうした反転に限らず、まったく違う言語のメモリを使うことができるそうです。確かに、「Any」という名前が付いているくらいなので、考えてみれば当然ですね。違う言語を使うことが必要になるケースとしてよくあるのは、同じ英語でもアメリカ英語とイギリス英語でメモリが分かれている場合などです。
このほかにも、英日のプロジェクトで独英 (英独?) のメモリを使うというようなことができるそうです。これは、ほかの言語から翻訳された英語をさらに日本語に訳すといった場合にもしかしたら役立つかもしれません。このような場合、まれに、翻訳会社から本当の原文まで参照するように指示されることがあります。まあ、私はほかの言語はよくわからないので、参照してもどうしようもないことが多いですが。
個人翻訳者として気になったところはこんな感じです。これ以外にも、翻訳会社のコーディネーターさんに役立ちそうな情報はいくつかありました。
・メモリ エディタには、「原文分節の長さ」などのフィールドが用意されている。
・バイリンガル ファイルではなく、生成後の訳文からレビュー結果を取り込める。
・アプリなどを使ってメモリを xliff に変換できる。これにより、QA Check やスペルチェックを実行できる。
最後の、メモリに QA Check を実行したいというケースは個人翻訳者でもあるかもしれないので、また次回の機会に紹介したいと思います。
Tweet
2019年02月25日
2019対応プラグイン: Regex Match AutoSuggest Provider
私はまだ SDL Trados Studio 2019 を導入していませんが、その大きな理由となっていたのはプラグインの対応でした。特に、 Regex Match AutoSuggest Provider
は日英翻訳では欠かせないものとなっていたので、これが対応するまで導入はないなぁとゆっくり構えていました。が、なんと
Regex Match AutoSuggest Provider が 2019 に対応していた!
私は、先日になって初めて気付いたのですが、実は、もっと以前から対応していたでしょうか。このプラグインについては、以前の記事「 ■プラグイン■ 原文にある英数字を訳文にコピーする (日⇒英の場合) 」で紹介しました。簡単に言うと、AutoSuggest 機能を自作の正規表現を使って強化できるものです。私は、複雑な正規表現を書くのは少し苦手なので、上記の記事で紹介したとおり、原文の英数字をそのままコピーすることに主に使っています。
このほか、私が現在のところ使っているプラグインとアプリの SDL Trados Studio 2019 への対応状況は以下のとおりです。
Comment View Plugin :対応済み
コメントを Excel ファイルに書き出すプラグインです。
紹介記事: 変更履歴は本当に必要?
Community Advanced Display Filter :対応済み
「高度な表示フィルタ」をさらに強化するプラグインです。
紹介記事: ■プラグイン■ フィルタで繰り返しを除外する
SDLTMExport :対応済み
メモリを sdltm ファイルからテキスト ファイルに変換するアプリです。複数のメモリをまとめて変換できるので便利です。私は、このツールで変換したテキスト ファイルを xbench に読み込んで使います。
PackageReader :未対応 (でも、おそらく大丈夫?)
パッケージの中のファイルを一覧するアプリです。明確にサポートされているのは 2015 までですが、現在の 2017 でも動いているので、おそらく大丈夫だろうと思っています。
紹介記事: パッケージの中身を見たい!!
SegmentSearcher :未対応
別画面で検索をしてくれるプラグインです。Regex Match AutoSuggest Provider と同じ作成者のものなので、近々対応してくれることを期待しています。
紹介記事: 変更履歴は本当に必要?
こんな感じです。おそらく、SegmentSearcher だけは使えなくなりそうですが、このプラグインはどうしてもというものでもないので少し気長に待ちます。
なお、SDL AppStore では、購入していないバージョンのプラグインやアプリはダウンロードできません。ですので、私もまだいずれもダウンロードできず、実際には試していません。(2019 の試用版を入れたらダウンロードできるかもしれないですが、すみません、そこまで試していません。)
今回の記事は以上です。 プラグインの対応で 2019 を導入しない大きな理由はなくなりましたが、どうしようかまだ悩んでいます。導入しない大きな理由はないけど、導入する大きな理由もない、、、
あと 1 つの懸念は、 以前の記事 に書いたメモリのアップグレードが必要になる問題です。いっそのこと 2019 にしてしまえば解決!なんてことにはならないですかね〜。だったら、導入します。余計にひどくなるってことはないですよね!?
Regex Match AutoSuggest Provider が 2019 に対応していた!
私は、先日になって初めて気付いたのですが、実は、もっと以前から対応していたでしょうか。このプラグインについては、以前の記事「 ■プラグイン■ 原文にある英数字を訳文にコピーする (日⇒英の場合) 」で紹介しました。簡単に言うと、AutoSuggest 機能を自作の正規表現を使って強化できるものです。私は、複雑な正規表現を書くのは少し苦手なので、上記の記事で紹介したとおり、原文の英数字をそのままコピーすることに主に使っています。
このほか、私が現在のところ使っているプラグインとアプリの SDL Trados Studio 2019 への対応状況は以下のとおりです。
Comment View Plugin :対応済み
コメントを Excel ファイルに書き出すプラグインです。
紹介記事: 変更履歴は本当に必要?
Community Advanced Display Filter :対応済み
「高度な表示フィルタ」をさらに強化するプラグインです。
紹介記事: ■プラグイン■ フィルタで繰り返しを除外する
SDLTMExport :対応済み
メモリを sdltm ファイルからテキスト ファイルに変換するアプリです。複数のメモリをまとめて変換できるので便利です。私は、このツールで変換したテキスト ファイルを xbench に読み込んで使います。
PackageReader :未対応 (でも、おそらく大丈夫?)
パッケージの中のファイルを一覧するアプリです。明確にサポートされているのは 2015 までですが、現在の 2017 でも動いているので、おそらく大丈夫だろうと思っています。
紹介記事: パッケージの中身を見たい!!
SegmentSearcher :未対応
別画面で検索をしてくれるプラグインです。Regex Match AutoSuggest Provider と同じ作成者のものなので、近々対応してくれることを期待しています。
紹介記事: 変更履歴は本当に必要?
こんな感じです。おそらく、SegmentSearcher だけは使えなくなりそうですが、このプラグインはどうしてもというものでもないので少し気長に待ちます。
なお、SDL AppStore では、購入していないバージョンのプラグインやアプリはダウンロードできません。ですので、私もまだいずれもダウンロードできず、実際には試していません。(2019 の試用版を入れたらダウンロードできるかもしれないですが、すみません、そこまで試していません。)
今回の記事は以上です。 プラグインの対応で 2019 を導入しない大きな理由はなくなりましたが、どうしようかまだ悩んでいます。導入しない大きな理由はないけど、導入する大きな理由もない、、、
あと 1 つの懸念は、 以前の記事 に書いたメモリのアップグレードが必要になる問題です。いっそのこと 2019 にしてしまえば解決!なんてことにはならないですかね〜。だったら、導入します。余計にひどくなるってことはないですよね!?
タグ: 2019
プラグイン
バージョン
アプリ
Regex Match AutoSuggest Provider
SegmentSearcher
PackageReader
SDLTMExport
Community Advanced Display Filter
Comment View Plugin
AppStore
Tweet
2019年01月30日
エディタ上のフォントを変える
前回のメモリの問題
はまだ直らないのですが、とりあえず今回は別の話題の記事を書きたいと思います。メモリについては、新しいプロジェクトで仕事が始まったときにまた考えてみます。
今回は、エディタ上のフォントについてです。Trados のエディタ上のフォントを見やすいものに変更しようと思って私はかなり悩んだことがあります。悩んで解決できればよかったのですが、結局、無理そうだなぁということがわかっただけでした。現在のところの私の理解としては、パッケージを受け取る翻訳者は Trados の仕様と諦めるしかなく、可能性のある解決策としてはパッケージを作る翻訳会社さん頼み、という感じです。
Trados では、フォントに関する設定がいくつかあります。
[ファイル > オプション] と [プロジェクトの設定] の違いなどについては、以前の記事「 Trados の設定を変えるには − [ファイル] と [プロジェクトの設定] 」をご覧ください。
上記 3 つの設定の機能を簡単にまとめると、以下のようになります。
設定の場所: [ファイル > オプション] の [エディタ] > [フォントの調整] > [ユーザー設定の言語フォント]
エディタ上のフォントを変えたい場合、まず設定するのは?@「ユーザー設定の言語フォント」です。上図の 2 つのドロップダウンリストで、言語(「Japanese (Japan)」や「English (United States)」)と、それぞれのフォントを設定します。
ちなみにこのドロップダウンリストですが、私の環境では最初の表示が必ず「Bislama」という言語 (おそらく、アルファベット順で最初にくる言語) になります。日本語や英語のフォントを設定しても、とにかく最初は Bislama です。私は設定がうまくできていないのではないかと思って何回も設定を繰り返してしまいました。Bislama が表示されても、[言語] リストから言語を選択して、[フォント]リストに、設定したフォントが表示されてくれば大丈夫です。設定されています。
設定の場所: [ファイル > オプション] の [エディタ] > [並列型エディタ] > [書式の表示スタイル]
?@「ユーザー設定の言語フォント」を設定しても、エディタ上のフォントが変わらないことがあります。それは、?A「書式の表示スタイル」が原因です。
?A「書式の表示スタイル」には、上図のように 3 つのオプションがあります。?@で設定したフォントを有効にするには「 書式を表示せずにタグを表示する」にする必要があります。3 つのオプションの文言をよ〜く読んでみるとわかりますが、「書式を表示する」にしたら、当然既定のフォントは使われないので、「書式を表示しない」にする必要があります。
理屈はわかります。タグで設定されている書式が優先という仕様はもっともです。でも、日英翻訳の場合、P明朝などの日本語フォントで表示される英文はとにかく読みにくいのです!!
私は、普段は「 書式を表示せずにタグを表示する」を使用しています。これなら、?@「ユーザー設定の言語フォント」で設定したフォントが使われます。でも、カラフルな文字が並ぶ PowerPoint や、一部のセルだけ太字になっている Excel など、書式が重要な場合はどうしても「 すべての書式とタグを表示する」にする必要があります。そしてこのオプションでは、原文で日本語フォントが設定されていると英文にもそれが適用されてしまうので、ものすごく読みにくいフォントで英文を編集することになります。
設定の場所: [プロジェクトの設定] の [ファイルの種類] > [<該当の種類>] > [フォント マッピング]
なんとかならないかと思って試した設定が「ファイルの種類」から設定する?B「フォント マッピング」です。結論からいうと、これはエディタ上のフォントには影響しません。この設定を変えても、エディタ上のフォントは変わりません。
では、この設定は何なのかというと、訳文生成や外部プログラムでプレビューするときなどに影響するようです。つまり、?B「フォント マッピング」を設定すれば、「 訳文のみで保存 」(Shift+F12) や「 訳文の表示 」(Ctrl+Shift+P) で表示される訳文のフォントが変わります。
ただ、複数のフォントが使われている場合、すべてのフォントを設定するのは面倒です。「All Fonts」という設定もありますが、これにすると余計なところまでマッピングが適用されてしまうことがあります。
さらに、この設定は「プロジェクトの設定」の「ファイルの種類」から行いますが、「ファイルの種類」の中の設定は翻訳会社さんが既に何らかの設定を行っている可能性があります。そして、まだ Studio になる前の 2007 の頃の話ですが、この辺りの設定を翻訳者側で勝手に変えると訳文生成ができなくなるという苦〜い経験があり、パッケージを受け取って作業するようになった今でもなんとなく恐ろしいので、私はこの辺りの設定はさわらないようにしています。( QuickInsert だけはさわります。)
というわけで、設定も面倒だし、動きもよくわからないし、何か問題があっても困るし、という感じで、パッケージを受け取って作業する場合、?B「フォント マッピング」の使用はあまり現実的ではありません (と、私は考えています)。
ここまで長々と書いてきましたが、エディタ上で日本語フォントが適用されてしまうこの現象は、実は、すべてのファイルで発生するわけではありません。Office 文書の場合、たいていは、1 つの文書の中で日本語用フォントと英数字用フォントが別々に設定されています。きちんと別々に設定されていれば、?A「書式の表示スタイル」を「 すべての書式とタグを表示する」にしても、エディタ上で英文に日本語フォントが適用されることはなく、ちゃんと見やすい表示になります。
ただ、日本語で文書を書く方は、英数字にも日本語フォントを設定している場合があります。Word の場合はともかく、Excel の場合は、フォントの設定が少し面倒なので ※1 、すべてが日本語フォントになっているケースがかなりの頻度であります。
翻訳会社さんは、最終的に訳文をお客様に納品するときにはおそらくフォントを変えるでしょうから、パッケージを作る前に、原文に英数字用フォントをちょっと設定してくれればいいのに〜と思ってしまいます。もちろん、複数のフォントがあったら手間がかかるかもしれないし、一刻も早くファイルを渡したいとか、後で一括で処理した方が効率的とか、いろいろ事情はあると思います。でも、翻訳者がどのような環境で作業することになるのか、ちょっと考えてもらえるととても助かるんですよね。きっと、見やすさの面だけでなく、翻訳者の精神安定の面からも品質に影響があると思います (_ _)
※1: Excel の場合、日本語と英数字で別々のフォントを設定するには「テーマ」を使う必要があります。でも、Excel で作られている文書は、たいてい社内向けの仕様書などなので、「テーマ」まで使って体裁が整えられていることはあまりない気がします。
今回は、エディタ上のフォントについてです。Trados のエディタ上のフォントを見やすいものに変更しようと思って私はかなり悩んだことがあります。悩んで解決できればよかったのですが、結局、無理そうだなぁということがわかっただけでした。現在のところの私の理解としては、パッケージを受け取る翻訳者は Trados の仕様と諦めるしかなく、可能性のある解決策としてはパッケージを作る翻訳会社さん頼み、という感じです。
Trados では、フォントに関する設定がいくつかあります。
- ?@ [ファイル > オプション] の
[エディタ] > [フォントの調整] > [ ユーザー設定の言語フォント] - ?A [ファイル > オプション] の
[エディタ] > [並列型エディタ] > [ 書式の表示スタイル] - ?B [プロジェクトの設定] の
[ファイルの種類] > [<該当の種類>] > [ フォント マッピング]
[ファイル > オプション] と [プロジェクトの設定] の違いなどについては、以前の記事「 Trados の設定を変えるには − [ファイル] と [プロジェクトの設定] 」をご覧ください。
上記 3 つの設定の機能を簡単にまとめると、以下のようになります。
- エディタ上のフォントは、 ?@「ユーザー設定の言語フォント」で設定できる。
- ただし、?@の設定を有効にするには、 ?A「書式の表示スタイル」を「書式を表示せずにタグを表示する」にする必要がある。
- ?B「フォント マッピング」はエディタ上のフォントには影響しない。
まずは、?@「ユーザー設定の言語フォント」を設定する
設定の場所: [ファイル > オプション] の [エディタ] > [フォントの調整] > [ユーザー設定の言語フォント]
エディタ上のフォントを変えたい場合、まず設定するのは?@「ユーザー設定の言語フォント」です。上図の 2 つのドロップダウンリストで、言語(「Japanese (Japan)」や「English (United States)」)と、それぞれのフォントを設定します。
ちなみにこのドロップダウンリストですが、私の環境では最初の表示が必ず「Bislama」という言語 (おそらく、アルファベット順で最初にくる言語) になります。日本語や英語のフォントを設定しても、とにかく最初は Bislama です。私は設定がうまくできていないのではないかと思って何回も設定を繰り返してしまいました。Bislama が表示されても、[言語] リストから言語を選択して、[フォント]リストに、設定したフォントが表示されてくれば大丈夫です。設定されています。
?A「書式の表示スタイル」を変える必要がある
設定の場所: [ファイル > オプション] の [エディタ] > [並列型エディタ] > [書式の表示スタイル]
?@「ユーザー設定の言語フォント」を設定しても、エディタ上のフォントが変わらないことがあります。それは、?A「書式の表示スタイル」が原因です。
?A「書式の表示スタイル」には、上図のように 3 つのオプションがあります。?@で設定したフォントを有効にするには「 書式を表示せずにタグを表示する」にする必要があります。3 つのオプションの文言をよ〜く読んでみるとわかりますが、「書式を表示する」にしたら、当然既定のフォントは使われないので、「書式を表示しない」にする必要があります。
理屈はわかります。タグで設定されている書式が優先という仕様はもっともです。でも、日英翻訳の場合、P明朝などの日本語フォントで表示される英文はとにかく読みにくいのです!!
私は、普段は「 書式を表示せずにタグを表示する」を使用しています。これなら、?@「ユーザー設定の言語フォント」で設定したフォントが使われます。でも、カラフルな文字が並ぶ PowerPoint や、一部のセルだけ太字になっている Excel など、書式が重要な場合はどうしても「 すべての書式とタグを表示する」にする必要があります。そしてこのオプションでは、原文で日本語フォントが設定されていると英文にもそれが適用されてしまうので、ものすごく読みにくいフォントで英文を編集することになります。
?B「フォント マッピング」はエディタ上のフォントには影響しない
設定の場所: [プロジェクトの設定] の [ファイルの種類] > [<該当の種類>] > [フォント マッピング]
なんとかならないかと思って試した設定が「ファイルの種類」から設定する?B「フォント マッピング」です。結論からいうと、これはエディタ上のフォントには影響しません。この設定を変えても、エディタ上のフォントは変わりません。
では、この設定は何なのかというと、訳文生成や外部プログラムでプレビューするときなどに影響するようです。つまり、?B「フォント マッピング」を設定すれば、「 訳文のみで保存 」(Shift+F12) や「 訳文の表示 」(Ctrl+Shift+P) で表示される訳文のフォントが変わります。
ただ、複数のフォントが使われている場合、すべてのフォントを設定するのは面倒です。「All Fonts」という設定もありますが、これにすると余計なところまでマッピングが適用されてしまうことがあります。
さらに、この設定は「プロジェクトの設定」の「ファイルの種類」から行いますが、「ファイルの種類」の中の設定は翻訳会社さんが既に何らかの設定を行っている可能性があります。そして、まだ Studio になる前の 2007 の頃の話ですが、この辺りの設定を翻訳者側で勝手に変えると訳文生成ができなくなるという苦〜い経験があり、パッケージを受け取って作業するようになった今でもなんとなく恐ろしいので、私はこの辺りの設定はさわらないようにしています。( QuickInsert だけはさわります。)
というわけで、設定も面倒だし、動きもよくわからないし、何か問題があっても困るし、という感じで、パッケージを受け取って作業する場合、?B「フォント マッピング」の使用はあまり現実的ではありません (と、私は考えています)。
結局は、翻訳会社さんでの前処理頼み
ここまで長々と書いてきましたが、エディタ上で日本語フォントが適用されてしまうこの現象は、実は、すべてのファイルで発生するわけではありません。Office 文書の場合、たいていは、1 つの文書の中で日本語用フォントと英数字用フォントが別々に設定されています。きちんと別々に設定されていれば、?A「書式の表示スタイル」を「 すべての書式とタグを表示する」にしても、エディタ上で英文に日本語フォントが適用されることはなく、ちゃんと見やすい表示になります。
ただ、日本語で文書を書く方は、英数字にも日本語フォントを設定している場合があります。Word の場合はともかく、Excel の場合は、フォントの設定が少し面倒なので ※1 、すべてが日本語フォントになっているケースがかなりの頻度であります。
翻訳会社さんは、最終的に訳文をお客様に納品するときにはおそらくフォントを変えるでしょうから、パッケージを作る前に、原文に英数字用フォントをちょっと設定してくれればいいのに〜と思ってしまいます。もちろん、複数のフォントがあったら手間がかかるかもしれないし、一刻も早くファイルを渡したいとか、後で一括で処理した方が効率的とか、いろいろ事情はあると思います。でも、翻訳者がどのような環境で作業することになるのか、ちょっと考えてもらえるととても助かるんですよね。きっと、見やすさの面だけでなく、翻訳者の精神安定の面からも品質に影響があると思います (_ _)
※1: Excel の場合、日本語と英数字で別々のフォントを設定するには「テーマ」を使う必要があります。でも、Excel で作られている文書は、たいてい社内向けの仕様書などなので、「テーマ」まで使って体裁が整えられていることはあまりない気がします。
タグ: [ファイル] からの設定
プロジェクトの設定
すべての書式とタグを表示する
書式を表示せずにタグを表示する
書式の表示スタイル
フォント マッピング
ユーザー設定の言語フォント
トラブルシューティング
Tweet
2019年01月20日
【続報】作業中にメモリのアップグレードが突然必要になる
前回の記事で メモリのアップグレードが突然必要になるという現象を紹介
しました。作業を始める時点でアップグレードの警告マークはなかったのに、作業を進めていたらいつのまにか警告マークが表示されていた、という現象です。対訳がたまったことが原因なのか、それともほかに原因があるのかよくわからないのですが、アップグレードをしてそのまま作業を続けていたら、さらに困ったことに。
いったんアップグレードしても、またいつのまにか警告マークが表示されている!!
よく考えたら、今回のプロジェクトは 2017 を更新して初めてのものでした。
上図のとおり、現在のバージョンは SDL Trados Studio 2017 SR1 - 14.1.10015.44945 で、これは SDL Trados Studio 2017 SR1 CU15に相当するものです。この 「CU15」は、SDL いわく「SDL Trados Studio 2019と同じ強化されたTM」を使えるバージョンです。詳しくは、SDL のこちらのブログ「 SDL Trados Studio 2019 SR1で強化された翻訳メモリの使用方法 」をご覧ください。
で、原因はおそらくこのあたりかなぁと。でも、今回のメモリは翻訳会社さんからもらったパッケージに含まれていたもので、その翻訳会社さんがどのバージョンを使っているのかはわかりません。まぁ、わかったところでどうしようもないんですけど。
このメモリに限ったことなのか、ほかでも今回の現象になるのか、最初が空メモリでなければいいのか、英日か日英かが関係するのか、などなど検証してみないといけないとは思うのですが、幸いにというか、私個人的にはしばらくオンサイトの仕事になるので自宅の Trados は使わない予定です。その間に、なんか直ってた!なんてことにはならないですかねぇ。
Tweet
いったんアップグレードしても、またいつのまにか警告マークが表示されている!!
よく考えたら、今回のプロジェクトは 2017 を更新して初めてのものでした。
上図のとおり、現在のバージョンは SDL Trados Studio 2017 SR1 - 14.1.10015.44945 で、これは SDL Trados Studio 2017 SR1 CU15に相当するものです。この 「CU15」は、SDL いわく「SDL Trados Studio 2019と同じ強化されたTM」を使えるバージョンです。詳しくは、SDL のこちらのブログ「 SDL Trados Studio 2019 SR1で強化された翻訳メモリの使用方法 」をご覧ください。
で、原因はおそらくこのあたりかなぁと。でも、今回のメモリは翻訳会社さんからもらったパッケージに含まれていたもので、その翻訳会社さんがどのバージョンを使っているのかはわかりません。まぁ、わかったところでどうしようもないんですけど。
このメモリに限ったことなのか、ほかでも今回の現象になるのか、最初が空メモリでなければいいのか、英日か日英かが関係するのか、などなど検証してみないといけないとは思うのですが、幸いにというか、私個人的にはしばらくオンサイトの仕事になるので自宅の Trados は使わない予定です。その間に、なんか直ってた!なんてことにはならないですかねぇ。
Tweet
2019年01月17日
作業中にメモリのアップグレードが突然必要になる
2017 以降の Trados Studio でメモリのアップグレードが必要になるケースについては、 SDL の公式ブログでも説明
されていますし、私の記事「 メモリを 2017 SR1 用にアップグレードする
」でも取り上げました。
アップグレードが必要になるのは、古いバージョンで作られたメモリを使うときだけかと思っていたのですが、どうもそうではなさそうです!! 実は、
空メモリから作業を始めた場合、ある程度の対訳がたまるとメモリのアップグレードが必要になる
ようです。あくまで私の経験からの話です。対訳がたまったことが原因なのか、私が途中で何かの設定を触ってしまったのか、よくはわからないのですが。
私がぶちあたった現象の経緯を説明します。英日の新規翻訳で 2 万ワードと、私としてはかなり大きめのプロジェクトでした。
もう、びっくりです。いつから警告マークが表示されていたのかはわかりません。警告マークが表示されていたのは「プロジェクトの設定」のメモリ設定画面です。エディタ ビューは、もしかしたら開きっぱなしだったかもしれませんが、警告マークは表示されていませんでした。
■ [プロジェクトの設定] > [言語ペア] > [翻訳メモリと自動翻訳] のメモリ設定画面に警告マークが表示された。
■ エディタには、以下のような警告は表示されなかった。
ここからは、私の推測ですが。
新規の空メモリの場合、 下図のように、[翻訳メモリの設定] 画面 (プロジェクトの設定画面から各メモリを選択して [設定] をクリックすると表示される) の [ フラグメント整合ステータス] はオフに設定され、オンはグレーアウトで無効になっています (つまり、変更できない状態です)。これが、今回の警告マークが表示されていたときは「設定はオフだけれども、オンも有効になっていて変更できる状態」でした。メモリのアップグレードをすると、この設定は自動的にオンに変わります。
おそらく、対訳がある程度たまってくるとオンに変更できるようになり、「オンに変更できるけれども、まだ変更していない状態」だと警告マークが表示される、という感じなのかと。
この設定が何にどう影響するのかとか、パッケージを作った翻訳会社さんはおそらく 2017 を使っているのになぜ?とか、自分で作ったメモリのときは大丈夫なのかとか、毎回こんなことになっていたらさすがに気付くと思うので「対訳がたまる」以外に何か原因があったのかとか、いろいろ疑問は残りますが、考えてもよくわかりません。とにかく、最初の時点でメモリに警告マークがなかったとしても、作業中にヒットが少ないなぁと感じたら、警告マークがないかを確認してみる必要がありそうです。
※※※ 追記 2019/01/17 ※※※
すみません、この記事を書いている時点では「対訳がたまったこと」が原因だろうと思っていたのですが、一晩寝て改めて考えると、まさかそんなことはないかとも思えてきて、少し文を修正しました。空のメモリから作業することはよくありますが、毎回こんな現象が発生していたわけではないような気がします。
Tweet
アップグレードが必要になるのは、古いバージョンで作られたメモリを使うときだけかと思っていたのですが、どうもそうではなさそうです!! 実は、
空メモリから作業を始めた場合、ある程度の対訳がたまるとメモリのアップグレードが必要になる
ようです。あくまで私の経験からの話です。対訳がたまったことが原因なのか、私が途中で何かの設定を触ってしまったのか、よくはわからないのですが。
私がぶちあたった現象の経緯を説明します。英日の新規翻訳で 2 万ワードと、私としてはかなり大きめのプロジェクトでした。
- 翻訳会社さんから、新規メモリ (空のメモリ) が設定されたパッケージを受け取った。
- メモリにアップグレードの警告マークは表示されていなかったので、そのまま作業を始めた。
- 1 週間ほど作業した後に、どうもメモリがヒットしてこないような気がしたので、メモリの設定を確認すると、アップグレードの警告マークが表示されていた!!
- アップグレードをしたら、警告マークは消え、メモリもヒットしてくるようになった。
もう、びっくりです。いつから警告マークが表示されていたのかはわかりません。警告マークが表示されていたのは「プロジェクトの設定」のメモリ設定画面です。エディタ ビューは、もしかしたら開きっぱなしだったかもしれませんが、警告マークは表示されていませんでした。
■ [プロジェクトの設定] > [言語ペア] > [翻訳メモリと自動翻訳] のメモリ設定画面に警告マークが表示された。
■ エディタには、以下のような警告は表示されなかった。
ここからは、私の推測ですが。
新規の空メモリの場合、 下図のように、[翻訳メモリの設定] 画面 (プロジェクトの設定画面から各メモリを選択して [設定] をクリックすると表示される) の [ フラグメント整合ステータス] はオフに設定され、オンはグレーアウトで無効になっています (つまり、変更できない状態です)。これが、今回の警告マークが表示されていたときは「設定はオフだけれども、オンも有効になっていて変更できる状態」でした。メモリのアップグレードをすると、この設定は自動的にオンに変わります。
おそらく、対訳がある程度たまってくるとオンに変更できるようになり、「オンに変更できるけれども、まだ変更していない状態」だと警告マークが表示される、という感じなのかと。
この設定が何にどう影響するのかとか、パッケージを作った翻訳会社さんはおそらく 2017 を使っているのになぜ?とか、自分で作ったメモリのときは大丈夫なのかとか、毎回こんなことになっていたらさすがに気付くと思うので「対訳がたまる」以外に何か原因があったのかとか、いろいろ疑問は残りますが、考えてもよくわかりません。とにかく、最初の時点でメモリに警告マークがなかったとしても、作業中にヒットが少ないなぁと感じたら、警告マークがないかを確認してみる必要がありそうです。
※※※ 追記 2019/01/17 ※※※
すみません、この記事を書いている時点では「対訳がたまったこと」が原因だろうと思っていたのですが、一晩寝て改めて考えると、まさかそんなことはないかとも思えてきて、少し文を修正しました。空のメモリから作業することはよくありますが、毎回こんな現象が発生していたわけではないような気がします。
Tweet
2019年01月08日
CAT ツール比較:繰り返しの自動入力
最近、各種の CAT ツールを日替わりで使うような状態になることがよくありますが、私はこうした状態にかなりのストレスを感じてしまいます。どの CAT ツールも基本的な機能はあまり変わりませんが、細かいところはいろいろ違いがあります。作業を効率良く進めるにはその細かいところの活用こそが重要だったりするわけですが、これがなかなかうまくいかず、ストレスばかりが増していきます。
今回は、同じ文が繰り返し登場する場合に訳文を自動で入力してくれる機能についてまとめてみたいと思います。たいていの CAT ツールにはこの機能が備わっていますが、機能の名称も内容もさまざまです。自動で入力してくれる機能はありがたいですが、なにせ「自動」なので、うっかりしていると、訳し分けしていたところが変更されてしまったり、逆に、変更されていると思っていたところが変更されていなかったりと危ない目にあうことがあります。
この記事では、最近私がよく使っている、Trados、Memsource、memoQ の 3 つを比較します。よく使っているといっても、Trados 以外の 2 つのツールは翻訳会社さんから提供されるライセンスで作業しています。このため、使用できる機能が限られていますし、細かいところまでは理解できていないような気もしています。もしご指摘がございましたら、どうぞご連絡ください。
Trados — 細かい設定はできるが...
・機能の名称:自動反映
・設定の場所:[ファイル] > [オプション] > [エディタ] > [自動反映]
設定項目の多さでは、Trados が一番です。私は、基本的には上記のような設定で作業しています。これが、最も「モレなく反映し」かつ「意図しない反映を防げる」設定かと思います。
確定済みの分節に 100% 一致を自動反映させる
既に訳してしまった分節にも後から自動反映を適用するかどうかの設定です。作業を進めていると、途中で訳文を変えたくなることはよくあるので、私は確定済みの分節にも反映が適用されるようにしています。
開始する位置
[ 文書内の最初の分節] と [ 文書内の次の分節] のいずれかを選択します。自動反映をエディタの一番上から適用するか、現在のカーソル位置の下だけに適用するかの設定です。これも、途中で訳文を変えることを考慮して、私は「最初の分節」からにしています。
ちなみにこの UI の文言は「文書」となっていますが、エディタに複数の文書 (ファイル) をまとめて開いていると、開いている文書すべてに自動反映が適用されます。現在カーソルがある「文書」だけに適用されるわけではありません。
ユーザーへの確認メッセージ
自動反映を適用するときに、確認のダイアログ ボックスを表示するかどうかの設定です。私は、安全のため [ 常に確認] を選択しています。毎回確認されるのは少々面倒ではありますが、訳し分けをするには必要な機能です。一気に反映したい場合は、表示されたダイアログ ボックス上で [ すべて] をクリックします。(まあ、たいていは [すべて] をクリックすることになります。)
Memsource — 細かい設定はないが、便利!
・機能の名称:繰り返しの自動入力
・設置の場所:[設定] > [CAT]
設定は、[ 繰り返しの自動入力] のオン/オフしかありません。なんともシンプルです。実際にどのような動作になるかというと、現在のカーソル位置より下にのみ自動入力が適用されます。途中で訳文を変えた場合、さかのぼって自動入力を適用することはできないので、自分の記憶を頼りに手動で前に戻るしかありません。
「繰り返し」の分節には翻訳前からマークが表示されている
下図の青色の三連下矢印が繰り返しマークです。Trados にこのようなマーキングはありません。Trados では、自動反映を適用した分節にはそのことを示すマークが付きますが、作業する前は何も表示されていません。
このマーキングはとても便利ですが、問題が 1 つあります。それは、初出かどうかがわからないことです。Memsource の場合は、現在のカーソル位置からさかのぼって自動入力を適用することができないので、その繰り返しが初出なのか、そうでないのかがとても重要になってきます。マーキングでこれがわかればとても助かるのですが、残念ながらそうはなっていません。
※※※※※ 2020/03/25 追記 ※※※※※※※※※※※※※※※※※※※※※※※※※※※
最近アップデートで、初出かどうかがわかるようにマークが変わっていました!
これは、とても便利です。Trados さんにも、ぜひ頑張って欲しいところです。
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
「例外」を指定できる
Memsource の機能で私が最も便利だと感じているのは、自動入力の「例外」を設定できることです。これができるのは、今回の 3 つのツールの中では Memsource だけです。
繰り返しのマークをクリックして「例外」とすると、上図のように斜線が表示されて例外であることが示されます。「例外」にしておくと、後から自動入力を行っても、その分節は自動入力の対象とならず、訳文が変更されることがありません。訳し分けをしたいときにとても便利な機能です。
memoQ — 多少の設定はあるけど、危険!?
・機能の名称:自動伝播
・設定の場所:[翻訳] > [翻訳設定] > [自動伝播]
最後に、memoQ です。ある程度は設定もできますし、繰り返しのマーキングもあります。(ただ、マーキングは、Memsource と同様、初出かどうかの区別はありません。)
訳し分けが難しく、危険
memoQ は訳し分けをする場合にはとても不便です。Trados のように、ダイアログ ボックスで確認してくれる機能はありません。また、Memsource のように例外を設定することもできません。自動伝播を許可している限り、自動で適用されてしまうので少々危険です。
私は、memoQ を初めて使ったときはこのことに気付かず、訳し分けをしたくて訳文を何回も入力してしまった記憶があります。最近の私の対処方法としては、最初に [ 前方と後方に伝播] を選択してとりあえず最後まで訳文を入力し、その後 [ 後方にのみ伝播] に変えて、文書の最初から見直しをするようにしています。この見直しの段階で、訳し分けが必要な部分は自分の記憶と繰り返しのマークを頼りになんとか頑張ります。
3 つのツールの比較は以上です。翻訳の段階でいろいろ苦労して訳し分けしておいても、レビューの段階でサラッと全体を変更される、という可能性もなくはないですが、それはあまり考えないことにしています。
おまけ — 繰り返しは 0 円??
翻訳会社さんからお仕事を依頼される場合、自動処理の対象となる繰り返しの分節はたいていレートが低く設定されています。それでも、0% でない限り、私からレートについて抗議することはあまりありません。作業後に、割に合わなかったなぁと感じるケースも多々ありますが、面倒さが先に立ち、ついついそのままにしてしまいます。
ただ、これまでに 1 社だけ、0% と設定してくる翻訳会社さんがありました。この会社さんには強弱混ぜて 3 回くらい抗議しましたが、だめでした (T-T)。仕方ないので、この翻訳会社さんのときは繰り返しのことは一切考えずに作業することにしました。いろいろと設定を変えることすら面倒なので、とにかくあまり考えず作業負担が最も少ない状態で作業します。結果としては、訳し分けはもちろん、統一もされていない状態になります (が、0 円なので仕方ないですよね)。
おそらく、この翻訳会社さんは、レビューの段階で統一や訳し分けの対応をしているのだと思います。確かに、翻訳の段階ではなく、レビューの段階でまとめて作業した方が効率的なのかもしれません。でも、0 円はないですよね〜。一応、訳文を入力しますし。Trados なんて、自動反映の処理は相当な時間を待たされることもあります。もし、事前にロックしてあって訳文を入力する必要もない、というなら 0 円でも納得です。
Tweet
2019年01月03日
2019 年も始まりました
明けましておめでとうございます。
このブログを始めてから 1 年余りが経ちました。Trados は長年使っていたので何か書いてみたいと以前からなんとなく思っていたのですが、実際はなかなか難しいものでした。書き始めてみると、自分の記憶が間違っていることに気付いたり、Trados の動きが想定外だったり、さらには取引先の翻訳会社のことを考えてみたり、といろいろ大変でした (;。;)
書いておきたいこと、調べてみたいことはまだまだたくさんあります。Trados に限らず、さまざまな CAT ツールは、どちらかというと翻訳を依頼する側の顧客企業や翻訳会社にとっての利点が目立ちますが、個人翻訳者もなんとかツールの恩恵にあずかれるよう頑張っていきたいと考えています。
今後、書いてみたいと思っているトピックはこんな感じです。
バージョンによるワード数 (文字数) の違い
用語集の表示やその設定
用語集の作成、Glossary Converter の使用
(マイクロソフトの用語集を加工してみたいと思います。)
英日・日英が混在するプロジェクト (AnyTM の使い方)
100% マッチの動き
繰り返しの自動反映の動き
QA Checker の使い方 (正規表現を使わなくてもできること)
正規表現 (やっぱり、避けては通れない...)
メモリの細かい設定 (自動認識、変数、単位に空白、などなど)
プレビュー機能
Trados ってホントに不可解な、いやッ、すばらしい機能が満載です!
実はこのブログを始めるときは、アフィリエイトで副収入があったらいいなぁとよこしまなことを考えていました。毎月ちょっといいランチぐらいなら食べられる?!と皮算用をしていたのですが、実際は年間の総額でワンコインにも満たず... (コインの種類はご想像におまかせします。)
まあ、めげずに今年も頑張って続けていきます。皆さまからのご意見・ご感想も大歓迎ですので、どうぞよろしくお願い致します。
Tweet