【前編】マイクロソフトの用語集を使いたい



さて今回は、マイクロソフトから提供されている用語集を Trados で使う方法を紹介したいと思います。この用語集はとても便利ですが、とにかくデータ量が多いので Trados で効果的に使うには少し工夫が必要です。私はずいぶん昔から試行錯誤していたんですが、最近ようやく、Glossary Converter を使ったら便利かもしれないということに思いあたりました。今回は、Glossary Converter のマージ機能を使った方法を紹介します。何かもっとこうした方が良いというアドバイスなどありましたら、ぜひぜひお聞かせください。

この記事は「前編」として概要だけ説明します。細かい Glossary Converter の使い方などは 後編

マイクロソフトの用語集

42_1.png



この用語集には、IT 分野で使える用語が大量に入っています。マイクロソフト提供のものですが、製品の UI などは別で提供されていて (おそらく、一般人は無料では手に入らない)、この用語集には一般的な用語のみが格納されています。

各国語のデータが用意されているので、日本語を選択してダウンロードします。ダウンロードされるデータは tbx 形式のファイルです。tbx とは「Term Base eXchange」のことで、用語データに一般的に使われる XML のデータ形式です。この形式は、Multiterm に付属のコンバーターでもサポートされています。


変換に使用するツール: Glossary Converter


42_2.png


tbx 形式の用語集は Multiterm 付属のコンバーターで扱うこともできますが、今回は、SDL App Store から無料でダウンロードできるアプリ「 Glossary Converter 」を使います。これは、Trados Studio に組み込まれるプラグインではなく、Trados Studio の外側で動くアプリです。 (現在は、上記のバージョンより新しいものになっています。)

このツールについては、SDL の公式ブログ「 Glossary Converter – Excelから用語ベースおよびTMXへの変換 」でも紹介されています。参考にしてください。

使い方はとても簡単で、アプリを起動したら、そこにファイルをドラッグ アンド ドロップするだけです。変換したいファイルをドロップすると、後は自動で適当に変換してくれます。実際には、以下の 2 つの処理のいずれかになります。

・用語ベース (sdltb) をドロップ     -->  Excel ファイルなどに変換される。
・用語ベース (sdltb) 以外をドロップ   -->  用語ベース (sdltb) に変換される。

ドロップした元ファイルと同じフォルダーに、同じ名前で拡張子だけが違うファイルが生成されます。同名のファイルが既に存在している場合は、上書きするかどうかを尋ねられるので、必要に応じてファイル名を指定できます。

変換先の形式や細かい変換方法を設定したい場合は、ドロップする前に、[settings] から設定を行います。たいていは何も設定しなくてもうまく変換されます。今回の変換で使う設定については、後編の記事で説明します。

今回の変換で気を付けたこと


今回の変換で私が気を付けたのは、以下の 3 つです。(なんか、どっかのマニュアルみたいですが)


  • 同じ訳語は 1 回だけ表示されるようにする

  • ただし、大文字小文字は区別する

  • 英日と日英のどちらでも使える用語集にする


マイクロソフト提供の用語集は、同じ訳語であっても定義の違うものは別レコードとして登録しているので、単純に変換すると、Trados の用語認識ウィンドウに同じ訳語が何回も表示されてきてしまいます。用語の定義を知りたいときはそうした表示も役立ちますが、実際には、Trados の用語認識ウィンドウに訳語の定義を表示しても読みにくく、あまり効率的ではありません。今回の用語ベースは、あくまで入力補助として使うことを前提に、定義の違いは無視して同じ訳語は 1 回だけ表示されるようにしました。


42_6.PNG



重複を削除するにあたって問題となったのが 2 つ目の大文字小文字の区別です。以前に、「 Excel で重複を削除する方法 」を紹介しましたが、実は、この Excel の「重複の削除」機能は大文字小文字を区別しません。今回のマイクロソフトの用語集では区別できなくても問題ないですが、実際の仕事では、Trados の用語ベースに UI が格納されていることがよくあります。日英翻訳の UI では、一般用語と違って大文字小文字を区別することが必要な場合があるので、今回はそうした用語ベースにも使える方法として Glossary Converter のマージ機能を使ってみることにしました。

Excel で大文字小文字を区別しながら重複を削除する方法も試してみたのですが、私の思い付く限りでは、少し数式を書く必要がありました。その方法は、また次回紹介したいと思います。

最後に、3 つ目の英日と日英のどちらでも使えるようにですが、これはいくつも用語集があると面倒なので、1 つにしたいなあと思っただけです。ただ、これも重複の削除のときに少し注意が必要で、英語の用語が 1 つで日本語の用語が複数の場合と、この逆の場合とが混在していることを意識しておく必要があります。とは言っても、結局、今回の方法にしたら、ほぼ何もしなくてもうまく変換されました。

変換の手順

変換の手順は、こんな感じです。

1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。

2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。

3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。

4. 出力された用語ベース (sdltb) を、英語でマージする。

5. マージした用語ベース (sdltb) を、さらに日本語でマージする。


42_7.GIF


さて、今回は以上です。概要だけで、何も詳しい手順がなくてすみません。書いていたら予想以上に長くなってしまったので、詳しい手順は 後編 で説明したいと思います。



  



最新記事
にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村
 
翻訳ランキング
  翻訳ブログランキング参加中
翻訳ブログ人気ランキング


タグ
検索
ご意見・ご感想

ご意見、ご感想、ご質問をお待ちしております。
こちらから、どうぞお気軽に!

記事一覧
◆パッケージについて
作業前に内容を確認する
作業前に設定を変更する
メモリをアップグレードする (2017 SR1)
格納されているファイルにアクセスする

◆Trados の機能
 表示フィルタ・高度な表示フィルタ
2021 の表示フィルタ
タグの中の検索
プラグイン
プラグイン for 2019
変更履歴
すべてのコンテンツ
 検証機能
全般の設定
QA Checker
QuickInsert
印刷プレビュー
メモリのフィールド
ファイルの解析 ?@
ファイルの解析 ?A
 AutoSggest
ATOK との競合
プラグイン
 ショートカット キー
設定方法
便利なキー
高度な表示フィルタ
変更履歴
繰り返しの自動反映
 upLIFT テクノロジー
フラグメント一致
あいまい一致の自動修正
単語数のカウント
自動置換 > 単位
ジャンプ
用語認識
MultiTerm
変数リスト

◆Trados のバージョン・エディション
2021 SR2 CU9
2021 の新機能
プラグインとアプリの 2021 対応 (2020/08)
2017 SR1 の最近のバグ (2020/05)
プラグインとアプリの 2019 対応 (2019/02)
2019 の新機能
Starter エディション
2017 SR1 の新機能
メモリのアップグレード (2017 SR1)

◆プラグインとアプリ
2024 対応 (2024/08)
フィルタで繰り返しを除外
原文の英数字を訳文にコピー
パッケージの中身を一覧表示
コメントを Excel にエクスポート
選択箇所の検索結果を別画面で一覧表示
メモリをアップグレード
用語集を変換
コメントや変更履歴のユーザー名を変更
sdlxliff ファイルを Excel にエクスポート
Community Advanced Display Filter for 2019
Community Advanced Display Filter
Regex Match AutoSuggest Provider
PackageReader
Comment View Plugin
SegmentSearcher
TM Lifting
Glossary Converter
SDL Batch Anonymizer
Export to Excel

◆トラブルシューティング
QuickInsert の設定が表示されない
QuickInsert が動かない
 訳文生成できない
分節の結合
コメント
表示フィルタのハイライト
ハイパーリンク タグ
 メモリがヒットしてこない
完全一致が登録されていない
検索オプション
言語ペア
サーバー TM
Trados のバージョン
空メモリから作業を始めた場合
単語単位のトークン化
「TM はアップグレードが必要」が消えない
検証の除外設定が効かない
エディタの動きが遅い
エディタが落ちる
ファイルの解析が終わらない
エディタ上のフォントが変わらない
用語が認識されない
同じ用語が何回も表示される
パッケージを正常に開けない

◆翻訳作業に役立つ Tips
タグの中の文字を検索する
複数の分節に分かれている場合の処理
メモリに登録されるユーザー名を変える
自分の訳文用のメモリを作る
Trados の設定を変える
パッケージを別プロジェクトとして開き直す
 訳文を表示する方法
印刷プレビュー
訳文のみで保存
訳文の表示
 単語数・文字数のカウント
解析レポート ?@
解析レポート ?A
単語単位のトークン化
 ショートカット キーを設定する
設定方法
便利なキー
変更履歴を記録する
繰り返しを自動入力する
エディタ上のフォントを変える
1 つの原文に複数の訳文を登録する
単位記号の前にスペースを入れる
英日と日英で同じメモリを使う

◆Trados 以外のツール
 CAT ツール
Memsource
memoQ
 その他のツール
ATOK
   Xbench
変更履歴
使い方【前編】
使い方【後編】
QA Distiller
AutoHotKey
WinMerge
Visual Studio Code
Vale
最新コメント
プロフィール
さくらさんの画像

昔は「Trados さん、頑張って!」とお祈りしながら訳文生成していませんでしたか? 今も、たまにそんな気分になるときがあります。Trados って本当にわからないことばかりです。特に、日本語の情報は少ないですよね。いくら翻訳者とはいえ、日本語の情報が欲しいのです。Trados ユーザーの方々といろいろ情報交換できたらと思っています。




2019年04月27日

この記事へのコメント
コメントを書く

お名前:

メールアドレス:


ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/8755859
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: