翻訳、特に産業翻訳市場は、SDL TRADOS という翻訳支援ツールがほぼデファクトになっているのですが、そんなちんまりと割と保守的な市場に、あのGoogleが無尽蔵のバジェットと潤沢な開発リソースをひっさげて乗り込んできました。翻訳メモリと用語集のエンジンを搭載したオンライン上の翻訳支援ツール Google Translator Toolkit を発表したのです。

実際のツールのホーム:
Google Translator Toolkit

紹介記事:
Translating the world’s information with Google Translator Toolkit

紹介ムービー:

早速使ってみました。

概念はだいたいこんな感じ。

  1. TM (翻訳メモリ) を用意する
    指定しない場合は、インターネット上に公開される共有 TM が使われる。
  2. TD (用語集) を用意する
    指定しない場合は、特に何も起こらない。
  3. 翻訳対象ファイルをアップロードする
    Microsoft OfficeやOpen Officeの形式、HTMLなどに対応している。ユニークなのは、直接Wikipediaの記事を翻訳対象にすることもできること。
  4. 翻訳する
  5. ファイルをそのままオンラインで管理するか、ダウンロードして楽しむ

といったような流れになります。

ではやってみましょう。こんなファイルを用意しました。XMLの仕様書です。適度な文字スタイルや段落書式、ハイパーリンクなどを含んでみました。

使用したサンプルの文書

早速ファイルをアップロード…と思いきや、アップロードするときにTMやTDを指定する必要があるようです。
そこで、いったんファイルのアップロードはキャンセルし、TMを作成します。作成はかんたん。空のTMを作成するときは、ただ名前を指定するだけです。
ちなみに、アップロードする場合は、TMX形式が利用できます。

サンプルTMの作成

次はTD、用語集です。まず、次のようなCSV形式で用語集を用意します。最初の行は見出し行で、ISO形式の言語コードを入力しておきます。

アップロードする用語集

これをアップロードすると、次のように参照できるようになります。

用語集のアップロード結果

さて、これで準備はOK。ファイルをアップロードしたいと思います。

ファイルをアップロードする

無事にアップロードできると、ファイル一覧に表示されます。

ファイル一覧

これをクリックして、翻訳開始です。実際の翻訳画面は、次のような感じ。左に原文、右に訳文。(TM参照のペインを表示してあります)
この左右のペインは、設定で上下に変更することもできます。
既に訳文が入っていますが、これはGoogleの機械翻訳エンジンによるもの。既定で入ります。

翻訳画面

現在選択しているセグメントはツールなどを含んだ枠で囲われて編集できるような表示になります。ここで実際の翻訳を行います。

翻訳のフレーム

ハイパーリンクやスタイルなどは、開始と終了の範囲を表すプレースホルダに置き換えられます。必要に応じて削除したり、適切な位置に挿入して翻訳します。

プレースホルダの表現

訳文は、セグメントを移動した時点でTMに自動的に登録されます。TMが参照された場合は、次のように表示されます。

TM参照の様子

用語集からヒットした用語は、TM参照のペインの別のタブで参照できます。

用語集の参照

また、原文にも強調表示されます。

用語集のヒット

翻訳の経過は、ワード数やパーセンテージでファイル一覧に表示されます。

さて、では翻訳途中ですがとりあえず訳は機械翻訳で全部入っているので、そのまま元のファイル形式でダウンロードしてみましょう。
こんなかんじ。

翻訳結果

いろいろバッチく見えますが、それは日本語のスタイルを定義していなかったので。見出し1などのスタイル自体は維持されています。段落番号も豆腐になっていますが、段落番号スタイル自体は原文と同様についているので、スタイル定義を直すだけで元に戻りました。

まあ公開されたばかりですから、あまりヤイヤイ言っても無粋なだけです。

最初のリリースとして、TM、TD、フィルタなど、ごくごくプリミティブな翻訳支援ツールの要素のみを実装した状態、といった印象を受けました。
今回は一人だけで試したのですが、実際にはGoogle Docsのようによってたかって翻訳できるようです。
そう、今後はこのToolkitは、Google Docsにマージされていくのではないでしょうかね。

何にしても、Googleの力を持ってして翻訳支援ツールの市場に参入されたということが、興味深いです。

新聞に対するブログやWebサイト上のニュースの対比でよく言われるのが、即時性の違いです。新聞は早くても一日2回。対してWebは記事を公開するタイミングで任意です。要するに早いです。

これと同じようなことが、SDL TRADOSとGoogle Translator Toolkitにも当てはまるように思えます。
つまりパッケージ製品 (実際にはダウンロード) であるSDL TRADOSの更新速度は新聞と同じであり、SaaSであるGoogle Translator Toolkitと比べるととても遅いのですよね。

Google Docsやその他のGoogleツールを見ていれば分かるとおり、ライブで日々どんどんと進化していきます。
これは、利用者からするととても刺激的に感じるのです。