2013年4月4日木曜日

Google日本語入力が描くIMEの未来像

新しい記事 以前の記事
2009年12月3日、
Googleは突如「Google日本語入力」を公開した。


発表されたGoogle日本語入力。すでにかなりの話題となっている。
 対応OSは現在のところ、Mac OS X以降ならびにWindows XP以降(64bit版には未対応)。
ダウンロードし、無料で利用できる。

 Google Japan Blogによれば、Google日本語入力は、
有名な20%プロジェクトから生まれたという。


従来の変換エンジンとは異なる発想から生まれたIME 
Google Japan Blogによると、
この日本語入力システムが、従来の発想とは異なるものであると表明されている。



 Web から機械的・自動的に辞書を生成することで、
人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録している。
高い変換精度を実現するために、
Web上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成している。

現在の Webのありのままを反映したインプットメソッドと言えるだろう。
 要するに、ネットからGoogleが集約した膨大なインデックスデータを使用し、
同時に生成された辞書を利用するとされる。

 ローカルディスク上に辞書をファイルを持つ従来のIMEとは異なる発想である。
これまでもネット上で辞書を共有する「Social IME」があった。
これと同様に、ネット上のデータや不特定多数のユーザーの利用履歴を収集し、変換候補を引き出してくる点が面白い。

 今風に言えば「クラウド型」の日本語入力システムと言える。
なお、オフラインの状態でも問題なく利用することができる。


単語や文節単位では軽快だが、文脈の中ではどうか?
数文字入力すると、変換候補が下にリスト表示される。
Tabキーを押すと選択が可能。

 特段、変換精度を意識することなく使えるというのは、IMEにとって重要な意味を持つ。
スペースで変換する点は従来のIMEと変わらないが、数文字打ち込むと下に入力候補が表示される。
Tabキーを押すことで推測変換やサジェスト機能が利用でき、
少ないタイプ数で効率よく文字を打てる。

 ATOK同様に「今日」や「今年」という単語から、
「2009年12月19日」や「平成21年」といった変換結果を得ることもできる。

 タスクマネージャで確認したところ、メモリーの占有率も比較的少ない。
ただ、私は、起動直後ローマ字入力に変換する時になかなか切り変わらず数秒間待たされる事がある。
一度、切り替われば、その後はスムーズに入力できる。

 ただ、既存のIMEに比べ劣る点がないわけではない。

 例えば連文節変換の精度。
ATOKには前後の文脈を参照して、検索候補の優先順位を変える機能が備わっているが、
現在のところGoogle日本語入力には、そのような機能はない。
また、文章の誤用を指摘して修正候補を挙げる校正機能もない。

 逆に言えば、
そういう機能が割愛されている分、軽快に動作しているとも言える。
強みは単語の鮮度と、サジェスト機能精度にあると言えるだろう。
version upで辞書強化されてきた従来のIMEとは基本的に異なる。


その他関連


0 件のコメント:

コメントを投稿

次の投稿 前の投稿 ホーム

Related Posts Plugin for WordPress, Blogger...