輪講 4/7-2

Generation by Inverting a Semantic Parser That uses Statistical Machine Translation

Yuk Wah Wong and Raymond J. Mooney(Department of Computer Sciences The
University of Texas)

NAACL 2007

2本目。このお話は、MR(Meaning representations)という機械に命令をするために用意された言語を自然言語に変換するのにSMT(統計的機械学習)の知識を使ってみましょう、というお話で、MRと自然言語の対訳コーパスがあれば構築できるよう。NAACLのベストペーパーだったらしい。GIZA++を使ってアライメント(対訳の対応関係)を取って、取れたアライメントを用いてSCFG(あるCFGが来たら別のCFGに変換することを可能にするCFGの亜種。CFGのルールのペアがルールになる)を自動生成する、というSMTのお話をベースにしてます。自然言語だと読みやすさを考慮しなければならないので、読みやすさに関するスコアとしてTrigram言語モデルを入れて、読みやすくかつ、MRの意味に即した自然文を生成するということをしてます。

読みやすさに関する手法はSMTで使えるんじゃないんですかね。SMT全然触ってないのでわからないですけど。

ただし、この論文では、いろいろな改良をしているらしく、それでケースによっては15ポイントも性能があがってたりして、SMT関連はまだまだ知られていない知見が沢山あるような予感がします。

いろんな問題を翻訳とみる話は流行ってるのかな。この間も文と圧縮文への変換を翻訳と見ましょうという話があったし。まぁ面白そうではある。