輪講 4/7-1

というわけで、今日から僕が出ている限りの奥村研の輪講および勉強会で紹介された論文を紹介したいと思います。

Emotion Classification Using Massive Examples Extracted from the Web

Ryoko Tokuhisa(Toyota Central R&D Labs), Kentaro inui, Yuji Matsumoto
( Nara Institute of Science and Technology )

Coling 2008

肯定的なのか否定的なのかといった極性を分類する論文は数多くありますが、こちらは楽しい、嬉しい、安心、怖いといった感情を分類するというお話。『雨が降った「から」悲しい』とか『遊園地へ行ったら子供がはしゃいだ「ので」疲れた』といった、感情が発現するに至った現象とその感情を結ぶ手がかりとなる表現から、現象と感情のペアを自動的に作成し、それを用いて学習器を生成するというもの。ん, 「疲れた」は感情じゃないか?

自動で生成されているにしては、そこそこの性能は出ているとも思うが、問題設定に疑問があるかなぁ。

例えば、「遊園地へ行ったら子供がはしゃいだ」ことは「疲れる」と同時に「喜ばしい」ことでもあるので、一つの現象に対し複数の感情が発現する可能性はあるはず。論文中では複数正解のデータセットを作っているので著者も絶対気づいているから、複数正解を許容した手法も提示してほしいかなと思いました。ただ評価方法とかどうやるんでしょうね。F値になるのかな。

あと素性に1~3-gramを使っているということで連続した単語の素性しか見ていないようですけれど、skip bi-gramは効きそう. 「友達の家に遊びに行く」と「友達と渋谷に遊びにいく」は共に「嬉しい」という感情がつきまとうと思うんですが、それだったら「友達」「遊び」というペアが「嬉しい」という感情に結びつきやすいと出力してもおかしくないと思う。

今日からリニューアルしますよっと

久々の更新です。

なんかもう適当に更新することにします。ロジック考えるのもしんどくなってきたし。ホント適当にやります。

もうずいぶん前から正体ばらしてるので、研究室で読んだ論文とかもいろいろ放出していきます。

俺が所属してる奥村研はブログウォッチャーなるサービスを以前提供していたところです。
ブログウォッチャーの会社設立は当時ニュースになりました。今はリクルートの子会社ですねー。まぁ全く被ってないんですけど。


顔写真とらなきゃ。

様々な分野の人と交流することが増えてきた

最近、様々な分野の人と交流することが増えてきた。俺の研究分野でもある自然言語処理の偉い人もそうだし、最近ミログというマイクロブログをやってるんですが、そこで出来た友達だったり。そういう人たちを自分はあんまり記憶に留められてない。

特に頻繁に合う訳でも無い人に対しては、そういう自分を思い出してもらう媒体というものが必要で、それが名刺なんだろうなぁと最近思います。

おそらく、それが名刺である必要性は多分なくって、名刺が過去使われてきて、一般性を有しているからなんだろうなと思う。

例えば、女子高生だとプリクラだったり、大学生だとメールアドレスだったり、そういうものが代替品として機能しているんじゃないかな。

まぁ、ビジネスマンだとそれは名刺なので、名刺を持っていればいいんだけれども、今の俺は会社に所属しているわけじゃないので名刺を持っていません。

個人用名刺でも作ろうかなとか、考えてたりします。どんなの作ると面白いかな。

IPAコーパスが入手可能な場所を探しています。

人力検索にも投げましたが、こちらでも。

以前までは、以下のページで入手可能でしたIPAコーパスが入手できなくなっています。
http://www.ipa.go.jp/STC/NIHONGO/IPAL/ipal.html

どこなら手にはいるかご存じの方いらっしゃいますでしょうか。あるいは、なぜ利用できなくなったかご存じの方はいらっしゃいますでしょうか。

なお、代替のコーパスとして京都コーパス/NAIST Text Corpusがありますが、両者はIPA品詞体系ではなくJUMANによる品詞体系であり、都合上IPA品詞体系のほうが好ましいので、できればIPAコーパスが良いです。

http://q.hatena.ne.jp/1235023300

携帯メール VS それ以外

コミュニティサービスについて色々考えますが、そんなときいつも思うのは携帯電話と携帯メールの特異性です。あれだけなんですよね。メッセージが直接本人に届くサービスって。

いくつか例を挙げてみましょうか。

  • PCメール・・・メールを取りに行かなければなりません
  • mixiなどのSNS・・・ログインしなければなりません
  • Twitterなどのマイクロブログ・・・ログインしなければなりません
  • メッセンジャーなどのIM ・・・ ログインしなければなりません

mixiのメッセージを送ると、携帯メールに通知する機能とかありますが、ああいうの溜まるとウザいですよね。mixiのメッセージくらい滅多に来ないならいいんですが、そうでないと機能を切ってしまう。

あ、でも、Twitterの更新通知するサービス(Twitとか)はその限りではありませんね。ああいうのがどんな携帯でも使えたら、メッセージ届いているのにコミュニティほったらかしという事態を防ぐことが出来るので、コミュニティ系のサービスはもっと広がりを見せるだろうなと思います。

普通にHTTPによる通信を行おうとすると電力消費がヤバくなる(常にメッセンジャーを起動してるとすぐ電池切れるでしょ。あんな感じ)ので、ソケット通信する必要があるのかな?でも待機中でも余計に電力消費しないのかな?

携帯メールはソケット通信なんでしょうかね?