10万ヒットを達成致しました

どうもこんにちは、tomityこと富田です。

先日10万ヒットを達成致しました。

そして何だかんだでRSS購読してくださる方が結構いらっしゃるらしく、[TopHatenar] tomity さんの順位によるとLDRだけで55名もいるそうですね。ありがとうございます。ひえー。恥ずかしい。

さて、いろんなWebサービス(主にTwitterはてな関連とニコ動ですが)についての考察やら、こんなサービスあったらいいんじゃないかとか、基本的に勝手に気ままにやってきましたが、今回の10万ヒットを期に方向性を少し変えたいと思っています。簡単にいうと研究分野とリンクする話をしたり、もっと社会に目を向けたいと思っております。

記事で時々触れていたように、去年の4月から自然言語処理系の研究室に所属しております。そもそも、自然言語とは日常私たちが利用している言語のことであり、プログラム言語と区別する名目で自然言語とこの業界では呼びます。そして、自然言語処理とは、その名前に騙されがちですが自然言語を処理するというだけではなくて、自然言語を解析するステップも含まれます。そして、自然言語を処理したシステムの提案なんかも含まれるんです。要するに、自然言語に関わることが何でもOKの分野と言えば、まあそのとおりです。

そうなると、どこまでが趣味で、どこからが研究なのかという線引きが難しくなります。以前マッシュペディアというのも流行りましたが、取り合えずこうなんじゃないという法則性を推測して、フィルタリングすることでそこそこのものができてしまいます。ただ、その方法だとある時点から急に精度向上が難しくなり、コストパフォーマンスに合わなくなってきます。それ以上をやるのが自然言語処理の存在価値かなと思います。

自然言語処理に語るのはこれくらいにして、話を戻すと、そろそろちょっと自然言語処理系に近い話をしていこうかなと。一年間、こちらの分野に居させてもらって解ったことは、この分野でやっていくために必要な学問よりの知識が非常に多い。統計、機械学習アルゴリズム(特にDPや計算複雑性)、形式文法(文脈自由文法等)、情報検索などなど。もちろんLinuxの知識もいります。

それに、自然言語を扱っていればいいのと、比較的短期間で成果がでるので、規模としてはそれほど大きくない(と思ってますが実際どうなんでしょう?)ものの、観測範囲が大きすぎるなとも感じます。

ですので、自分の理解を確認する意味も込めて、勉強したものとか、研究時に読んだ論文とかこのブログで紹介していきたいと思っています。そうすれば、身についたことになることをチェックできるようになるので、俺としてはありがたい。そういう記事が増えてくるとあんまり面白くないという人は結構いると思いますが、どうかご容赦願いたい。

あと僕は博士行くつもりですが、絶対アカデミックに残るんだという考えはそれほどなくて、社会的に価値を作れるのであれば企業に行くことも考えてます。
そうしたとき、企業がどういうサービスを展開してるとか、どんなものが今求められているか(特にネット/携帯のライトユーザー)というものを知らないのはならないと最近考えてます。

はっきり言って僕のブログって社会とはまるで関係ないですよね。はてな村には近いけどw

だからもう少し社会に目を向けた記事を取り上げるようになると思います。

とにかく、どちらにしても、今までみたいな考察系の記事は減ってくると思います。ですので、この間の機械学習についてのエントリみたいに専門性の高いことになったり、ニュースに敏感になって、タダ取り上げる記事が多くなったりと、今までの記事とは方向性が異なる記事が今後多くなってくるとは思いますが、どうか見捨てないでやってくださいまし。


あと、実質メンテナンスできなくなってしまったので、提供していたサービスはすべて終了させていただきます。どうかご了承ください。