今日あたしはセミナーに出てきてます。
(セマンティックWebコンファレンス2006)


なんか、失敗。だって、もっとふつうのビジネスセミナーみたいなのかと思ったら、学者さんや研究者さんが発表する場だったみたい。
まぁ出てくる言葉がカッコイイ(要は難解ってこと)。
ちょっと、素人向けじゃなかったわね……勉強せい!っちゅーことか。。。


でも、ちょっとだけわかったこと一個。
そうそう、一個でも得るモノあれば、一日使っても価値あるわよね。
まあ有給じゃなくてふつうに仕事できてるからいいけど、その分他の仕事が机の上で待ってるわけで……


実は昔から、テキストマイニングって好きだったのよ。
日本語でかかれた、主述や修飾関係がとにかく複雑な文章を、頑張って整理してキーワードとか見つけてくれるの。
この言葉がたくさん出てきてる、とか。そのキーワードに+/-イメージがどれだけついてる、とか。
でもこれ、未だ途中なのよね。もっと言葉のつながりとかも自動で判断して、それこそ日本語でパソコンに「あれしてこーしてこうなるようにつくって」って言えばやってくれるような、そういうのにならないかな?って思ってた。。。

それに近づくような、言葉と言葉の関係性をしっかり捕まえるのが、オントロジー化だってこと。

前の日記でも書いたけど、オントロジーって動詞を分析するわけだから、動作で考えられるのよね。確かにその方が、名詞のつながりっぷりを見つけるのにわかりやすいかも。
そいつらをオントロジーで分析してメタデータを自動生成する。そしてできあがったメタデータを元にさらにオントロジー化するってこと。


テキストデータの読みとり→メタデータの抽出→オントロジー化

ちょこっとわかってきたでしょ?


英語だと、こういうときはいいよね~
文学的・情操教育的なこと考えると、あんな杓子定規な言語なんて…って思ってるけど、分析とか解析にはあの論理性はほんと便利だと思う。
その一方、日本語は大変。
ふつうにかかれてる文章から、メタデータを抽出するのにまぁ面倒なこと。
日本語オントロジーを作るのに、
  文字列認識パターン
  一般概念知識
  領域概念知識
  分類知識
これらのたーくさんの辞書みたいなのを駆使して、関係性を見つけて行かなきゃならない。
いやぁ、大変だ……



そうそう、おまけですてきなネーミングの製品も聞いてきた。
「ユビdeコミミハサンダー」(http://www.toshiba.co.jp/rdc/rd/topics_j.htm

。。。。ひょっとすると、今時こういうネーミングって、返って注目されていいかも♪
中身は思ったよりもまじめな製品だったけどね。
近々、某大手カメラやでデモするみたいだから、見に行ってみようかな。