知識ベース論第2回課題/2002年12月20日提出

環境情報学部3年 70060330 t00274yw 和田裕介

課題1

マルチメディア知識ベース環境における異種言語メディアデータ間 および異種システム間の連結を実現するシステム(メタレベルシステム)の構成と役割について説明せよ。

情報に対する情報をメタデータと呼ぶ。異種システム間の連結を実現するシステムではマルチメディアデータのメタデータが重要になってくる。写真や音楽、映像などのマルチメディアデータは人間にとっては理解可能だが、コンピュータシステムにとってはただのデータの塊に過ぎない。これをコンピューターに理解可能にするもっとも簡単で効率的な方法はそのマルチメディアデータがいったいどのような特徴を持っているかなどの情報をメタデータとして記述するということである。それにより、システムがマルチメディアデータの検索や抽出、並び替えなどができるようになる。

課題2&課題3

今回、私が設計するメタレベル知識ベースは、研究プロジェクトでやっているスガパクというアプリケーションを題材にしている。スガパクとはおおよそ本棚に入りそうな物、つまりデジタルおよび現実世界の本やCD、映像など(以後これらをまとめてホンと記述)を媒介としたコミュニケーションを通じて、相手のことをより知れたり、知識を広めたりできるというアプリケーションである。ホンに対する一般的な情報(ジャケットなど)だけではなく、ユーザーがホンを見たり、聴いたり、コミュニケーションしたりすることによって生成されるメタデータを利用して、それをホンダナとして視覚的に表現したい。

対象とするメディアデータを想定し、それらの特徴を現す属性群を設定する

スガパクのアプリケーションではプレイヤーも内臓しているため持ち主のそのホンにたいするデータを自動的に生成することができす。また、ホンに対して人と人がコミュニケーションをすることにより、会話がそのホンのメタデータとして保持される。そのことを踏まえたメディアデータの基本属性は以下のようになる

また、会話メタデータで発言された言葉をわかつことによりその単語を属性として保持する。たとえば、「この人たち、MTVにでてる見たよ。かっこよかったー。」という会話をした場合は というメタデータをそのCDに追加することができる。

リレーショナルデータベースのデータ構造

リレーショナルデータベースとして以下の3つのデータベースを設計した。

メディアデータについて設定した属性群に対応する数値を与え、ベクトルを生成する。

3つのmp3ファイルにして以下のような属性、値を与えた。

dateplaytimedistancetalklength goodnatsukashiimotteru
verve.mp3 -1011 111
oasis.mp3 1100 100
travis.mp3 0110 000

印象、内容を表現する言葉について、設定した属性群に対応する数値を与え、ベクトルを生成する

スガパクアプリケーションはメタデータをホンダナというヴィジュアルで表現するというコンセプトである。そこで、今回、印象・内容を表現する言葉として、ホンダナにおける配置(すぐ手に取れるところにおいてある、奥底に隠されている、etc.)、ホンのみための状態(新品、ボロボロ、etc.)を用いる。

dateplaytimedistancetalklength goodnatsukashiimotteru
front 1101 1-10
hide -1-100 010
boroboro -1110 000

相関量計算のプログラムを用いて、メディアデータに相関の強い言葉を抽出 (メタデータ抽出方式)する。

verve.mp3はホンダナのどの辺にあるのか?つまり、frontとhideという印象を比べて、どちらの方が相関が強いかを調べた。また、いつ手に入れたか(date)というデータと何回聴いているか(playtime)というデータは重要なのでウェイトを設定した。

;;verve.mp3は果たしてホンダナのどの辺にあるか?
;;dateとplaytimeのウェイトを重くしている

;frontとの相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(-1 0 1 1 1 1 1) '(1 1 0 1 1 -1 0))))
;;結果 -1


;hideとの相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(-1 0 1 1 1 1 1) '(-1 -1 0 0 0 1 0))))
;;結果 3
    

ということで、verve.mp3は表にはなくて隠れた場所にあるということがわかった。

相関量計算のプログラムを用いて、問い合わせとして与えられる言葉と相関の強い順にメディアデータ群をランキングする方法(メディアデータ検索方式)を実現する。

きれいなmp3はどれかを見つけてみる。つまり表現boroboroとの相関が一番低いmp3を見つけるということである。

;;ボロボロになっているmp3はどれだ?

;verve.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(-1 1 1 0 0 0 0) '(-1 0 1 1 1 1 1))))
;;結果 3


;oasis.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(-1 1 1 0 0 0 0) '(1 1 0 0 1 0 0))))
;;結果 0


;travis.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(-1 1 1 0 0 0 0) '(0 1 1 0 0 0 0))))
;;結果 3

というわけで、oasis.mp3が一番きれいなmp3ということがわかる。次に一番手元にあるmp3を探してみた。

;;一番手元に近いmp3はどれだ?

;verve.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(1 1 0 1 1 -1 0) '(-1 0 1 1 1 1 1))))
;;結果 -1


;oasis.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(1 1 0 1 1 -1 0) '(1 1 0 0 1 0 0))))
;;結果 5


;travis.mp3との相関
(accumulate
 (weight '(2 2 1 1 1 1 1)
	 (correlation '(1 1 0 1 1 -1 0) '(0 1 1 0 0 0 0))))
;;結果 2

と先ほどと同じく、oasis.mp3が一番手元に近いと出た。同じような印象の言葉は同じようなデータと相関を持つからだろう。

マルチメディアを対象としたメタレベル知識ベースの表現方法に関する考察、問題点の提示

今回メタレベル知識ベースの構築をして、気を使ったところは

という点である。この2点はアーキテクチャの視点から見れば比較的上位層にあたる部分ではあるが、知識ベースを実際に運用していくことを考えれば非常に重要なことだと 私は思う。人がかかわる知識は日々変化しつづけるし、また 目的とする「印象」を瞬間的に唱えるほどの瞬発力も備えていないだろう。 今後、放送局が増えリッチなメディアに触れる機会が多くなる。 マルチメディアの大海原での羅針盤となるのはメタデータなのだ。


Copyright ©2002 Yusuke Wada