概要

第17回データ工学と情報マネジメントに関するフォーラムにて、

「レビューデータからの各次元が意味を持つDisentangledな映画のベクトル表現の獲得」

というタイトルで論文を発表しました。

現在、どの機械学習においてもembeddingが当たり前になっています。
入力データを機械学習モデルが処理できる形に変換するこの仮定に注目すると、embeddingから得られるベクトルの各次元が意味を持っていないという現状があります。
この現状は、人間がベクトルを解釈不可能、より意味的に踏み込んだベクトル演算ができないという二つの問題を抱えていると考えました。

そこで本研究では、文書をベクトル化した際にその各次元が独立して意味を持つようにする、Disentangled Representationの獲得が可能なエンコーダの作成を行いました。

文書ベクトルの各次元が独立して意味を持つようになれば、文書ベクトルを観点ごとに比較可能になり、人間のあいまいな要望に対する検索も可能になるのではないかと考えています。

評価実験で映画のレビューデータを使用し、一つの映画につく複数のレビューから得られるベクトルを映画ベクトルとして定量評価、被験者評価を行いました。

発表・投稿情報

  • 種別: paper
  • イベント名: 第17回データ工学と情報マネジメントに関するフォーラム(DEIM 2025)
  • 会場: オンライン
  • 日付: 2025-03-01
  • 発表ID: 7E-01
  • 役割: first_author
  • 公式ページ

成果物

受賞

本発表は、👑学生プレゼンテーション賞を受賞しました。