概要
The 27th International Conference on Information Integration and Web Intelligenceにて、
「Learning Disentangled Document Representations Based on a Classical Shallow Neural Encoder」
というタイトルで論文を発表しました。
現在、どの機械学習においてもembeddingが当たり前になっています。
入力データを機械学習モデルが処理できる形に変換するこの仮定に注目すると、embeddingから得られるベクトルの各次元が意味を持っていないという現状があります。
この現状は、人間がベクトルを解釈不可能、より意味的に踏み込んだベクトル演算ができないという二つの問題を抱えていると考えました。
そこで本研究では、文書をベクトル化した際にその各次元が独立して意味を持つようにする、Disentangled Representationの獲得が可能なエンコーダの作成を行いました。
文書ベクトルの各次元が独立して意味を持つようになれば、文書ベクトルを観点ごとに比較可能になり、人間のあいまいな要望に対する検索も可能になるのではないかと考えています。
評価実験で映画のレビューデータを使用し、一つの映画につく複数のレビューから得られるベクトルを映画ベクトルとして定量評価、被験者評価を行いました。
人生初の国際会議でしたが、発表、質疑含めすべて英語で堂々と発表できました。
発表・投稿情報
- 種別:
paper - イベント名: The 27th International Conference on Information Integration and Web Intelligence(iiWAS 2025)
- 会場: くにびきメッセ
- 日付: 2025-12-08
- 発表ID: Track2 iiWAS-1
- 役割: first_author
- 公式ページ