映像情報メディア学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2024-11-16 10:00
視線情報に基いたマインドリーディング深層学習モデル
多田那由多小濱 剛近畿大
抄録 (和) 本研究では,視線に基づいたマインドリーディング技術の確立を目的として,画像からテキストを生成する深層学習モデルである BLIP-2 の attention 機構に視線情報を混合させるように拡張したモデルを構築した.提案モデルに対して,何らかの指示のもとで画像を観察させた際の視線,および,その指示内容との関係を紐付けるように学習させた.実データを入手するのが困難であったことから,疑似データを使用して学習の可否を検証した結果,一定の精度に達するまで学習させることができた.学習後のモデルを用いて,特定の画像および同時に入力する視線データのペアを変更することで,生成されるテキスト情報も変化することが確認できた.このことから,視線情報が提案モデルのテキスト生成に寄与していることが確認され,視線に基づいたマインドリーディング技術開発の可能性が示唆された. 
(英) In this study, intending to establish a mind-reading technique based on gaze information, we developed a model that extends the attention mechanism of the BLIP-2, a deep learning model for generating text from images, to incorporate gaze information. The proposed model was trained to associate gaze with an image under specific instructions and its relationship with the content of the instructions. Due to difficulties in obtaining actual data, we used pseudo-data to evaluate the feasibility of learning and successfully trained the model to achieve a specific accuracy level. Utilizing the trained model, we observed that the generated text information also changed when the pair of a specific image and simultaneously input gaze data were altered. This finding confirms that gaze information contributes to text generation in the proposed model and suggests the potential for developing mind-reading technology based on gaze information.
キーワード (和) 視線情報 / 深層学習モデル / マインドリーディング / テキスト生成 / / / /  
(英) Eye gaze / Deep learning model / Mind reading / Text generation / / / /  
文献情報 映情学技報, vol. 48, no. 39, HI2024-47, pp. 47-50, 2024年11月.
資料番号 HI2024-47 
発行日 2024-11-08 (HI) 
ISSN Online edition: ISSN 2424-1970
PDFダウンロード

研究会情報
研究会 HI VRPSY JSKE  
開催期間 2024-11-15 - 2024-11-16 
開催地(和) 近畿大学 (東大阪キャンパス) 
開催地(英) Kindai Univ. 
テーマ(和) 視聴覚の基礎と応用、VR心理学、感性情報処理、一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 HI 
会議コード 2024-11-HI-VRPSY-JSKE 
本文の言語 日本語 
タイトル(和) 視線情報に基いたマインドリーディング深層学習モデル 
サブタイトル(和)  
タイトル(英) Deep learning mind-reading model based on gaze information 
サブタイトル(英)  
キーワード(1)(和/英) 視線情報 / Eye gaze  
キーワード(2)(和/英) 深層学習モデル / Deep learning model  
キーワード(3)(和/英) マインドリーディング / Mind reading  
キーワード(4)(和/英) テキスト生成 / Text generation  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 多田 那由多 / Nayuta Tada / タダ ナユタ
第1著者 所属(和/英) 近畿大学 (略称: 近畿大)
Kindai University (略称: Kindai Univ.)
第2著者 氏名(和/英/ヨミ) 小濱 剛 / Takeshi Kohama / コハマ タケシ
第2著者 所属(和/英) 近畿大学 (略称: 近畿大)
Kindai University (略称: Kindai Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2024-11-16 10:00:00 
発表時間 20分 
申込先研究会 HI 
資料番号 HI2024-47 
巻番号(vol) vol.48 
号番号(no) no.39 
ページ範囲 pp.47-50 
ページ数
発行日 2024-11-08 (HI) 


[研究会発表申込システムのトップページに戻る]

[映像情報メディア学会ホームページ]


ITE / 映像情報メディア学会