講演抄録/キーワード |
講演名 |
2025-02-18 15:55
画像プロンプトを活用した視覚言語モデルに基づくパーソナライズ異常検知手法に関する一検討 ○松田 遥・藤後 廉・前田圭介・小川貴弘・長谷山美紀(北大) |
抄録 |
(和) |
本研究では,画像プロンプト入力を活用した視覚言語モデル(Vision Language Model: VLM)に基づくパーソナライズ異常検知手法に関する検討を行う.従来のVLMベースの異常検知手法では,主にContrastive Language-Image Pre-training (CLIP)を用いてテキスト特徴量と画像特徴量の関連性を利用した検知を行う.しかしながら,このようなアプローチでは,対象オブジェクトの詳細情報が特徴量算出時に欠落する問題が存在した.本研究では,この問題に対処するため,画像プロンプトを介してCLIPの全体構造に対象オブジェクト情報を入力する.本操作により,従来手法における情報の欠落を抑制し,オブジェクト固有の異常を正確に検出することを可能とする.また,CLIPの画像エンコーダにアダプタを追加し,任意の画像プロンプトを入力可能とするフレームワークを構築することで,一般的な異常とオブジェクト固有の異常の双方への対応を可能とする.本文の最後では,工業用の実画像データセットを用いた実験により,提案手法の有効性を検証する. |
(英) |
This paper presents a personalized anomaly detection method based on the Vision Language Model (VLM) that utilizes image prompt input. Conventional VLM-based anomaly detection methods mainly utilize Contrastive Language-Image Pre-training (CLIP) to detect anomalies based on the relationship between text and image features. However, such approaches have a problem that detailed information on the target object is missing when calculating features.
To address this problem, our study inputs target object information into the overall structure of CLIP via image prompts. This operation suppresses the missing information and enables accurate anomaly detection of object-specific anomalies. In addition, by constructing a framework that allows arbitrary image prompt input to CLIP's image encoder through an adapter, the proposed method can handle both general anomalies and object-specific anomalies. At the end of the paper, we verify the effectiveness of the proposed method through experiments using a real-world dataset for industrial anomaly detection. |
キーワード |
(和) |
異常検知 / 視覚言語モデル / パーソナライゼーション / Vision Transformer / / / / |
(英) |
Anomaly detection / Vision language model / Personalization / Vision transformer / / / / |
文献情報 |
映情学技報, vol. 49, no. 4, ME2025-18, pp. 91-95, 2025年2月. |
資料番号 |
ME2025-18 |
発行日 |
2025-02-11 (MMS, ME, AIT, SIP) |
ISSN |
Online edition: ISSN 2424-1970 |
PDFダウンロード |
|
研究会情報 |
研究会 |
ME AIT MMS IEICE-IE IEICE-ITS SIP |
開催期間 |
2025-02-18 - 2025-02-19 |
開催地(和) |
北海道大学 |
開催地(英) |
Hokkaido Univ. |
テーマ(和) |
画像処理,一般 |
テーマ(英) |
Image Processing, etc. |
講演論文情報の詳細 |
申込み研究会 |
ME |
会議コード |
2025-02-ME-AIT-MMS-IE-ITS-SIP |
本文の言語 |
日本語 |
タイトル(和) |
画像プロンプトを活用した視覚言語モデルに基づくパーソナライズ異常検知手法に関する一検討 |
サブタイトル(和) |
|
タイトル(英) |
A Note on Personalized Anomaly Detection Based on Vision Language Model Using Image Prompt |
サブタイトル(英) |
|
キーワード(1)(和/英) |
異常検知 / Anomaly detection |
キーワード(2)(和/英) |
視覚言語モデル / Vision language model |
キーワード(3)(和/英) |
パーソナライゼーション / Personalization |
キーワード(4)(和/英) |
Vision Transformer / Vision transformer |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
松田 遥 / Haruka Matsuda / マツダ ハルカ |
第1著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第2著者 氏名(和/英/ヨミ) |
藤後 廉 / Ren Togo / トウゴ レン |
第2著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第3著者 氏名(和/英/ヨミ) |
前田 圭介 / Keisuke Maeda / マエダ ケイスケ |
第3著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第4著者 氏名(和/英/ヨミ) |
小川 貴弘 / Takahiro Ogawa / オガワ タカヒロ |
第4著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第5著者 氏名(和/英/ヨミ) |
長谷山 美紀 / Miki Haseyama / ハセヤマ ミキ |
第5著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
第21著者 氏名(和/英/ヨミ) |
/ / |
第21著者 所属(和/英) |
(略称: )
(略称: ) |
第22著者 氏名(和/英/ヨミ) |
/ / |
第22著者 所属(和/英) |
(略称: )
(略称: ) |
第23著者 氏名(和/英/ヨミ) |
/ / |
第23著者 所属(和/英) |
(略称: )
(略称: ) |
第24著者 氏名(和/英/ヨミ) |
/ / |
第24著者 所属(和/英) |
(略称: )
(略称: ) |
第25著者 氏名(和/英/ヨミ) |
/ / |
第25著者 所属(和/英) |
(略称: )
(略称: ) |
第26著者 氏名(和/英/ヨミ) |
/ / |
第26著者 所属(和/英) |
(略称: )
(略称: ) |
第27著者 氏名(和/英/ヨミ) |
/ / |
第27著者 所属(和/英) |
(略称: )
(略称: ) |
第28著者 氏名(和/英/ヨミ) |
/ / |
第28著者 所属(和/英) |
(略称: )
(略称: ) |
第29著者 氏名(和/英/ヨミ) |
/ / |
第29著者 所属(和/英) |
(略称: )
(略称: ) |
第30著者 氏名(和/英/ヨミ) |
/ / |
第30著者 所属(和/英) |
(略称: )
(略称: ) |
第31著者 氏名(和/英/ヨミ) |
/ / |
第31著者 所属(和/英) |
(略称: )
(略称: ) |
第32著者 氏名(和/英/ヨミ) |
/ / |
第32著者 所属(和/英) |
(略称: )
(略称: ) |
第33著者 氏名(和/英/ヨミ) |
/ / |
第33著者 所属(和/英) |
(略称: )
(略称: ) |
第34著者 氏名(和/英/ヨミ) |
/ / |
第34著者 所属(和/英) |
(略称: )
(略称: ) |
第35著者 氏名(和/英/ヨミ) |
/ / |
第35著者 所属(和/英) |
(略称: )
(略称: ) |
第36著者 氏名(和/英/ヨミ) |
/ / |
第36著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2025-02-18 15:55:00 |
発表時間 |
15分 |
申込先研究会 |
ME |
資料番号 |
MMS2025-18, ME2025-18, AIT2025-18, SIP2025-18 |
巻番号(vol) |
vol.49 |
号番号(no) |
no.4 |
ページ範囲 |
pp.91-95 |
ページ数 |
5 |
発行日 |
2025-02-11 (MMS, ME, AIT, SIP) |
|