圖片檢索技術論文
圖片檢索技術論文
圖像檢索是網絡信息檢索中的重要的組成部分,小編整理了圖片檢索技術論文,歡迎閱讀!
圖片檢索技術論文篇一
Web圖像檢索技術綜述
【摘 要】多媒體技術的迅速發(fā)展,促進了Web圖像檢索技術的創(chuàng)新和發(fā)展。針對目前的發(fā)展狀況,本文對Web圖像檢索技術做了深入的分析和研究,包括基于文本檢索、基于內容檢索、語義檢索以及個性化Web圖像檢索,并詳細介紹了這4種流行圖像檢索技術的技術特點,最后指出了Web圖像檢索技術的發(fā)展趨勢和研究方向。
【關鍵詞】基于文本圖像檢索 基于內容的圖像檢索 基于語義檢索 個性化Web圖像檢索
一、引言
目前,Web圖像檢索技術和模型層出不窮,可大致分為基于文本的檢索、基于內容的檢索、語義圖像檢索和個性化的Web圖像檢索四種。下面分別對其進行介紹。
二、基于文本的圖像檢索
20世紀70年代,基于文本的圖像檢索技術(TBIR)得以發(fā)展。目前,該技術發(fā)展較為成熟,但需要較多人工參與,耗費大量的人力和時間,而且不同的人對同一張圖像的理解也不相同,這就導致對Web圖像標注沒有統(tǒng)一標準,因而檢索的結果不能很好地符合用戶的需求[1]。同時在互聯(lián)網環(huán)境中,Web圖像數(shù)據(jù)不斷動態(tài)更新,采用人工方式對圖像進行廣泛標注也無法實現(xiàn)。
三、基于內容的圖像檢索
上世紀90年代,基于內容的圖像檢索(CBIR)技術產生。它主要采用圖像的視覺特征來表示圖像的內容,然后通過特征匹配算法進行圖像檢索。
(一)圖像特征提取
圖像的特征主要包括底層特征和語義特征。目前的CBIR系統(tǒng)主要使用圖像底層特征來檢索圖像。底層特征主要包括圖像的顏色、紋理、形狀等定量特征。目前,顏色特征主要有顏色直方圖、顏色矩和顏色相關圖等。紋理特征有Gabor變換、塔式小波變換、灰度共生矩陣等。而形狀特征表示主要有基于邊界表示法和基于區(qū)域表示法。此外,近些年許多學者也研究了基于文本和視覺兩種信息在內的Web圖像檢索,如文獻[2]中提出一種融合文本關鍵詞和圖像視覺內容的Web圖像檢索方法,在一定程度上提高了Web圖像檢索質量。
(二)圖像相似性匹配
圖像檢索的匹配策略大致分為完全匹配和相似性匹配。完全匹配是指兩張圖像的特征完全相同時圖像匹配成功;而相似性匹配是指兩張圖像特征間的距離在某一閾值內匹配成功。在基于內容的圖像檢索中,圖像底層視覺特征對比的相似性檢索匹配占據(jù)著主導地位。
四、基于語義的圖像檢索
底層的視覺特征不能代表圖像豐富的內涵,使得基于內容的圖像檢索效果并不理想。因此,出現(xiàn)了基于圖像語義的檢索技術,主要包括語義層次模型、語義的提取方法和語義表示方法三方面內容。
(一)語義層次模型
圖像語義是有粒度的,即具有層次性,所以可采用多層結構對圖像語義進行分析。
一般,根據(jù)圖像內容可將圖像分為特征語義、對象和空間關系語義、高層語義3個層次。特征語義利用圖像的視覺特征及其組合進行檢索。對象與空間關系語義,是分析圖像中對象的視覺特征、空間關系、位置等信息,得到圖像的語義描述。高層語義涉及到圖像的場景語義、行為語義和情感語義,該層語義是根據(jù)人的知識理解而來,主觀性較強,提取工作較復雜。
(二)語義提取方法
圖像語義的提取是由底層特征向高層語義映射的過程,但現(xiàn)今的技術水平,直接根據(jù)底層的視覺特征推理出圖像高層語義很困難,目前主要方法有基于知識語義提取、基于人工交互語義提取和外部信息的語義提取。
(三)語義表示方法
語義表示方法主要有文本表示法和基于人工智能知識表示法。文本表示法是用文本對圖像或圖像區(qū)域進行解釋?;谌斯ぶ悄艿闹R表示方法,如語義網絡、數(shù)理邏輯等,該方法能夠表達較為復雜的關系,具備較強的模糊匹配能力,但目前通用性的知識表示模型尚不存在。
五、個性化Web圖像檢索
隨著多媒體技術的飛速發(fā)展,圖像的數(shù)量急劇增加,為了得到更準確的符合個人需求的檢索結果,個性化Web圖像檢索成為研究熱點。個性化的實質是針對不同用戶采用不同策略來提供不同的服務內容。個性化圖像檢索則是根據(jù)用戶對檢索結果的反饋主動學習和記錄用戶的興趣信息,推測出用戶的興趣需求。用戶興趣模型(User Preference Profile)是個性化圖像檢索的核心,它用于存儲和管理用戶興趣信息,通過收集用戶的反饋信息,建立初始用戶興趣模型,經過長期地學習,不斷更新用戶興趣模型,最終可以得到用戶的興趣傾向,針對不同用戶提供個性化服務。
由于獲取用戶興趣面臨低層特征和高層語義之間的“語義鴻溝”問題,一些學者作了研究,如HE等人[3]提出了一種應用于個性化圖像檢索的用戶興趣模型的構建方法,以彌補語義鴻溝。QIU等 [4]提出基于用戶多媒體數(shù)據(jù)管理模型的個性化圖像檢索,建立用戶多媒體數(shù)據(jù)管理模型為用戶提供個性化圖像檢索。文獻[5]為了在個性化搜索過程中能夠準確地挖掘到用戶的潛在興趣并進行相應的聚類分析,提出采用潛語義空間的Zipf分布的特性,并結合PLSA(概率潛在語義分析)來獲取全文的語義。
六、總結和展望
圖像檢索從基于文本的檢索發(fā)展到語義檢索,經歷了簡單到復雜、低級到高級的過程?;趫D像語義檢索,充分利用了圖像的語義信息,提高了圖像檢索的速度和質量,應用前景廣泛,但仍存在如何改進語義提取方法以及語義描述方式等難題。目前,個性化Web圖像檢索成為主要研究熱點,但如何更好地解決語義鴻溝,建立和改善用戶興趣模型成為一個值得深入研究的問題。
參考文獻:
[1]魯珂,趙繼東,曾家智.一種適合Web圖像檢索的圖像降維算法研究.計算機科學.2006,33(5):255~260
[2]黃鵬,陳純,王燦,卜佳俊,陳偉,仇光.使用加權圖像標注改進Web圖像檢索.浙江大學學報(工學版).2009,43(12):2129~2135
[3]賀琳,張菁,沈蘭蓀.個性化圖像檢索中用戶興趣模型的構建方法.計算機工程與應用.2009,45(31):168~171
[4]邱兆文,張?zhí)镂?基于用戶多媒體數(shù)據(jù)管理模型的個性化圖像檢索.電子學報.2008,36(9):1749~1749
[5]陳冬玲,王大齡,于戈,于芳.基于PLAS方法的用戶興趣聚類.東北大學學報(自然科學版).2008,29(1):53~56
點擊下頁還有更多>>>圖片檢索技術論文