MMAI

2010年12月28日星期二

CBIR by sift

search result : http://evidence.csie.ntu.edu.tw/search.rar
result id : http://evidence.csie.ntu.edu.tw/result.rar

---女王頭---

---鵝鑾鼻燈塔---

---自由女神---

---東京鐵塔---

2010年12月27日星期一

純用color feature 64bin下search結果

結論 : 看得出顏色相近...
queen--

自由女神---

2010年12月26日星期日

圖片篩選

我把圖片依據下列地標

東京鐵塔

比薩斜塔

埃及金字塔

女王頭

東海大教堂

101

自由女神

雪梨歌劇院

雪梨塔

雙子星

東方之珠

圓山大飯店

鵝鑾鼻燈塔

進行人工篩選

(有些原本設定要找的地標因為找不到相關圖片所以剔除了)

結果如下

http://taitin.csie.ntu.edu.tw/other/select_pic_files.rar(所有圖片約25.6MB)

http://taitin.csie.ntu.edu.tw/other/select_pic.txt

這是圖片的索引

格式為

id filename

ex:

1 3162198474_8f786e1aac_z.jpg

2 3694631010_c091d8b8e5_z.jpg

3 3159533874_dc7db26036.jpg

http://taitin.csie.ntu.edu.tw/other/select_tag.txt

標籤索引

標籤ID 標籤名稱

ex:

1 taiwan

2 台灣

3 風景

4 澎湖

http://taitin.csie.ntu.edu.tw/other/select_pic_tag.txt

圖片及標籤索引

1 4 //1表示圖片的ID，4表示有4個tag，因此以下4行為tagID

2 16//2表示圖片的ID，16表示有16個tag，因此以下16行為tagID

標籤google的結果

http://taitin.csie.ntu.edu.tw/other/select_tag_google.txt

http://www.dpreview.com/

http://www.dcresource.com/

http://www.digitalcamera-hq.com/

http://reviews.cnet.com/digital-cameras/

http://www.phototech.com/

http://www.digitalcamerarecovery.org/

...

2010年12月22日星期三

檔名如下
2846419461_0ba2134051_z.jpg
4896520830_bcc7378b6b_z.jpg
2778408840_1f82fd5815_z.jpg
3895309920_14c3fd14dc.jpg
4265445781_5983b02d04.jpg
335814045_abbc49ed80.jpg
4891964788_89e2bfed61_z.jpg
4895863945_8d7fba9179_z.jpg
4896457000_3f93b7a8f1_z.jpg
3499966865_831dc4eef5_z.jpg

query 女王頭結果

檔名如下
2349486621_2c091e4105_z.jpg
1340744994_8c28fb0f4f.jpg
1340015545_e28fb6674e.jpg
4416565274_4cfff834ec.jpg
4895352619_cb87f98f09_z.jpg
456295225_51a026bab5_z.jpg
1340056717_e222a41f31.jpg
1339891769_21effa56b4.jpg
3062526985_ef6c51143b_z.jpg
3676280433_a63bdfe3c2.jpg

2010年12月21日星期二

待辦事項確認

1 . Evaluation
2 . Demo
3 . 報告用的power point製作
4 . 報告人員選定

CBIR

測試一張QUERY
這是在FLICKR上面隨邊抓的一張圖
然後顯是經由SIFT 在3960張圖裡的 SEARCH結果

以下是1-10名的檔名
198799699_97f18ea7ac.jpg
1340744994_8c28fb0f4f.jpg
730660334_4e9fbbef37_z.jpg
5022649186_6971747761_z.jpg
4560082184_59e81673d0_z.jpg
4689449573_a20627d62e_z.jpg
2695819380_f152a44d5e.jpg
5176166557_dd0d320420_z.jpg
2989118628_d981d4e393.jpg
3063392268_f03f118fa7_z.jpg

2010年12月19日星期日

Image Tag Pre-processing

在對tag的Pre-prcessing中 , 我們分成兩個步驟:

Step 1: 對個別Tag進行similarity的比較 , 將similarity較高的tag分為同一群組.

Step 2: 藉由Step 1的data對每張image的tag進行統計.

一 . Tag 分群

我們共有3152個tag , 針對每個tag ,我們藉由search engine的協助 , 將每個tag丟

到search engine進行search , 並截取了Search Engine所回傳的URL (取Top-10 )

對每個tag的URL , 進行兩兩比較 , 若存在著1個以上相同的URL , 我們就視為這

兩個tag 具有相同的meaning , 其中越晚比較的tag ,其結果將會覆蓋前面的tag

結果.(因為tag 一開始是依照image的順序進行排列 , 所以根據這樣的關係 , 我

們認為兩個tag的位置越接近的話 , 會比較遠的tag較具有較大程度上的關係.

以下的檔案記錄了每個tag 所分到的群組.

http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/Tag_Cluster.txt

二 . Picture中 , 相同meaning的 tag數目統計

藉由Tag的分群資料 , 我們先對每個image的tag進行比對並統計了具有相同

meaning的tag出現次數 , 並選出了每個群組中具有代表性的tag .

picture的tag群組資料檔案:

http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/pic_cluster.txt

各個群組的代表性tag:

http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/Cluster.txt

2010年12月28日 星期二

CBIR by sift

2010年12月27日 星期一

純用color feature 64bin下search結果

2010年12月26日 星期日