2010年12月28日 星期二

2010年12月27日 星期一

2010年12月26日 星期日

圖片篩選

我把圖片依據下列地標
東京鐵塔
比薩斜塔
埃及金字塔
女王頭
東海大教堂
101
自由女神
雪梨歌劇院
雪梨塔
雙子星
東方之珠
圓山大飯店
鵝鑾鼻燈塔

進行人工篩選
(有些原本設定要找的地標因為找不到相關圖片所以剔除了)
結果如下



這是圖片的索引
格式為
id filename
ex:
1 3162198474_8f786e1aac_z.jpg
2 3694631010_c091d8b8e5_z.jpg
3 3159533874_dc7db26036.jpg

標籤索引
標籤ID 標籤名稱
ex:
1 taiwan
2 台灣
3 風景
4 澎湖


圖片及標籤索引
1 4 //1表示圖片的ID,4表示有4個tag,因此以下4行為tagID
31
28
29
30
2 16//2表示圖片的ID,16表示有16個tag,因此以下16行為tagID
1
32
3


標籤google的結果

1
http://www.dpreview.com/
http://www.dcresource.com/
http://www.digitalcamera-hq.com/
http://reviews.cnet.com/digital-cameras/
http://www.phototech.com/
http://www.digitalcamerarecovery.org/
...


2010年12月22日 星期三

CBIR 結果

query 101 結果

檔名如下
2846419461_0ba2134051_z.jpg
4896520830_bcc7378b6b_z.jpg
2778408840_1f82fd5815_z.jpg
3895309920_14c3fd14dc.jpg
4265445781_5983b02d04.jpg
335814045_abbc49ed80.jpg
4891964788_89e2bfed61_z.jpg
4895863945_8d7fba9179_z.jpg
4896457000_3f93b7a8f1_z.jpg
3499966865_831dc4eef5_z.jpg

query 女王頭 結果


檔名如下
2349486621_2c091e4105_z.jpg
1340744994_8c28fb0f4f.jpg
1340015545_e28fb6674e.jpg
4416565274_4cfff834ec.jpg
4895352619_cb87f98f09_z.jpg
456295225_51a026bab5_z.jpg
1340056717_e222a41f31.jpg
1339891769_21effa56b4.jpg
3062526985_ef6c51143b_z.jpg
3676280433_a63bdfe3c2.jpg

2010年12月21日 星期二

待辦事項確認

1 . Evaluation
2 . Demo
3 . 報告用的power point製作
4 . 報告人員選定

CBIR

測試一張QUERY
這是在FLICKR上面隨邊抓的一張圖
然後顯是經由SIFT 在3960張圖裡的 SEARCH結果



以下是1-10名的檔名
198799699_97f18ea7ac.jpg
1340744994_8c28fb0f4f.jpg
730660334_4e9fbbef37_z.jpg
5022649186_6971747761_z.jpg
4560082184_59e81673d0_z.jpg
4689449573_a20627d62e_z.jpg
2695819380_f152a44d5e.jpg
5176166557_dd0d320420_z.jpg
2989118628_d981d4e393.jpg
3063392268_f03f118fa7_z.jpg

2010年12月19日 星期日

Image Tag Pre-processing

在對tag的Pre-prcessing中 , 我們分成兩個步驟:

Step 1: 對個別Tag進行similarity的比較 , 將similarity較高的tag分為同一群組.

Step 2: 藉由Step 1的data對每張image的tag進行統計.


一 . Tag 分群

我們共有3152個tag , 針對每個tag ,我們藉由search engine的協助 , 將每個tag丟

到search engine進行search , 並截取了Search Engine所回傳的URL (取Top-10 )

對每個tag的URL , 進行兩兩比較 , 若存在著1個以上相同的URL , 我們就視為這

兩個tag 具有相同的meaning  , 其中越晚比較的tag ,其結果將會覆蓋前面的tag

結果.(因為tag 一開始是依照image的順序進行排列 , 所以根據這樣的關係 , 我

們認為兩個tag的位置越接近的話 , 會比較遠的tag較具有較大程度上的關係.

以下的檔案記錄了每個tag 所分到的群組.

http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/Tag_Cluster.txt


二 . Picture中 , 相同meaning的 tag數目統計


藉由Tag的分群資料 , 我們先對每個image的tag進行比對並統計了具有相同

meaning的tag出現次數 , 並選出了每個群組中具有代表性的tag .

picture的tag群組資料檔案:


http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/pic_cluster.txt

各個群組的代表性tag:


http://taipei-kw.myweb.hinet.net//MMAI/Project/dataset/Cluster.txt