ML(Machine Learning :機会学習)用のサンプルデータベース(人物、車)

歩行者(人の全身)、車の画像認識の機械学習のトレーニングデータセット。顔認識のデータベースは後ほど調査予定

 

人物(全身)用

Daimler Pedestrian Classification Benchmark Dataset

歩行者検出用に人の全身を切り出したサンプルデータがある。歩行者を単身で抜き出したサンプルで、ほぼ、人をバウンディングボックスで囲った領域で切り出していあり、非常に精度よく集められてたサンプル。「人全身写真×4800枚+人でない写真×5000枚」 のセットが5セット用意されている。画像サイズは18ピクセル×36ピクセルに統一されている。画像形式がPGMという一般的ではないものなので利用時は注意。

http://www.gavrila.net/Research/Pedestrian_Detection/Daimler_Pedestrian_Benchmark_D/Daimler_Pedestrian_Class__Benc/daimler_pedestrian_class__benc.html

USC Pedestrian Detection Test Set

人の全身を含む写真のサンプル。人の場所を示したXMLファイル(groundtruth)が添付されている。人を囲う左上の座標と、囲う箱のサイズ(x、Y)で表記したもの。サンプルは、A,B,Cの3セット用意されている。Aは205枚の写真に313人、Bは54枚の写真に271人、Cは100枚の写真に232人となっている。

http://iris.usc.edu/Vision-Users/OldUsers/bowu/DatasetWebpage/dataset.html

MIT CBCL Pedestrian Database(Center for Biological and Computational Learning) 歩行者用

人の全身写真(歩行者)の、切り出しされているもの。PPMフォーマット。924枚の写真。

http://cbcl.mit.edu/cbcl/software-datasets/PedestrianData.html

 

車用

UIUC Image Database for Car Detection

自動車の側面の写真のデータベース。車載カメラから見た他の車の自動認識の訓練データとしてはふさわしくない。対象(自動車)は切り出されてPGMファイルとして集められている。サンプル数は、トレーニング用の正例画像が500、誤例画像が550。その他に、テスト用に自動車が風景にある写真が170枚+108枚。

http://l2r.cs.uiuc.edu/~cogcomp/Data/Car/

MIT CBCL Car Database(Center for Biological and Computational Learning) 車用

車の正面と背面のデータベース。正面や背面から少しずれた視点からの写真も含まれている。車を切り出した写真になっているが、切り出しが少し甘めになっている。用途としては、車載カメラからの他の車の映像に近いものが多く含まれる。画像データはPPMフォーマット

http://cbcl.mit.edu/cbcl/software-datasets/CarData.html

CMU Testing Images for Car Detection (@Object Recognition Using Statistical Modeling Project)

車を撮影した写真としては、撮影アングルが多彩。道路沿いの歩道から撮影された感じの写真が多い。駐車場や路上の監視用途の認識システムの学習データに向いている。写真は切り抜かれていない。正解情報が別ファイルで与えられている。画像データはPGMフォーマット

http://vasc.ri.cmu.edu/idb/html/car/index.html

カルフォルニア工科大学(Caltech)のもの

顔や車だけでなく、飛行機、バイク、葉っぱ、といったものデータベースも含む。しかし、認識対象の切り出し画像でもなければ、正解位置をしめしたデータ(Groundtruth)もない。あまり親切なデータベースではない。

http://www.vision.caltech.edu/html-files/archive.html