ML(Machine Learning :機会学習)用のサンプルデータベース(人物、車)
歩行者(人の全身)、車の画像認識の機械学習のトレーニングデータセット。顔認識のデータベースは後ほど調査予定
人物(全身)用
Daimler Pedestrian Classification Benchmark Dataset
歩行者検出用に人の全身を切り出したサンプルデータがある。歩行者を単身で抜き出したサンプルで、ほぼ、人をバウンディングボックスで囲った領域で切り出していあり、非常に精度よく集められてたサンプル。「人全身写真×4800枚+人でない写真×5000枚」 のセットが5セット用意されている。画像サイズは18ピクセル×36ピクセルに統一されている。画像形式がPGMという一般的ではないものなので利用時は注意。
USC Pedestrian Detection Test Set
人の全身を含む写真のサンプル。人の場所を示したXMLファイル(groundtruth)が添付されている。人を囲う左上の座標と、囲う箱のサイズ(x、Y)で表記したもの。サンプルは、A,B,Cの3セット用意されている。Aは205枚の写真に313人、Bは54枚の写真に271人、Cは100枚の写真に232人となっている。
http://iris.usc.edu/Vision-Users/OldUsers/bowu/DatasetWebpage/dataset.html
MIT CBCL Pedestrian Database(Center for Biological and Computational Learning) 歩行者用
人の全身写真(歩行者)の、切り出しされているもの。PPMフォーマット。924枚の写真。
http://cbcl.mit.edu/cbcl/software-datasets/PedestrianData.html
車用
UIUC Image Database for Car Detection
自動車の側面の写真のデータベース。車載カメラから見た他の車の自動認識の訓練データとしてはふさわしくない。対象(自動車)は切り出されてPGMファイルとして集められている。サンプル数は、トレーニング用の正例画像が500、誤例画像が550。その他に、テスト用に自動車が風景にある写真が170枚+108枚。
http://l2r.cs.uiuc.edu/~cogcomp/Data/Car/
MIT CBCL Car Database(Center for Biological and Computational Learning) 車用
車の正面と背面のデータベース。正面や背面から少しずれた視点からの写真も含まれている。車を切り出した写真になっているが、切り出しが少し甘めになっている。用途としては、車載カメラからの他の車の映像に近いものが多く含まれる。画像データはPPMフォーマット
http://cbcl.mit.edu/cbcl/software-datasets/CarData.html
CMU Testing Images for Car Detection (@Object Recognition Using Statistical Modeling Project)
車を撮影した写真としては、撮影アングルが多彩。道路沿いの歩道から撮影された感じの写真が多い。駐車場や路上の監視用途の認識システムの学習データに向いている。写真は切り抜かれていない。正解情報が別ファイルで与えられている。画像データはPGMフォーマット
http://vasc.ri.cmu.edu/idb/html/car/index.html
カルフォルニア工科大学(Caltech)のもの
顔や車だけでなく、飛行機、バイク、葉っぱ、といったものデータベースも含む。しかし、認識対象の切り出し画像でもなければ、正解位置をしめしたデータ(Groundtruth)もない。あまり親切なデータベースではない。