■はじめに
機械学習で使用する膨大な量の画像を集める方法として、1枚ずつGoogleでダウンロードしてもいいですが、途方もない作業になります。
そこで、「google-images-download」を使用して画像をまとめてダウンロードする方法を記載します。
こちらから、「pip」のインストールまで終わらせている必要があります。
■手順
ターミナルで以下のコマンドを実行し、「google_images_download」をインストールします。
pip install google_images_download
インストールしたら、以下のコマンドで実行できます。
googleimagesdownload -k "犬"
上記は、「犬」というキーワードにヒットした画像をカレントディレクトリに保存しています。
このダウンロードした画像で機械学習などに利用していきましょう。
■オプション
ショートカット 説明 k 画像のキーワードを指定 sk 画像のキーワードを複数指定 l ダウンロードする画像の数(100件が上限)
※ChromeDriverを使用するとそれ以上、指定可能f 画像の形式(jpg,png,など) co 画像の色(red,blue,など) ct 画像色のタイプ(full-color,transparent,black-and-white) s 画像のサイズ(large,medium,'>400*300',など) a 画像の形(tall,square,など) t ダウンロードする画像タイプ(face,photo,など) w 画像の期間(past-24-hours,past-7-days,など) o 指定したディレクトリに画像を展開(指定しなければカレントディレクトリ) si 画像ファイルやURLから類似の画像をダウンロードする cd Chrome Driverの指定 la 言語の指定(Japanese,English,など)
■100件以上まとめてダウンロードする場合
100件以上まとめてダウンロードする場合には、「Chrome Driver」が必要になります。
※「Chrome Driver」は、こちらからダウンロードしてください。
ダウンロード、解凍を行い、出てきた「chromedriver.exe」をカレントディレクトリにコピーし、以下のコマンドを実行することで、100件以上まとめてダウンロードできます(「-l」オプションで件数を指定します。)
googleimagesdownload -ri -cd "chromedriver.exe" -l 1000 -k "犬"