■指定したフォルダ以下にあるHTMLファイルにDOCTYPEが含まれていないファイルをリストアップする
■書式
result = text.scan(/file:\/\//)
■説明
指定したフォルダ以下にあるHTMLファイルにDOCTYPEが含まれていないファイルをリストアップするにはDir.glob()で調べるHTMLファイルがあるフォルダのパスを指定します。以下のサンプルの赤文字の部分です。あとは得られたファイル名を元にファイルを読み込み正規表現で<!DOCTYPE にマッチするかどうかを調べます。マッチしなかった場合には標準出力にファイル名を表示します。
./getFileScript.rb >> result.txtのようにすると結果はresult.txtファイルに書き込まれます。
■サンプル
#!/usr/bin/ruby
files = Dir.glob("/Users/iMac/Sites/**/*.html")
files.each{ |f|
fh = open(f,"r")
text = fh.read
fh.close
result = text.scan(/<!DOCTYPE /)
if result.length == 0 then
print f,"\n"
end
}