■指定したフォルダ以下にあるHTMLファイルにDOCTYPEが含まれていないファイルをリストアップする

■書式

result = text.scan(/file:\/\//)

■説明

指定したフォルダ以下にあるHTMLファイルにDOCTYPEが含まれていないファイルをリストアップするにはDir.glob()で調べるHTMLファイルがあるフォルダのパスを指定します。以下のサンプルの赤文字の部分です。あとは得られたファイル名を元にファイルを読み込み正規表現で<!DOCTYPE にマッチするかどうかを調べます。マッチしなかった場合には標準出力にファイル名を表示します。
./getFileScript.rb >> result.txtのようにすると結果はresult.txtファイルに書き込まれます。

■サンプル

#!/usr/bin/ruby
files = Dir.glob("/Users/iMac/Sites/**/*.html")
files.each{ |f|
fh = open(f,"r")
text = fh.read
fh.close
result = text.scan(/<!DOCTYPE /)
if result.length == 0 then
print f,"\n"
end
}