EuroPythonで聞いた,OperaのBruce Lawsonさんのキーノートに出てきた話題。
OperaがMAMAというHTMLマークアップの構造を専門にあつかうクローラーを作って,世界中のHTMLを読んで解析したところ,HTMLで最もよく使われているclass名とid値はともに「footer」だったのだそうです。class名は「menu」「style1」のように続きます。id値は「content」「header」と続きます。
class名の10位までのランキングは。。。
class名 | 出現回数 |
---|---|
footer | 179,528 |
menu | 146,673 |
style1 | 138,308 |
msnormal | 123,374 |
text | 122,911 |
content | 113,951 |
title | 91,957 |
style2 | 89,851 |
header | 89,274 |
copyright | 86,979 |
id値 | 出現回数 |
---|---|
footer | 288,061 |
content | 228,661 |
header | 223,726 |
logo | 121,351 |
container | 119,877 |
main | 106,327 |
table1 | 101,677 |
menu | 96,161 |
layer1 | 93,920 |
autonumber | 77,350 |
dev.opera.comに詳細な報告がまとまっていて,他にもよく使われるアトリビュート名,idが降られているアトリビュートランキングなど,様々なデータを見ることができます。