Microdataについて調べた。SEOとかSchema.orgとか書き方とか。

microdata と Schema.org って?

Schema.orgとは

まず Schema.org とは、Google、Yahoo!、Microsoft の三社が共同て運営している団体で、検索エンジンがウェブサイトをクロールするときのデータの読み取り方法を共通で決めていきましょうよ、という趣旨のものです。

microdataとは

このSchema.org が推進しているウェブサイトのデータの記述方法が、 microdataです。

microdataとはざっくり言うと、今までのhtml(これはテキストの文書構造を表現したもの)に対して、セマンティックの情報を記述するためのものです。

以下のような属性を、新たにhtmlの中に埋め込むことで実現します。

itemscope
情報を、単位(アイテム)として見る
itemtype
アイテムに種別を与える
itemprop
アイテムに項目を与える
itemref
アイテムに関連アイテムをひも付ける

例えば、以下のようなhtmlがあったとします。

<br />
&lt;div&gt;<br />
  &lt;h1&gt;WordPress 3.x (速習デザイン) &lt;/h1&gt;<br />
  &lt;img src=&quot;./img/sokushuImg.jpg&quot; alt=&quot;WordPress 3.x (速習デザイン) &quot; /&gt;<br />
  &lt;span&gt;著者: 大曲 仁, 星野 邦敏, 豊田 有&lt;/span&gt;<br />
  &lt;span&gt;ジャンル: WordPress&lt;/span&gt;<br />
  &lt;span&gt;出版社: 技術評論社&lt;/span&gt;<br />
  &lt;span&gt;発売日: 2012年3月16&lt;/span&gt;<br />
  &lt;a href=&quot;http://www.amazon.co.jp/dp/4774150282&quot;&gt;Amazon&lt;/a&gt;<br />
&lt;/div&gt;

このままでは、サイトにやってきたGoogleなどのクローラーには、著者が誰でどんなジャンルに属するもので、出版社がどこで発売日がいつなのか、などは理解できません。リンク先が、いったいなぜリンクされているのかもよくわかりません。

人間は読めば分かりますが、コンピュータにとってはなぜ大曲さんの名前と技評さんと2012/3/16が隣り合って並んでいるのかも、それが何を指しているのかも分かりません。

これを以下のように書き換えます。

&lt;div itemscope itemtype=&quot;http://schema.org/Book&quot;&gt;<br />
	&lt;h1 itemprop=&quot;name&quot;&gt;WordPress 3.x (速習デザイン) &lt;/h1&gt;<br />
	&lt;span&gt;著者: &lt;span itemprop=&quot;author&quot;&gt;大曲 仁&lt;/span&gt;, &lt;span itemprop=&quot;author&quot;&gt;星野 邦敏&lt;/span&gt;, &lt;span itemprop=&quot;author&quot;&gt;豊田 有&lt;/span&gt;&lt;/span&gt;<br />
	&lt;span&gt;ジャンル: &lt;span itemprop=&quot;genre&quot;&gt;WordPress&lt;/span&gt;&lt;/span&gt;<br />
	&lt;span&gt;出版社: &lt;span itemprop=&quot;publisher&quot;&gt;技術評論社&lt;/span&gt;&lt;/span&gt;<br />
	&lt;span&gt;発売日: &lt;meta itemprop=&quot;datePublished&quot; content=&quot;2012-03-16&quot;&gt;2012年3月16&lt;/span&gt;<br />
	&lt;a itemprop=&quot;url&quot; href=&quot;http://www.amazon.co.jp/dp/4774150282&quot;&gt;Amazon&lt;/a&gt;<br />
&lt;/div&gt;

1行目で、 itemscope と書かれています。閉じられるdivまでが一塊のアイテムですよ、ということを伝えています。itemtype属性も一緒に書いていて、Bookという種別のものについての記述ですよと伝えています。

2行目からは、 itemprop属性とその名前=項目をhtmlに追加しています。name, author, genre, publisherはとてもわかり易いと思います。

発売日は、metaタグを使っています。日本語が読めないロボット(もしかして読めるかもですが)に対して、これは発売日であって機械語で言うところの 2012-03-16 でありますよ、と教えてあげます。

検索結果画面に与える影響

こうすると、著者情報などが検索結果に表示されやすくなります。(ここまで書いて気がついたけど、AmazonはMicrodata対応してないのね。。)

以下のGoogleの検索結果画面を開いてみてください。
“starwars imdb” の検索結果画面

starwars imdb で検索してみた

WordPressのプラグインの画面もMicrodataに対応しています。
“cawaii admin” の検索結果画面

cawaii admin で検索してみた。ちなみに、僕の著者情報も出てますねo(^o^)o

http://wordpress.org/extend/plugins/cawaii-admin/へ行ってみると、以下のようなソース部分があります。

&lt;div itemtype=&quot;http://schema.org/AggregateRating&quot; itemscope=&quot;&quot; itemprop=&quot;aggregateRating&quot;&gt;<br />
	&lt;meta content=&quot;5.00&quot; itemprop=&quot;ratingValue&quot;&gt;<br />
	&lt;meta content=&quot;4&quot; itemprop=&quot;ratingCount&quot;&gt;<br />
...<br />
&lt;/div&gt;

検索以外の可能性

検索エンジン以外にも、機械がアイテムについて知ることができると色々なことが可能になります。
http://kojika17.com/2011/06/summary-of-microdata.phpが参考になりましたが、

  • Googleカレンダーにワンクリックでイベントを取り込む
  • テレビで見たお店の住所や営業日、電話番号などの情報を、テレビからiPhoneに送る
  • ウェブページなどの翻訳がより正確になる
  • ドラえもんの誕生

種別や項目名などの探し方

というわけで、情報の意味付けを行うと色々良いことがあるわけですが、「これは本についてですよ」「このアイテムは映画ですよ」という種別、さらには、「この本の著者はこの人ですよ」という項目名については、Schema.orgが策定した決まりがあるので、これを探さなくてはなりません。

種別 itemtype
http://schema.org/docs/full.htmlに一覧があります。
項目 itemprop
上記の種別を選んだ先のページにリストされてます。本の場合は http://schema.org/Book

micorformat と microdata

microformat というのもありまして、違いは「MicroformatsとMicrodataの違いについて」が詳しいです。

要は、同じものが使えるけれども、classを参照してくれるのでマークアップが簡単なのがmicroformat、 item***というのを使わないといけないから煩雑だけど既存のhtml構造に囚われることなく記述できるのでより汎用性があるのがmicrodata、という理解です。

参考:

↓ プラグインを作る方々への本、書きました。 ↓

「Microdataについて調べた。SEOとかSchema.orgとか書き方とか。」への1件のフィードバック

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です