Мікроформати та мікродані

Мікроформати та мікродані Стара ідея «семантичної павутини», яку так і не зміг просунути консорціум W3C, останнім часом знову набирає обертів. У Росії «Яндекс» досить активно наполягає на впровадженні мікроформатів, а за кордоном зовсім недавно утворився несподіваний союз: Google, Bing і Yahoo! (точніше, Google, Inc., Yahoo, Inc. Та Microsoft Corporation) створили спільний проект schema.org. З його допомогою вони збираються прищепити вебмайстрам звичку розмічати сторінки тегами Microdata (поки чорновий стандарт HTML5). Треба відзначити, що цей формат розроблений без консультацій з W3C, а так як вебмайстрам набагато цікавіше «радувати» Google і інші пошукові системи, ніж якийсь туманний для багатьох консорціум, саме Microdata стане базовим в зарубіжному інтернеті. У Росії, до речі, поки що «Яндекс» не підтримав ініціативу schema.org, тому по Рунету поширюється інший формат семантичної розмітки: μF (мікроформати, http://microformats.org/wiki). Очевидно, що для успішної взаємодії з усіма пошуковиками доведеться дублювати семантичні описи сторінок. Хоча Google підтримує мікроформати hProduct, він явно буде віддавати перевагу власній мові розмітки.

Пару слів про Semantic Web

Веб-сторінка може бути простим документом без спеціальної розмітки для пошуковика. У цьому випадку йому доведеться аналізувати документ своїми методами, витягуючи і структуруючи необхідну інформацію. Якими б досконалими не були алгоритми ПС, помилки неминучі — особливо якщо потрібний не просто пошук за ключовими словами, а встановлення основного змісту (суті контенту). Семантична розмітка сторінок дозволить машинному розуму витягти дані, придатні для прямого розміщення в базу даних і для будь-якої обробки. Семантична павутина дає можливість пошуковику надавати прямі і відразу сформульовані на людській мові відповіді на запитання користувачів. Наприклад, на запит «рецепт борщу» пошуковик одразу видасть відповідь з інгредієнтами та їх кількістю, а на «скільки гігабайт пам'яті в ноутбуці Asus K73e» - цифру 4. Але пошукова система не ризикуватиме обдурити користувача — такі відповіді не можна будувати на основі аналізу сторінок! Відповіді повинні бути на сто відсотків вірними: не можна переплутати оперативну пам'ять і обсяг жорсткого диска, це дуже сильно зменшить лояльність користувача до пошукової системи. Задачу правильного розуміння контенту машиною вирішує розмітка спеціальними тегами.

Нижче розглянемо приклади опису продукту в двох головних форматах нинішнього покоління. Це тільки приклад, тут наведено не всі можливі параметри і «типи полів».

Google - microdata (schema.org)

<div itemscope itemtype="http://schema.org/Product">
<span itemprop="name"> Мікрохвильова піч Samsung MW73VR </ span>
<img src="samsung-microwave-mw73vr.jpg" alt='Мікроволновая піч Samsung MW73VR' />
<div itemprop="aggregateRating" itemscope itemprop="http://schema.org/AggregateRating">
Середня оцінка покупців <span itemprop="ratingValue"> 4 </ span>
на основі <span itemprop="reviewCount"> 11 </ span> відгуків </ div>

<div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
<span itemprop="price"> 2630 р. </ span>
<link itemprop="availability" href="http://schema.org/InStock" /> В наявності</ div>
<span itemprop="description"> окремостояча мікрохвильова піч об'ємом 20 л і потужністю 800 Вт </ span><div itemprop="reviews" itemscope itemtype="http://schema.org/Review">
<span itemprop="name"> Відмінна грубка </ span> - від <span itemprop="author"> Іван </ span>,
<meta itemprop="publishDate" content="2011-04-01"> 1 квітня 2011
<div itemprop="reviewRating" itemscope itemtype="http://schema.org/Rating">
<meta itemprop="worstRating" content = "1">
<span itemprop="ratingValue"> 4 </ span> /
<span itemprop="bestRating"> 5 </ span> stars
</ div>
<span itemprop="description"> Легко чистити </ span>
</ div>
</ div>

«Яндекс» - microformats (hProduct, поки використовується ПС тільки для обробки відгуків про автомобілі)

<div class="hproduct">
<span class="category"><span class="value-title" title="auto"></span></span>
<h2>
<span class="brand">Ford</span>
<span class="fn">Focus</span>
</h2>
<a class="photo" href="http://example.com/img/ford/focus-st.jpg"><img class="" alt="Ford Focus, хетчбек 5 дв ST" src="http://example.com/img/ford/focus-st-preview.jpg" align="left"></a>
<span class="identifier">
<span class="type">
<span class="value-title" title="body-type"></span>
</span>
<span class="value">хетчбек 5 дв</span>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="configuration-name"></span>
</span>
<span class="value">ST</span>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="displacement"></span>
</span>
2.5
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="transmission"></span>
</span>
MT
</span>
<span class="identifier">
(<span class="value">225</span>
<span class="type">
<span class="value-title" title="horse-power"></span>
л. с.
</span>)
</span>
<span class="identifier">
<span class="value">2009</span>
<span class="type">
<span class="value-title" title="prodyear"></span>
року випуску
</span>
</span>
<span class="identifier">
(<span class="value">передній</span>
<span class="type">
<span class="value-title" title="gear-type"></span>
привід
</span>,
</span>
<span class="identifier">
<span class="value">лівий</span>
<span class="type">
<span class="value-title" title="steering-wheel"></span>
руль
</span>).
</span>
<a class="url" href="http://example.com/ford/focus-st-2.5-mt.html">
Детальніше про цю конфігурацію</a>
<span class="identifier">
<span class="type">
<span class="value-title" title="dtpurchased"></span>
Куплений
</span>
<abbr class="value" title="2010-09-15">15 вересня 2010</abbr>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="run"></span>
пробіг
</span>
15
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="run-metric"></span>
</span>
тис. км
</span>.
</div>

Валідація

Інструментарій для перевірки коду надає «Яндекс.Вебмастер», але можна скористатися і стороннім сервісом Optimus.

CMS з підтримкою мікроформатів

Впровадити семантичну розмітку вручну можна на невеликому сайті — або на невеликій кількості сторінок (наприклад, на сторінці з контактною інформацією). Вручну ж писати код для тисяч товарів інтернет-магазину абсолютно нереально. Тому необхідно користуватися системами управління контентом, що вже підтримують мікроформати — наприклад Drupal, Wordpress, Movable Type. Або ж писати модуль з таким функціоналом для використовуваної CMS.

Висновки
Пам'ятайте, що семантичної розміткою можна користуватися тільки для представлення в зручній для пошуковиків формі реального, існуючого, видимого відвідувачам сторінки контенту. Все інше (наприклад, спроби розмітки прихованих елементів) буде розпізнано, класифіковано як пошуковий спам та припинено жорсткими песимізаційними санкціями. Розмітка такого типу — це крок у майбутнє, її рекомендується використовувати скрізь, де тільки це можливо і доцільно. Поки що — обидва формати, але цілком можливо, що під тиском ініціативи schema.org «Яндекс» теж почне підтримувати Microdata, що усуне необхідність дублювання розмітки.

Можливо вас зацікавлять подібні статті:

Коментарі

Немає коментарів до цієї статті.

Коментарі

Поля позначені як * потрібні обов'язково. Перед постінгом завжди робіть перегляд свого коментаря.