Теги 'семантична розмітка'

«Яндекс» та Schema.org

Яндекс і Schema.org В попередніх публікаціях уже згадувалось про семантичну розмітку сторінок, яка багаторазово спрощує обробку інформації для пошукових машин. Минуло менше року, але з тих пір спливло багато води і багато що змінилося — якщо раніше мікродані стандарту Schema.org використовувала трійка найбільших пошукових систем, Google, Yahoo і Bing, а вітчизняний Яндекс починав застосовувати мікроформати класу hProduct, то пізніше керівництво «Яндекса» вирішило не відставати від світових трендів і також розвиватися в бік загальноприйнятого стандарту Schema.org.

Прийняття стандарту Schema.org

Сформована ситуація по суті вимагала подвійної оптимізації коду сторінок для різних стандартів семантичної розмітки, щоб вона працювала в різних пошукових системах. Восени 2011 року в «Яндексі» була запущена підтримка тегів Microdata стандарту Schema.org, що стало подарунком для багатьох фахівців — саме з того часу відпала необхідність створювати семантичну розмітку для різних стандартів або жертвувати їй для одного з пошуковиків.

Стандарт Schema.org розвивається, з'являються нові варіанти розмітки, його підтримують найбільш популярні пошуковики, і це робить його найкращим варіантом при виборі розмітки. На сайті Schema.org представлений словник атрибутів однойменного стандарту і приклади розмітки в HTML-коді. У даний момент навіть існують проекти перекладу цього сайту на російську мову. А сам «Яндекс» на сторінці допомоги вебмайстрам дає докладну інструкцію.

Для чого потрібна семантична розмітка?

Уявіть сторінку, на якій розміщена текстова інформація. Звичайна людина, прочитавши її, може скласти коротке резюме в одній–двох фразах, виділивши найнеобхідніше. А як при цьому бути бездушній машині пошуковика? Звичайно, він використовує фрази з ключовими словами, але всю суть не зможе передати в змістовній короткій фразі, так як він не зможе зрозуміти сенсу. У випадку ж застосування семантичної розмітки, де інформація чітко структурована, і тегами виділені потрібні категорії, обробка буде під силу алгоритмам пошуковика. Таким чином йому можна підказати в якій частині тексту розміщена інформація певної категорії.

Застосовуючи стандарт Schema.org при верстці сторінки, ви можете розраховувати на те, що пошукова система сформує відмінний інформативний сніппет, що є одним з визначальних чинників вибору сайту користувачем у видачі. Достовірних відомостей про вплив застосування такої розмітки на природне ранжування немає, але зате вона дає пошуковикам набагато більше інформації, що в підсумку є великим плюсом. Крім того, пошукові системи не стоять на місці — ті теги і схеми, які не підтримуються зараз, з більшою часткою ймовірності зможуть стати в нагоді в майбутньому.

Приклади використання Schema.org

Одна з корисних категорій схем розмітки для комерційних компаній — для організацій. «Яндекс» використовує подібні схеми для сервісу «Яндекс.Довідник», дані з якого використовуються в іншому популярному сервісі «Яндекс.Карти», вельми актуальний з точки зору принесеного трафіку. Також застосування даної схеми буде корисно і для інших сервісів.

Детально розберемо схему Organization:

  • description — опис діяльності організації;
  • image — URL зображення логотипу або будь-яке інше актуальне для організації;
  • name — повна назва компанії в текстовому форматі;
  • url — URL сайту;
  • address — це поле призначене для повної адреси, в тому числі в полі addressCountry пишеться назва країни в текстовому форматі, або за стандартом ISO в двобуквений позначенні. У полі addressLocality пишеться назва населеного пункту, в addressRegion — регіон чи область, в postOfficeBoxNumber — номер абонентської скриньки, в postalCode — поштовий індекс, в streetAddress — вулиця, номер будинку та інша необхідна інформація.
  • aggregateRating — це поле призначене для вказівки рейтингу організації, якщо цього передбачає специфіка діяльності;
  • contactPoints — контактна інформація окремого співробітника або компанії, це поле зручне в разі уточнення якихось даних, які не збігаються із загальними контактними даними;
  • email — електронна пошта;
  • employees — дані окремих співробітників;
  • events — тут можна вказати інформацію про заходи, які пов'язані з організацією, наприклад, про конференції і виставки;
  • faxNumber, telephone — номери факсів і телефонів;
  • founders — засновник компанії;
  • foundingDate — дата заснування;
  • interactionCount — це поле призначене для опису кількості взаємодій з користувачами (лайки, коментарі, завантаження);
  • location — місце, де розташована компанія;
  • geo — поле для зазначення географічних координат (latitude — широта, longitude — довгота, вказується цифрами через крапку);
  • members — члени організації;
  • reviews — відгуки або огляди;
  • openingHours — години роботи організації. Спочатку вказуються дні, після години роботи в ці дні. Перерахування днів робиться через кому, а проміжки через дефіс.

Готовий код виглядає приблизно таким чином:

<div itemscope itemtype="http://schema.org/Organization">  <span itemprop="name"> SeoPult </ span>
Контакти:
<div itemprop="address" itemscope itemtype="http://schema.org/PostalAddress">
Адреса: <span itemprop="streetAddress">Свободи, 50 </ span> <span itemprop="postalCode"> 125364 </ span>
<span itemprop="addressLocality"> Москва </ span>, </ div>
Телефон: <span itemprop="telephone"> +7 495 000-00-00 </ span>,  Факс: <span itemprop="faxNumber"> +7 495 000-00-00 </ span>,  Електронна пошта: <span itemprop="email"> support@seopult.ru </ span>
<time itemprop="openingHours" datetime="Mo-Fr 10:00-19:00"> З понеділка по п'ятницю з 10 ранку до 7 вечора </ time>
</ div>

Аналогічним чином здійснюється розмітка і за іншими схемами.

Спеціальні сервіси для створення семантичної розмітки

Семантична розмітка із використанням Schema.org вимагає додаткових трудових витрат, що може стати серйозною проблемою при великій кількості сторінок. Цю проблему частково можуть вирішити спеціальні сервіси, які полегшують створення коду. Schema Creator — один з інструментів, який дозволяє обходитися без ручного введення тегів. Достатньо лише вписати текст у відповідні поля, а код буде згенерований автоматично. Для різних популярних CMS існують спеціальні плагіни, які також спрощують створення семантичної розмітки.

Пісдумок
Використання семантичної розмітки сторінок є безсумнівним плюсом — пошуковики краще «розуміють» вміст сайту. Це дає можливість їм в більш зручному і зрозумілому вигляді надавати інформацію користувачам. Обов'язково перегляньте свій сайт на предмет можливості додати на сторінки семантичну розмітку!

Можливо вас зацікавлять подібні статті:

Коментарі

Немає коментарів до цієї статті.

Коментарі

Поля позначені як * потрібні обов’язково. Перед постінгом завжди робіть перегляд свого коментаря.





Мікроформати та мікродані

Мікроформати та мікродані Стара ідея «семантичної павутини», яку так і не зміг просунути консорціум W3C, останнім часом знову набирає обертів. У Росії «Яндекс» досить активно наполягає на впровадженні мікроформатів, а за кордоном зовсім недавно утворився несподіваний союз: Google, Bing і Yahoo! (точніше, Google, Inc., Yahoo, Inc. Та Microsoft Corporation) створили спільний проект schema.org. З його допомогою вони збираються прищепити вебмайстрам звичку розмічати сторінки тегами Microdata (поки чорновий стандарт HTML5). Треба відзначити, що цей формат розроблений без консультацій з W3C, а так як вебмайстрам набагато цікавіше «радувати» Google і інші пошукові системи, ніж якийсь туманний для багатьох консорціум, саме Microdata стане базовим в зарубіжному інтернеті. У Росії, до речі, поки що «Яндекс» не підтримав ініціативу schema.org, тому по Рунету поширюється інший формат семантичної розмітки: μF (мікроформати, http://microformats.org/wiki). Очевидно, що для успішної взаємодії з усіма пошуковиками доведеться дублювати семантичні описи сторінок. Хоча Google підтримує мікроформати hProduct, він явно буде віддавати перевагу власній мові розмітки.

Пару слів про Semantic Web

Веб-сторінка може бути простим документом без спеціальної розмітки для пошуковика. У цьому випадку йому доведеться аналізувати документ своїми методами, витягуючи і структуруючи необхідну інформацію. Якими б досконалими не були алгоритми ПС, помилки неминучі — особливо якщо потрібний не просто пошук за ключовими словами, а встановлення основного змісту (суті контенту). Семантична розмітка сторінок дозволить машинному розуму витягти дані, придатні для прямого розміщення в базу даних і для будь-якої обробки. Семантична павутина дає можливість пошуковику надавати прямі і відразу сформульовані на людській мові відповіді на запитання користувачів. Наприклад, на запит «рецепт борщу» пошуковик одразу видасть відповідь з інгредієнтами та їх кількістю, а на «скільки гігабайт пам'яті в ноутбуці Asus K73e» - цифру 4. Але пошукова система не ризикуватиме обдурити користувача — такі відповіді не можна будувати на основі аналізу сторінок! Відповіді повинні бути на сто відсотків вірними: не можна переплутати оперативну пам'ять і обсяг жорсткого диска, це дуже сильно зменшить лояльність користувача до пошукової системи. Задачу правильного розуміння контенту машиною вирішує розмітка спеціальними тегами.

Нижче розглянемо приклади опису продукту в двох головних форматах нинішнього покоління. Це тільки приклад, тут наведено не всі можливі параметри і «типи полів».

Google - microdata (schema.org)

<div itemscope itemtype="http://schema.org/Product">
<span itemprop="name"> Мікрохвильова піч Samsung MW73VR </ span>
<img src="samsung-microwave-mw73vr.jpg" alt='Мікроволновая піч Samsung MW73VR' />
<div itemprop="aggregateRating" itemscope itemprop="http://schema.org/AggregateRating">
Середня оцінка покупців <span itemprop="ratingValue"> 4 </ span>
на основі <span itemprop="reviewCount"> 11 </ span> відгуків </ div>

<div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
<span itemprop="price"> 2630 р. </ span>
<link itemprop="availability" href="http://schema.org/InStock" /> В наявності</ div>
<span itemprop="description"> окремостояча мікрохвильова піч об'ємом 20 л і потужністю 800 Вт </ span><div itemprop="reviews" itemscope itemtype="http://schema.org/Review">
<span itemprop="name"> Відмінна грубка </ span> - від <span itemprop="author"> Іван </ span>,
<meta itemprop="publishDate" content="2011-04-01"> 1 квітня 2011
<div itemprop="reviewRating" itemscope itemtype="http://schema.org/Rating">
<meta itemprop="worstRating" content = "1">
<span itemprop="ratingValue"> 4 </ span> /
<span itemprop="bestRating"> 5 </ span> stars
</ div>
<span itemprop="description"> Легко чистити </ span>
</ div>
</ div>

«Яндекс» - microformats (hProduct, поки використовується ПС тільки для обробки відгуків про автомобілі)

<div class="hproduct">
<span class="category"><span class="value-title" title="auto"></span></span>
<h2>
<span class="brand">Ford</span>
<span class="fn">Focus</span>
</h2>
<a class="photo" href="http://example.com/img/ford/focus-st.jpg"><img class="" alt="Ford Focus, хетчбек 5 дв ST" src="http://example.com/img/ford/focus-st-preview.jpg" align="left"></a>
<span class="identifier">
<span class="type">
<span class="value-title" title="body-type"></span>
</span>
<span class="value">хетчбек 5 дв</span>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="configuration-name"></span>
</span>
<span class="value">ST</span>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="displacement"></span>
</span>
2.5
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="transmission"></span>
</span>
MT
</span>
<span class="identifier">
(<span class="value">225</span>
<span class="type">
<span class="value-title" title="horse-power"></span>
л. с.
</span>)
</span>
<span class="identifier">
<span class="value">2009</span>
<span class="type">
<span class="value-title" title="prodyear"></span>
року випуску
</span>
</span>
<span class="identifier">
(<span class="value">передній</span>
<span class="type">
<span class="value-title" title="gear-type"></span>
привід
</span>,
</span>
<span class="identifier">
<span class="value">лівий</span>
<span class="type">
<span class="value-title" title="steering-wheel"></span>
руль
</span>).
</span>
<a class="url" href="http://example.com/ford/focus-st-2.5-mt.html">
Детальніше про цю конфігурацію</a>
<span class="identifier">
<span class="type">
<span class="value-title" title="dtpurchased"></span>
Куплений
</span>
<abbr class="value" title="2010-09-15">15 вересня 2010</abbr>
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="run"></span>
пробіг
</span>
15
</span>
<span class="identifier">
<span class="type">
<span class="value-title" title="run-metric"></span>
</span>
тис. км
</span>.
</div>

Валідація

Інструментарій для перевірки коду надає «Яндекс.Вебмастер», але можна скористатися і стороннім сервісом Optimus.

CMS з підтримкою мікроформатів

Впровадити семантичну розмітку вручну можна на невеликому сайті — або на невеликій кількості сторінок (наприклад, на сторінці з контактною інформацією). Вручну ж писати код для тисяч товарів інтернет-магазину абсолютно нереально. Тому необхідно користуватися системами управління контентом, що вже підтримують мікроформати — наприклад Drupal, Wordpress, Movable Type. Або ж писати модуль з таким функціоналом для використовуваної CMS.

Висновки
Пам'ятайте, що семантичної розміткою можна користуватися тільки для представлення в зручній для пошуковиків формі реального, існуючого, видимого відвідувачам сторінки контенту. Все інше (наприклад, спроби розмітки прихованих елементів) буде розпізнано, класифіковано як пошуковий спам та припинено жорсткими песимізаційними санкціями. Розмітка такого типу — це крок у майбутнє, її рекомендується використовувати скрізь, де тільки це можливо і доцільно. Поки що — обидва формати, але цілком можливо, що під тиском ініціативи schema.org «Яндекс» теж почне підтримувати Microdata, що усуне необхідність дублювання розмітки.

Можливо вас зацікавлять подібні статті:

Коментарі

Немає коментарів до цієї статті.

Коментарі

Поля позначені як * потрібні обов’язково. Перед постінгом завжди робіть перегляд свого коментаря.