FAQ по RSS-каналам

Каким требованиям должна отвечать исходная страница отслеживания, чтобы робот смог проиндексировать мой сайт?
Исходная страница отслеживания должна быть доступна, возвращать HTML-код и содержать ссылки на внутренние страницы (при задании шаблона поиска – ссылки, которые ему соответствуют). Исходная страница так же может содержать внутрихостовый серверный редирект, который будет обработан.
Какие социальные сети поддерживаются Mysitemapgenerator?
Mysitemapgenerator поддерживает Twitter, Youtube, VK и Reddit. Для индексации доступен только публичный контент.
Как происходит формирование RSS
Формирование фида производится на основе данных, полученных с Вашего сайта. Источником информации может служить разметка Schema.org Article, NewsArticle, BlogPosting, LiveBlogPosting и Open Graph Article, а так же стандартные теги HTML-документов.
При отсутствии микроданных, Mysitemapgenerator пытается автоматически определять содержимое публикаций, используя специальный алгоритм анализа веб-страницы. В зависимости от структуры Вашего веб-сайта Вы можете выбрать подходящие параметры в настройках генератора. Для достижения лучшего результата, мы рекомендуем использовать микроразметку содержимого при помощи Schema.org.

Как робот может найти статьи, опубликованные на вашем сайте?

Как робот может найти статьи на вашем сайте

Какие свойства микроразметки обрабатывает генератор?
Генератор обрабатывает данные микроразметки Schema.org для статей (Поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting):
  • headline - заголовок статьи.
  • description - краткое описание.
  • articleBody - полный текст статьи.
  • image - ссылка на иллюстрацию.
  • category - категория.
  • datePublished - дата публикации.

Пример применения разметки Schema.org для новостных публикаций:
    <div vocab="http://schema.org/" typeof="NewsArticle">
        ...
        <h1 property="headline">Заголовок публикации</h1>
        <span property="description">Краткое описание</span>
	<img itemprop="image" src="http://youwebsiteurl/pictures/thumbnail.jpg" />
	<span itemprop="datePublished" content="1998-09-04T19:25:33+00:00">Сегодня, 19:25</span>
	...
        <div property="articleBody">
	    <p>Полный текст публикации</p>
	    ...
	</div>
        ...
    </div>

Пример разметки Schema.org для статей:
<div itemscope itemtype="http://schema.org/Article">
  <h1 itemprop="headline">Заголовок публикации</h1>
  <div itemprop="description">Аннотация к публикации</div>
  <div itemprop="articleBody">
	    <p>Полный текст публикации</p>
	    ...
  </div>
</div>

Генератор обрабатывает данные Open Graph для статей (Поддерживаемые типы: Article):
  • og:title — название публикации.
  • og:description — описание публикации.
  • og:image — ссылка на иллюстрацию.
  • article:published_time - дата публикации.

Пример применения разметки Open Graph для статьи:
    <meta property="og:type" content="article" /> 
    <meta property="og:title" content="Название публикации" /> 
    <meta property="og:description" content="Отличная публикация" />
    <meta property="og:image" content="http://youwebsiteurl/pictures/thumbnail.jpg" />
    <meta property="article:published_time" content="1998-09-04T19:25:33+00:00" />

Если Schema.org не применяется на Вашем сайте, можно заключить полный текст публикации в HTML-тег <article>
Пример HTML-разметки для статьи, без применения микроданных:
    ...
    <head>
	...
	<title>Название публикации</title> 
	<meta name="description" content="Описание публикации" />
	...
    </head>
    <body>
	...
	<article>
	    <p>Полный текст публикации</p>
	    ...
	</article>
	...
    </body>
    ...

Если страницы статей используют одновременно разметку Schema.org и Open Graph - приоритетным значением считаются данные, содержащиеся в микроразметке Schema.org. В случае отсутствия или наличия пустых свойств в Schema.org, но при их наличии в Open Graph - они будут использованы.
Как проверить микроразметку на страницах моего веб-сайта?
Проверить правильность заполнения микроразметки Schema.org можно с помощью валидатора.
Как происходит формирование полнотекстовых RSS в формате для экспорта в Google Publisher Center?
В дополнение к стандартным элементам RSS 2.0 для экспорта данных в Google Publisher Center требуется специальный элемент "content:encoded", который содержит полный текст публикации:
    <content:encoded>Полный текст публикации</content:encoded>

Чтобы включить полный контент публикаций, канал должен использовать дополнительное пространство имен:
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
HTML-разметка помещается в оболочку CDATA.
Наш робот извлекает полный текст публикаций на веб-страницах, применяя специальный алгоритм или используя данные разметки Schema.org (поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting).
Как происходит формирование полнотекстовых RSS в формате для экспорта данных в Яндекс.Новости?
Кроме стандартных элементов RSS 2.0, для экспорта данных в Яндекс.Новости требуется специальный элемент "yandex-fulltext", который содержит полный текст публикации:
    <yandex-fulltext>Текст публикации</yandex-fulltext>

Чтобы включить полный контент публикаций, канал должен использовать дополнительное пространство имен:
    xmlns:yandex="http://news.yandex.ru"
HTML-разметка помещается в оболочку CDATA.
В полном тексте не должны содержаться название источника и дата/время сообщения, а также контактная информация и любая другая информация, которая повторяется в каждом сообщении.
Наш робот может извлечь полный текст новостей, применяя специальный алгоритм, а также на страницах, использующих разметку Schema.org для статей (поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting), используя содержимое тега со свойством "articleBody".
Как сообщить посетителям о моем RSS-канале?
Самый простой способ – создать ссылку на RSS-фид. При нажатии на нее посетители смогут подписаться на получение обновлений при помощи используемого RSS-агрегатора.
  <a href="URL**">Подписка на RSS</a>

Другой способ сообщить о Вашем RSS-канале – добавить специальный тег в секцию <head> HTML-страницы:
<head>
  …
  <link rel="alternate" type="application/rss+xml" title="Название фида*" href="URL**">
  …
</head>

* "Название фида" - заголовок RSS-канала,
** "URL" - URL канала.
При наличии данного тега, некоторые браузеры добавляют специальную пиктограмму, являющуюся ссылкой на Ваш RSS-канал, расположенную в правом углу адресной строки.