Создание RSS-фидов
- Каким требованиям должна отвечать исходная страница отслеживания, чтобы робот смог проиндексировать мой сайт?
- Какие социальные сети поддерживаются Mysitemapgenerator?
- Как происходит формирование RSS
- Какие свойства микроразметки обрабатывает генератор?
- Как проверить микроразметку на страницах моего веб-сайта?
- Как происходит формирование полнотекстовых RSS в формате для экспорта в Google Publisher Center?
- Как происходит формирование полнотекстовых RSS в формате для экспорта данных в Яндекс.Новости?
- Как сообщить посетителям о моем RSS-канале?
Каким требованиям должна отвечать исходная страница отслеживания, чтобы робот смог проиндексировать мой сайт?
Исходная страница отслеживания должна быть доступна, возвращать HTML-код и содержать ссылки на внутренние страницы (при задании шаблона поиска – ссылки, которые ему соответствуют). Исходная страница так же может содержать внутрихостовый серверный редирект, который будет обработан.
Как происходит формирование RSS
Формирование фида производится на основе данных, полученных с Вашего сайта. Источником информации может служить разметка Schema.org Article, NewsArticle, BlogPosting, LiveBlogPosting и Open Graph Article, а так же стандартные теги HTML-документов.
При отсутствии микроданных, Mysitemapgenerator пытается автоматически определять содержимое публикаций, используя специальный алгоритм анализа веб-страницы. В зависимости от структуры Вашего веб-сайта Вы можете выбрать подходящие параметры в настройках генератора. Для достижения лучшего результата, мы рекомендуем использовать микроразметку содержимого при помощи Schema.org.
Какие свойства микроразметки обрабатывает генератор?
Генератор обрабатывает данные микроразметки Schema.org для статей (Поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting):
- headline - заголовок статьи.
- description - краткое описание.
- articleBody - полный текст статьи.
- image - ссылка на иллюстрацию.
- category - категория.
- datePublished - дата публикации.
Пример применения разметки Schema.org для новостных публикаций:
<div vocab="http://schema.org/" typeof="NewsArticle"> ... <h1 property="headline">Заголовок публикации</h1> <span property="description">Краткое описание</span> <img itemprop="image" src="http://youwebsiteurl/pictures/thumbnail.jpg" /> <span itemprop="datePublished" content="1998-09-04T19:25:33+00:00">Сегодня, 19:25</span> ... <div property="articleBody"> <p>Полный текст публикации</p> ... </div> ... </div>
Пример разметки Schema.org для статей:
<div itemscope itemtype="http://schema.org/Article"> <h1 itemprop="headline">Заголовок публикации</h1> <div itemprop="description">Аннотация к публикации</div> <div itemprop="articleBody"> <p>Полный текст публикации</p> ... </div> </div>
Генератор обрабатывает данные Open Graph для статей (Поддерживаемые типы: Article):
- og:title — название публикации.
- og:description — описание публикации.
- og:image — ссылка на иллюстрацию.
- article:published_time - дата публикации.
Пример применения разметки Open Graph для статьи:
<meta property="og:type" content="article" /> <meta property="og:title" content="Название публикации" /> <meta property="og:description" content="Отличная публикация" /> <meta property="og:image" content="http://youwebsiteurl/pictures/thumbnail.jpg" /> <meta property="article:published_time" content="1998-09-04T19:25:33+00:00" />
Если Schema.org не применяется на Вашем сайте, можно заключить полный текст публикации в HTML-тег <article>
Пример HTML-разметки для статьи, без применения микроданных:
... <head> ... <title>Название публикации</title> <meta name="description" content="Описание публикации" /> ... </head> <body> ... <article> <p>Полный текст публикации</p> ... </article> ... </body> ...
Если страницы статей используют одновременно разметку Schema.org и Open Graph - приоритетным значением считаются данные, содержащиеся в микроразметке Schema.org. В случае отсутствия или наличия пустых свойств в Schema.org, но при их наличии в Open Graph - они будут использованы.
Как проверить микроразметку на страницах моего веб-сайта?
Проверить правильность заполнения микроразметки Schema.org можно с помощью валидатора.
Как происходит формирование полнотекстовых RSS в формате для экспорта в Google Publisher Center?
В дополнение к стандартным элементам RSS 2.0 для экспорта данных в Google Publisher Center требуется специальный элемент "content:encoded", который содержит полный текст публикации:
<content:encoded>Полный текст публикации</content:encoded>
Чтобы включить полный контент публикаций, канал должен использовать дополнительное пространство имен:
xmlns:content="http://purl.org/rss/1.0/modules/content/"
Наш робот извлекает полный текст публикаций на веб-страницах, применяя специальный алгоритм или используя данные разметки Schema.org (поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting).
Как происходит формирование полнотекстовых RSS в формате для экспорта данных в Яндекс.Новости?
Кроме стандартных элементов RSS 2.0, для экспорта данных в Яндекс.Новости требуется специальный элемент "yandex-fulltext", который содержит полный текст публикации:
<yandex-fulltext>Текст публикации</yandex-fulltext>
Чтобы включить полный контент публикаций, канал должен использовать дополнительное пространство имен:
xmlns:yandex="http://news.yandex.ru"
В полном тексте не должны содержаться название источника и дата/время сообщения, а также контактная информация и любая другая информация, которая повторяется в каждом сообщении.
Наш робот может извлечь полный текст новостей, применяя специальный алгоритм, а также на страницах, использующих разметку Schema.org для статей (поддерживаемые типы: Article, NewsArticle, BlogPosting, LiveBlogPosting), используя содержимое тега со свойством "articleBody".
Как сообщить посетителям о моем RSS-канале?
Самый простой способ – создать ссылку на RSS-фид. При нажатии на нее посетители смогут подписаться на получение обновлений при помощи используемого RSS-агрегатора.
<a href="URL**">Подписка на RSS</a>
Другой способ сообщить о Вашем RSS-канале – добавить специальный тег в секцию <head> HTML-страницы:
<head> … <link rel="alternate" type="application/rss+xml" title="Название фида*" href="URL**"> … </head>
* "Название фида" - заголовок RSS-канала,
** "URL" - URL канала.
При наличии данного тега, некоторые браузеры добавляют специальную пиктограмму, являющуюся ссылкой на Ваш RSS-канал, расположенную в правом углу адресной строки.
Какие социальные сети поддерживаются Mysitemapgenerator?
Mysitemapgenerator поддерживает Twitter, Youtube, VK и Reddit. Для индексации доступен только публичный контент.