HTML-код: Распространенные ошибки SEO

HTML-код: Распространенные ошибки SEO

//

Содержание:

Страницы без объявления doctype?

Определение типа документа (doctype) в начале документа указывает, к какому типу он относится. Речь идет о версии языка разметки, точнее, HTML, который используется и именно так браузер понимает, как правильно отобразить веб-сайт.

Если декларация отсутствует, это не катастрофа, поскольку многие браузеры могут с ней справиться. Однако это может привести к ошибкам в отображении. Это происходит потому, что если декларация doctype отсутствует, браузер посетителя автоматически переключается в режим Quirks. Это режим совместимости, предназначенный для обеспечения корректного отображения устаревших и недействительных кодов. Таким образом, речь идет не об обеспечении функционирования, а о включении желаемого рендеринга.

Если декларация типа документа отсутствует, ее можно легко интегрировать. Оно просто вставляется над элементом head.

Страницы без атрибута HTML-lang

Страницы без атрибута HTML-lang (а также без атрибута hrefelang) не содержат в программном коде ссылки на языковую версию сайта. Это может иметь влияние на две основные области: оптимизация поисковых систем и использование программ для чтения с экрана.

С атрибутом lang=“de”, например, веб-сайт указывает на то, что он написан на немецком языке. Это позволяет поисковым системам сделать вывод о том, на каком языке и в какой стране этот сайт актуален. Устройства чтения с экрана также могут определить правильное произношение.

Страницы без атрибута HTML-lang

Однако, по словам Джона Мюллера из Google, тот, кто хочет заниматься международным SEO, должен полностью игнорировать атрибут lang и использовать исключительно hreflang в качестве инструмента принятия решений о языковых версиях. Это позволяет интегрировать ссылки на соответствующие другие версии и на саму страницу в исходный код и таким образом однозначно указать, какая версия где находится.

Причина низкой важности атрибута lang заключается в том, что неправильное использование атрибута lang часто встречается из-за копирования шаблонов. Атрибут hreflang гораздо чаще используется правильно и поэтому учитывается Google.

Установка кодировки символов в HTML

Кодировка символов в HTML контролируется в заголовке. Спецификация метатега сообщает браузеру правильную кодировку:

<meta charset=”UTF-8″>

Это классический пример разумной кодировки символов. UTF-8 (Unicode) в последние годы получила широкое распространение в качестве глобальной кодировки символов и теперь считается стандартом. Он соответствует ASCII в первых 128 символах. Таким образом, для английского и многих западных языков она требует небольшого объема памяти, его можно частично обрабатывать также в текстовых редакторах, которые не поддерживают UTF-8.

Однако есть страны, регионы и приложения, где чаще используются более сложные наборы символов, например, UTF-16.

Может ли Google найти скрытые страницы или контент?

Почему правильная кодировка так важна? Некоторые символы часто отображаются на сайте неправильно. Вместо них появляются знаки вопроса, квадратики или другие символы, не имеющие ничего общего с первоначально выбранным символом. Многие переходят к замене этих символов на буквенные коды, то есть на так называемые именованные символы.

Но эта замена – лишь обходной путь, который не нужен из-за правильной кодировки символов. Проблема: если кодировка символов установлена неправильно, браузер должен сам выяснить, какая это кодировка. Если это не удается, то специальные символы перестают читаться.

С другой стороны, четкая кодировка, такая как UTF-8, присваивает каждому символу Unicode уникальную символьную строку, длина которой может достигать четырех байт. Если браузер знает, с какой кодировкой он имеет дело, он также может назначать и отображать символы без каких-либо проблем.

Disallow

Файл robots.txt считается первой важной подсказкой. Здесь вы можете указать, какие страницы и подстраницы вашего сайта не должны сканироваться Google-ботом. В этом случае Google не будет посылать туда ботов и не будет захватывать контент. Если вы хотите быть уверенным, что ваш контент не появится в Google, это лучший выбор.

Создайте текстовый файл с именем robots.txt.

Вставьте в него следующий код:

User-agent: *
Disallow: Url вашей страницы

С помощью звездочки после “User-agent” вы обращаетесь ко всем ботам поисковых систем. Если вы хотите запретить доступ на свой сайт только ботам Google, вам придется назвать их по отдельности после “User-agent”. Но с помощью “Googlebot” вы охватите их всех. Если вы хотите исключить конкретных ботов, вы, вероятно, найдете их в следующем списке:

  • “Googlebot-Image/1.0” для поиска изображений Google.
  • “Googlebot-Video/1.0” для видео.
  • “Googlebot-Mobile/2.1” для мобильных устройств.
Использование HTML-тегов

С помощью “Disallow” вы указываете страницы, которые Google не должен индексировать. В данном случае это будет вся страница. Однако вы также можете указать вложенные папки или отдельные страницы, если хотите скрыть от Google только их части.

После того как вы ввели всю информацию, вы загружаете robots.txt в корень вашего URL. После этого Google найдет его, но не будет индексировать те части страницы, которые вы указали.

Использование HTML-тегов

Если вы не хотите скрывать от Google весь свой сайт, а хотите, чтобы Google не индексировал только определенные подстраницы, то тег noindex – лучший вариант. Вам просто нужно включить следующий метатег на соответствующей странице в исходный код:

<meta name="robots" content="noindex" />

Однако, в то время как функция disallow является очень строгим указанием для краулеров Google, использование тега noindex рекомендуется для того, чтобы Google не воспринимал его как запрет, а скорее как совет. Поэтому noindex обычно используется больше для оптимизации поисковых систем, чем для предотвращения индексации. Google обычно находит такие страницы.

Скрытие контента с помощью запроса пароля

Если вы защитите часть сайта или даже весь сайт паролем, Google также не сможет просмотреть содержимое. Недостаток: всем, кто посещает сайт, требуется пароль для просмотра содержимого.

Этот вариант также технически намного сложнее. Однако если вы хотите быть уверены, что ваш контент защищен от несанкционированного просмотра, это лучший выбор. Большинство SEO-специалистов дополнительно устанавливают для страницы входа в систему значение Disallow для защиты конфиденциальных данных.

Что такое тексты Lorem Ipsum?

Когда у дизайнера/разработчика еще нет в наличии текста, который впоследствии должен быть помещен в определенное место в журнале или на сайте, он использует так называемые фиктивные тексты. Другими словами, это заполнитель. С его помощью разработчики могут определить распределение текста на странице, проверить пространство, необходимое для шрифта, и оценить читабельность.

Буквы и длина слов практически полностью соответствуют естественному латинскому языку. Это гарантирует, что фиктивный текст и реальный текст вряд ли будут сильно отличаться визуально. А Lorem Ipsum непонятен и бессмыслен, это вербализация латыни. Поэтому зритель не отвлекается на фиктивный текст. Lorem Ipsum сейчас, вероятно, самый известный фиктивный текст в мире, и люди перестают читать после первых двух слов, когда сталкиваются с ложным текстом.

Предыдущая

Как эффективно управлять командой на удаленке

Следующая

Техническая SEO оптимизация статей

Последние от Должен прочитать