seo дублирано съдържание

Колкото и впечатляващ да е алгоритъмът на Гугъл, той често не разполага с нещо, което принадлежи само и единствено на хората: здрав разум.

Известно е, че поставянето на едно и също съдържание на няколко страници създава дублирано съдържание.Което води до проблеми със SEO на сайта,

но какво става, ако създадете страници за няколко сходни неща, които обаче имат важни различия? Алгоритмите ги означават като дублирани, макар че хората нямат проблеми да различават страници с подобно съдържание като например сайтове за:

  • Електронна търговия: подобни продукти с множество варианти или цветове
  • Пътуване: хотелски клонове, дестинации с подобно съдържание
  • Обяви: изчерпателни списъци за идентични елемент
  • Бизнес: страници за местни клонове, предлагащи същите услуги в различни региони

В такъв случай Гугъл ги индексира като страници с подобно съдържание, макар че самата им същност е различна. Затова възниква въпроса: Как при SEO за сайт, да се справим с дублираното съдържание и как Гугъл да го индексира правилно за по добро SEO на сайта ни?

Опасността от дублиране на съдържанието

Дублиращото се съдържание създава много проблеми за сайта ви като например:

  • Загуба на класиране за уникални страници, които несъзнателно се конкурират за едни и същи ключови думи
  • Невъзможността да се класират страници в търсачката, защото Google избрира една страница като основна

Как машините идентифицират дублирано съдържание

Google използва алгоритми, за да определи дали две страници или части от страници са с дублирано съдържание.

Откриването на сходството на Google се основава на техния патентован алгоритъм Simhash, който анализира блокове със съдържание на уеб страница. След това той изчислява уникален идентификатор за всеки блок и съставя хеш или „пръстов отпечатък“ за всяка страница.

Тъй като броят на уеб страниците е огромен, мащабируемостта е ключова. Понастоящем Simhash е единственият възможен начин за намиране на дублирано съдържание в мащаб.

Simhash хеш:

  • Спестяват време. Данните се получават само след едно обхождане на страницата
  • Страниците лесно се сравняват, благодарение на фиксираната им дължина.
  • Може да намери почти дубликати. Той приравнява малки различия на страница с малки промени в хеш, за разлика от много други алгоритми. Това означава, че разликата между всеки два пръстови отпечатъка (или хеша) може да бъде измерена алгоритмично и изразена като процент.

Google използва техники като:

  • Групиране: чрез групиране на съвкупности от достатъчно сходни страници трябва да се сравняват само пръстови отпечатъци в даден клъстер, тъй като всичко останало е вече класифицирано като различаващо се съдържание.
  • Оценяване: за изключително големи клъстери се прилага средна прилика след изчисляването на определен брой двойки пръстови отпечатъци.

    пръстови "отпечатъци" на страница като seo инструмент
    Сравнение на пръстовите „отпечатъци“ на страницата

И накрая, Google използва система за прилика, която изключва определени блокове с идентично съдържание (например: заглавия, навигация, странични ленти и др.) Тя взема предвид предмета на страницата, като ги им прави анализ, за ​​да определи кои думи на страницата се появяват най-често и са най-важни.

Анализиране на дублирано съдържание със Simhash

Ще разгледаме карта със съдържание, означено като подобно, използвайки Simhash. Тази диаграма от OnCrawl препокрива анализа на вашата дублирана стратегия за съдържанието на клъстери на дублирано съдържание.

Анализът на съдържанието на OnCrawl включва също съотношения на сходство, клъстери на съдържание и n-грамов анализ. OnCrawl показва съдържанието на дублиран блок, което може да бъде презаписано и променено.

Карта на съдържанието на уеб страница. Всеки блок представя клъстър с подобно съдържание.
Карта на съдържанието на уеб страница. Всеки блок представя клъстър с подобно съдържание.

Решаване на проблема с  дублиращото се съдържание

Няма никакъв трик, който да успее да залъже търсачката , че вашите уникални страници не са дублирани, т.е не можем да променим начина, по който Google идентифицира дублиращо се съдържание. Въпреки това все още има решения, които да уеднаквят вашето възприятие за уникално съдържание и възприятието на Google и същевременно да ранкира сайта ви по съответните ключови думи.

Ето четири стратегии, които можете да адаптирате към вашия сайт.

  • Намалете броя на аспектите
    Ако дублираните страници са свързани с аспекти, може да имате проблем с индексирането. Поддържайте аспектите, които вече се класират, и ограничете броя на тези, които позволявате на Google да ги индексира.
  • Направете вашите страници уникални
    Запомнете: малките разлики в съдържанието създават малки разлики в пръстовите отпечатъци на Simhash. Трябва да направите значителни промени в съдържанието на страницата, за да видите значителни промени в Simhash.
  • Обогатете съдържанието на страницата като:Добавете текстово съдържание към страниците.
    Добавете различни описания на изображенията.
    Включите секция за мнения на клиентите (Ако отзивите се отнасят за няколко страници, обединете страниците!).
    Добавете допълнителна информация.
    Използвайте различни изображения.
    Намалете обема на общия изходен код между подобните страници
    Подобрете семантичната плътност на страниците.
  • Създадете референтни страници за класиране
    референтна страница ,създаване и оптимизация
    Създаване на референтна страница

    Ако обогатяването на страниците ви е невъзможно, помислете за създаване на една референтна страница, която да заеме мястото на всички „дублирани“ страници. Тази стратегия използва същия принцип като популяризирането на основната страница по няколко ключови думи. Това е особено полезно, когато имате няколко версии на продукт, които трябва да поддържате като отделни страници.Това също може да бъде от полза за уебсайтовете за обяви, сайтове за търсене на работа и други подобни. Референтните страници трябва да групират списъците по една характеристика;например местоположението (град) се използва най-често.

Какво можете да направите?

  1.  Създайте референтна страница, която обединява съдържанието на всички страници с „дублирани“ продукти. Тя трябва да популяризира всички ключови думи, които искате да използвате, и да свързва всички страници „дубликат“.
  2. Задайте уникалния URL адрес за всяка „дублирана“ страница към референтната страница.
  3. Свържете дублираните страниците.
  4. Оптимизирайте навигацията в сайта, за да популяризирате референтната страница

Укрепени чрез връзки от страниците „дубликат“, оригиналните страници с комбинирано съдържание стават по-лесни за класиране.

Бъдещето на дублираното съдържание

Способността на Google да прочита съдържанието на дадена страница непрекъснато се развива с все по-прецизната способност да се идентифицира един сайт и да се прави разлика между уеб страниците, уникалното съдържание, идентифицирано като дубликат

Дотогава единственото, което можете да направите е да разберете защо съдържанието ви изглежда е отчетено като дублирано в Google и можете да го адаптирате, за да измамите Google. Това са двете ключови неща, които покрихме в тази статия.