Contenido duplicado: Soluciones recomendadas por Google

Cualquier contenido que aparezca en más de un lugar de Internet se considera como un contenido duplicado. Así que si encuentras el mismo contenido presente en dos o más sitios web, considéralo como duplicado.

Contenido duplicado

¿Qué tipo de contenido es contenido duplicado?

Hay diferentes tipos de contenido duplicado, todos los cuales pueden no ocurrir deliberadamente. Algunos contenidos duplicados son el resultado de ciertos aspectos técnicos de un sitio web.

Contenido Duplicado

El contenido duplicado es el contenido que está presente en las diferentes páginas web de un sitio web. Por ejemplo, la página de inicio de cualquier sitio web consta de tres elementos principales: el encabezado, el pie de página y la barra lateral o de navegación. Además de éstos, algunos sitios web también muestran publicaciones recientes en sus páginas de inicio. Cuando el robot de Google rastrea este sitio web, pueden encontrar estas nuevas entradas de blog presentes en más de un lugar del sitio web, por lo que se convierte en un contenido duplicado.

Contenido copiado/ Contenido raspado

Copiar contenido de un sitio sin el permiso del propietario se conoce como contenido copiado. El “content scraping” es la extracción de información de un sitio web mediante una técnica de software. Todavía hay mucha confusión sobre el “content scraping”, y Google lo practica también mostrando el contenido como fragmentos destacados. Sin embargo, con la actualización de Panda, cualquier tipo de actividad de scraping puede ser penalizada.

Curación de contenidos

Curación de contenidos es tomar información de la web y escribir un contenido usando las estadísticas y la información recibida de ellos. Google no considera esto como spam siempre y cuando se reescriba el contenido con sus propias palabras o se proporcione la fuente del contenido original de donde se tomó.

Sindicación de contenido

Sindicación de contenido es el método de enviar contenido a sitios de terceros como fragmentos, enlaces o piezas de contenido completo. Los sitios que se sindicen de contenido permiten que se publiquen en múltiples sitios. Esto significa que para una publicación sindicada, hay varias copias disponibles en la web.

¿El contenido duplicado afecta al SEO?

Para los motores de búsqueda como Google y Bing, el contenido duplicado puede dar lugar a ciertas cuestiones como la creación de confusión para el motor de búsqueda con respecto a qué versión del contenido considerar como original y el rango para las consultas de búsqueda. Esto también crea confusión entre los motores de búsqueda al determinar si deben dirigir las métricas de los enlaces, como la autoridad fiduciaria, la equidad de los enlaces, etc., a una página o distribuirla entre varias versiones.

Cuando un sitio contiene contenido duplicado, los dueños del sitio pueden sufrir de malas clasificaciones debido a las pérdidas de tráfico. Esto sucede principalmente debido a que los motores de búsqueda se confunden con múltiples versiones del mismo contenido y muestran sólo una de ellas, diluyendo así la visibilidad de cada uno de los duplicados.

El contenido duplicado también afecta a la equidad de los enlaces ya que otros sitios necesitan elegir cualquiera de las versiones del contenido. Esto lleva a que los enlaces entrantes se dividan entre varios sitios. Como los enlaces entrantes son un factor de clasificación, puede afectar la visibilidad en línea del contenido duplicado para todos los sitios web donde existe. El resultado neto es la incapacidad del contenido para clasificar en el SERP.

¿Qué causa el contenido duplicado?

El contenido duplicado puede ocurrir por muchas razones, la principal es técnica. Echemos un vistazo a las causas comunes a continuación:

Malentendido del concepto de URL

En la base de datos del CMS que alimenta un sitio web, probablemente sólo hay un único artículo, pero el software del sitio web puede permitir que el mismo artículo en la base de datos se recupere a través de más de un URL. En el caso del CMS, el artículo se identifica mediante una identificación única en la base de datos, pero en el caso de los motores de búsqueda, el URL actúa como un identificador. Por lo tanto, con múltiples versiones del mismo contenido presentes en diferentes URL, surge el problema del contenido duplicado.

Identificación de la sesión

La identificación de la sesión se utiliza para rastrear a sus visitantes en el sitio y permitirles almacenar artículos en su lista de deseos o en su carrito de compras. Para ello, es necesario dar a estos usuarios sesiones individuales. Una sesión es una breve historia de las actividades que los visitantes realizan en su sitio. La forma más común de almacenar estas identificaciones de sesión es en forma de cookies. Sin embargo, la mayoría de los motores de búsqueda no almacenan cookies. Debido a esto, algunos sistemas vuelven a utilizar identificaciones de sesión en la URL. Esto significa que cada enlace interno en el sitio web obtiene ese ID de sesión agregado a su URL. Como ese ID de sesión es único para esa sesión en particular, crea una nueva URL, lo que resulta en un contenido duplicado.

URL Parámetros utilizados para el seguimiento y Clasificación

Otra causa técnica para el contenido duplicado es el uso de parámetros de URL que no cambian el contenido de una página. Por ejemplo, cuando se busca http://www.example.com/keyword-x/ y http://www.example.com/keyword-x/?source=rss, ambos son URLs diferentes para el motor de búsqueda. Con el último URL, podría ser más fácil para usted rastrear la fuente desde la cual sus visitantes llegaron al sitio, pero para los motores de búsqueda, es un caso de contenido duplicado.

Scrapers y Content Syndication

A veces, los sitios web utilizan el contenido de un sitio determinado y no mencionan la fuente. En ese caso, los motores de búsqueda se vuelven inseguros sobre qué versión considerar original y mostrar en los resultados de la búsqueda. Este tipo de raspado de contenido puede afectar a ambos tipos de sitios: el que está raspando el contenido y el de donde se raspa.

Orden de Parámetros

CMS no siempre usan los URLs apropiados, pero los establecen en base a la categoría e ID, como /?id=1ycat=2. Para otros sistemas de páginas web, si introduces /?cat=2yid=1, en lugar de /?id=1ycat=2, te mostrarán el mismo resultado, pero para los motores de búsqueda, son dos URLs completamente diferentes. Si su sitio sirve contenido duplicado a diferentes URLs sin usar ningún parámetro, debería definir una distribución canónica que bloquear el rastreo para ellos.

Paginación de comentarios

CMS, como WordPress, tienen la opción de paginación de comentarios. Esto lleva a que el contenido se duplique a través de una URL de artículo y páginas de comentarios.

WWW vs. Non-WWW

Esta es una de las causas más frecuentes de duplicación de contenido a través de un sitio web. Cuando su contenido es accesible en ambas versiones, www y no-www, el motor de búsqueda lo considerará como contenido duplicado. El mismo problema surge con el contenido HTTP y HTTPS también.

¿Hay una penalidad por el contenido duplicado en un sitio web?

El contenido duplicado es diferente del contenido copiado cuando se trata del contexto. Mientras que el contenido copiado se hace conscientemente, el contenido duplicado puede surgir debido a fallas técnicas, como se mencionó anteriormente. John Mueller de Google declaró que el motor de búsqueda no penaliza a un sitio por contenido duplicado, pero si tienes millones de páginas de este tipo en tu sitio, entonces estás llamando a los riesgos.

Google siempre recompensa a los sitios web con contenido original de alta calidad. Si intenta manipular el contenido existente volviéndolo a publicar en su sitio, alterando unas cuantas frases o utilizando unas cuantas palabras clave nuevas, seguirá sin aportar ningún valor a los usuarios. Lo más seguro que puede hacer como dueño de un sitio web para aumentar su ranking SEO es evitar copiar el contenido de otros sitios o repetir el contenido de su propio sitio web.

¿Cuánto contenido duplicado es aceptable?

Google no considera el contenido duplicado como spam, y no lleva a su sitio a ser penalizado a menos que sea con la intención de manipular los resultados de búsqueda. El único problema que tiene con el contenido duplicado es que, aunque su sitio lo haya publicado inicialmente, otros sitios web que hayan copiado ciegamente el contenido pueden aparecer en el resultado de las consultas de búsqueda relacionadas. Para evitar que alguien utilice una versión copiada de su contenido, puede presentar una solicitud de eliminación en virtud de la Ley de Derechos de Autor del Milenio Digital. Mientras que Google intenta encontrar la fuente original del contenido para que aparezca en los resultados de búsqueda, el bloqueo del acceso a piezas de contenido duplicadas puede dificultar la capacidad del motor de búsqueda para rastrear todas las versiones y filtrar los mejores resultados.

Cómo tratar el contenido duplicado: Soluciones recomendadas de Google

Aquí hay algunas formas prácticas de hacer frente a la duplicación de contenido en la web:

301 Redirecciones

Si su sitio ha sido reestructurado, use redirecciones 301 en sus archivos .htaccess para redirigir a los usuarios, los bots de Google y otras arañas. Esto le dará una señal al motor de búsqueda respecto a qué URL priorizar sobre las demás.

Ser consistente y Usar dominios de nivel superior

Trata de mantener tu conexión interna tan consistente como sea posible. Para ayudar a Google a ofrecer la versión más adecuada de un contenido, se recomienda encarecidamente utilizar dominios de primer nivel para gestionar el contenido específico de cada país.

Sindicar con cuidado

Si sindica su contenido en otros sitios, Google siempre mostrará la versión que considere más apropiada para los usuarios, que puede no coincidir con la versión que usted personalmente prefiere. Sería útil que su contenido se sindicara en otros sitios con un enlace al artículo original. Puede solicitar a quienes utilicen el contenido sindicado que utilicen metaetiquetas de noindex para evitar que los motores de búsqueda como Google indexen su contenido.

Minimizar la repetición de la plantilla

Si está utilizando el texto de derechos de autor en la parte inferior del contenido que publica, en lugar de añadir el texto completo debajo de cada artículo escrito, puede añadir un pequeño resumen y luego simplemente enlazar con una página que contenga más detalles sobre el mismo. Además, también puedes utilizar la herramienta de gestión de parámetros para indicar a Google cómo tratar tus parámetros de forma específica.

Evitar que se publiquen resguardos

A los usuarios no les gusta ver páginas en blanco sin contenido. Esto arruina su tiempo y afecta a la experiencia del usuario, algo que Google considera muy importante. Por lo tanto, no publique páginas en su sitio web sin contenido en ellas. En caso de que publique tales páginas, evite que sean indexadas usando la etiqueta meta de noindex.

Entender su CMS

Familiarícese con su Sistema de Gestión de Contenidos y entienda cómo se publica el contenido en su sitio. Los blogs y los foros a menudo tienden a mostrar el mismo contenido en más de un formato. Por ejemplo, una nueva entrada de blog puede aparecer en la página de inicio de un sitio web y también en la página de la categoría.

Minimizar la similitud de contenido

Si tiene más de una página que sea similar, considere hacer que cada pieza de contenido sea única añadiendo contenido valioso o fusionándolas en una sola siempre que sea posible.

Conclusiones acerca del contenido duplicado

El contenido duplicado está muy difundido en la web. Debe vigilar su sitio web para evitar problemas de contenido duplicado en su sitio. Para el contenido copiado de su sitio a otro, siempre puede tomar acciones legales bajo la Ley de Derechos de Autor. Notará una gran diferencia en el ranking y el rendimiento de su sitio web con sólo deshacerse de los problemas de contenido duplicado. Así que no corra riesgos y céntrese en el desarrollo de contenido de calidad para su sitio web.



Este sitio web utiliza cookies y le pide sus datos personales para mejorar su experiencia de navegación.