Contenido Duplicado – Casos y Soluciones

1 comentario
Email This Post Email This Post

Hola lectores de la MaestrodeSEO,

Contenido Duplicado – Casos y SolucionesLa web es un conglomerado de información, interconectada, y que en muchas veces se repite como si fuese una fotocopia de un libro. Pues bien, cuando se encuentran páginas en URLs (direcciones) diferentes que poseen el mismo contenido, se dice, popularmente, que usted encontró un contenido duplicado.
El trabajo de los mecanismos de búsqueda, tales como Google, Yahoo y MSN, es indexar todo el tipo de información, tornándola accesible a través de sus  sitios web de búsqueda, pero y cuando ellos se encuentran con la misma “página” de un libro varias veces? En este caso, ellos aplican algoritmos para eliminar duplicadas, limpiando su índice de búsqueda de resultados repetidos.

Mi sitio posee contenido duplicado?

Una de las mayores dudas cuando usted lee este articulo es “Mi sitio posee contenido duplicado?”. Esta duda asota a grande parte de los desarrolladores web y profesionales de SEO pues detectar contenido duplicado no es una tarea simple, pero también no es imposible. Veamos algunos casos clásicos, que cubren cerca del 90% de los problemas de contenido duplicado:

Múltiples Dominios – el mismo contenido

En su articulo mas reciente, Pedro Dias, jefe del equipo de Google de Webspam de la lengua portuguesa, ilustro dos casos muy interesantes. Los casos son de dos bancos que compraron diversos dominios, con la probable idea de proteger a su marca, y al ingresar a sus URLs, usted se encontraba siempre con el mismo contenido. Por ejemplo, usted puede ingresar a cualquier URL de abajo y encontrará el mismo contenido:

http://www.millenniumbcp.pt/

http://www.bpatlantico.pt/

http://www.cidadebcp.pt/

http://www.bcp.pt/

http://www.banco-comercial-portugues.org/

http://www.banco-portugues-atlantico.info/

Este control de dominios ilustrado en el ejemplo es completamente errado pues los usuarios pueden confundirse a la hora de ingresar al sitio del banco, ademas de crear un linkagen cada vez para dos dominios, así, los mecanismos de búsqueda identifican todos los dominios como competidores, perjudicando su aparición en los resultados de búsqueda.

La solución para este problema es simple: basta adicionar un redireccionamiento 301 de todos los dominios para uno solo, así al ingresar a las URLs, el usuario y consecuentemente todo el link juice será direccionado para el dominio correcto.

Dominios con www vs Dominios sin www

Este es uno de los casos mas comunes de problemas con contenido duplicado. Haga una prueba: trate de ingresar su dominio con y sin www en la URL. Si obtiene el mismo contenido con las URLs diferentes entonces usted corre el riesgo de estar con una gran cantidad de contenido duplicado.

Esto sucede pues algunos usuarios pueden linkar para sus páginas con la URL misitio.com/pagina.html y otros pueden linkar para sus páginas con la URL www.misitio.com/pagina.html. Cual es la correcta?

Los mecanismos de búsqueda identifican estas páginas como diferentes y así deciden escoger una de las dos como el contenido original.

Para solucionar este problema, utilice nuevamente el redireccionamiento 301, haciendo con que al ingresar a su sitio web, todas las páginas sean direccionadas con O sin www. Es importante escoger solo un modo.

Páginas con URLs diferentes pero contenido igual

Este tipo de problema es muy común en sitios de comercio, donde se consigue ingresar dos páginas que posee el mismo contenido, a través de caminos diferentes. Por ejemplo:

Página Inicial > Televisores > 42″ > LG

Página Inicial > Televisores > LG > 42″

Imagine que haciendo los caminos ilustrados arrima, produzcan las siguientes URLs:

http://www.misitio.com/televisores/42/LG

http://www.misitio.com/televisores/LG/42

De esta manera, podemos ingresar el mismo contenido a través de dos URLs distintas, resultando en un contenido duplicado. Lo correcto en este caso es hacer uso de la Canonical Tag, que garantice que los mecanismos de búsqueda no caracterizaran las dos páginas como iguales, pero si identificar solo una como el contenido original.

Títulos y Meta Tags duplicadas

Páginas con title tags y meta description idénticas, hecho que ademas de poder ser interpretado como contenido duplicado también puede generar competencia innecesaria entre páginas de contenido diferente.

Google posee una área en el Google Webmaster Tools que muestra los problemas con títulos y meta descriptions duplicadas. Para  ingresar a esta área siga los pasos:

Contenido Duplicado – Casos y Soluciones

En esta área Google muestra la cantidad de meta descriptions duplicadas, ademas de mostrar cuales son estas páginas. Lo mismo es válido para títulos, donde este indica también  si existen títulos largos de mas.

Herramientas útiles para detectar contenido duplicado

Existen algunas buenas herramientas gratuitas, que pueden ayudar a identificar si u sitio tiene contenido duplicado:

1. Duplicate content tool: una herramienta gratuita solo basta registrarse y usar. Con esta es posible determinar:

  • La existencia de versiones con www y sin www de su página;
  • Verificar el cache de Google;
  • Verificar el nivel de similaridad entre las páginas de su sitio;
  • Verifica la dispersión del Pagerank ( si versiones con www y sin www de sus páginas en caso  de que existan contienen diferentes PRs );

2. Xenu: Verifica su sitio y retorna una tabla conteniendo todas las URLs disponibles en su sitio, todo lo que usted tiene que hacer es verificar las meta tags y ver si ellas no están duplicadas.

3. Google Webmaster Tools: También puede ser usado para encontrar e identificar títulos y meta tags duplicadas.

Guía Rápida para Detectar Contenido Duplicado

Vimos arriba como Google Webmaster Tools puede ayudarnos con eso, pero el proprio Google también es muy útil para eso y veremos ahora como utilizarlo para verificar si usted tiene un problema de contenido duplicado.

Lo que haremos es simplemente mirar en el index de Google para ver si está indexado, identificando lo que es duplicado.


Use su buen sentido

Comience haciendo una búsqueda de tipo sitio:ejemplo.com.

Pista: después de hacer la búsqueda, adicione &filter=0 al final de la URL que fue generada en barra de dirección de su navegador para que Google no omita ningún resultado.

Contenido Duplicado – Casos y Soluciones

Preste atención en la cantidad de páginas indexadas. Usted realmente tiene ese número de páginas o el número está muy alto? Si esta, usted tiene contenido duplicado.

Recorra los resultados

Probablemente fue la primera cosa que usted pensó, y si todavía no lo hace, recorra las páginas para ver los resultados.

Busque por URLs parecidas, mal hechas, con query strings (como ?=sessionid o ?first_page etc.), que lleven a páginas
idénticas. Preste mas atención en las ultimas páginas, son en las que generalmente se quedan escondidos los errores. Vea si los títulos y descripciones no son los mismos.

Verifique los resultados sospechosos

Pegue alguna query string encontrada en los resultados, por ejemplo:

?atributo_valor

Será que esa string le va a causar problema? Verifique que está indexado (página en el cache de Google) para ver si hay algún problema.

Lo Mismo que la versión sin  la string presenta un contenido diferente, ella puede tener las mismas meta tags y title. O sea, contenido duplicado.

Descubra cuantas páginas están duplicadas

No es muy difícil. Utilice el modelo para hacer una búsqueda:

sitio:ejemplo.com. inurl:atributo_valor (ejemplo que vimos arriba)

Aquí usted va a ver exactamente cuales páginas duplicadas están siendo generadas por algún atributo.

Conclusiones

Cada vez mas la web crece en contenido, sea en contenido duplicado o en contenido “original”. La cuestión es no dar paso para que su sitio web sufra de contenido duplicado, dividiendo todo su juice y haciendo que sus páginas compitan
entre si.

Incluya en su Checklist de SEO la verificación de contenido duplicado, pues esto puede hacer que usted gane una mejor
visibilidad.

Un abrazo!

Adicionar artigo ao Rec6 Adicionar artigo ao Linkk Adicionar artigo ao doMelhor Adicionar artigo ao Eu Curti Adicionar artigo ao del.icio.us

Sugerimos la lectura de estos otros artículos...

1 Respuesta a este post

Firme los comentarios de este artculo oRSS de comentário o TrackBack URL
  1. Site Search-Tutoría de SEO para la Búsqueda Interna | Blog Maestro de SEO disse,

    [...] Un detalle: aunque sea interesante que las URLs de las páginas sean creadas conforme a la palabra-clave utilizada, no es interesante que esas páginas sean indexadas pues pueden generar contenido duplicado. [...]

Deje un Comentario

Nota: La moderación de comentarios puede estar activada, entonces no hay necesidad de reenviar su comentario.