
Contenido Duplicado – Casos y Soluciones
Publicado por Fábio Ricotta en 6 de Enero 2010| Categoría:Contenido duplicadoHola lectores de la MaestrodeSEO,
La web es un conglomerado de información, interconectada, y que en muchas veces se repite como si fuese una fotocopia de un libro. Pues bien, cuando se encuentran páginas en URLs (direcciones) diferentes que poseen el mismo contenido, se dice, popularmente, que usted encontró un contenido duplicado.
El trabajo de los mecanismos de búsqueda, tales como Google, Yahoo y MSN, es indexar todo el tipo de información, tornándola accesible a través de sus sitios web de búsqueda, pero y cuando ellos se encuentran con la misma “página” de un libro varias veces? En este caso, ellos aplican algoritmos para eliminar duplicadas, limpiando su índice de búsqueda de resultados repetidos.
Mi sitio posee contenido duplicado?
Una de las mayores dudas cuando usted lee este articulo es “Mi sitio posee contenido duplicado?”. Esta duda asota a grande parte de los desarrolladores web y profesionales de SEO pues detectar contenido duplicado no es una tarea simple, pero también no es imposible. Veamos algunos casos clásicos, que cubren cerca del 90% de los problemas de contenido duplicado:
Múltiples Dominios – el mismo contenido
En su articulo mas reciente, Pedro Dias, jefe del equipo de Google de Webspam de la lengua portuguesa, ilustro dos casos muy interesantes. Los casos son de dos bancos que compraron diversos dominios, con la probable idea de proteger a su marca, y al ingresar a sus URLs, usted se encontraba siempre con el mismo contenido. Por ejemplo, usted puede ingresar a cualquier URL de abajo y encontrará el mismo contenido:
http://www.millenniumbcp.pt/
http://www.bpatlantico.pt/
http://www.cidadebcp.pt/
http://www.bcp.pt/
http://www.banco-comercial-portugues.org/
http://www.banco-portugues-atlantico.info/
Este control de dominios ilustrado en el ejemplo es completamente errado pues los usuarios pueden confundirse a la hora de ingresar al sitio del banco, ademas de crear un linkagen cada vez para dos dominios, así, los mecanismos de búsqueda identifican todos los dominios como competidores, perjudicando su aparición en los resultados de búsqueda.
La solución para este problema es simple: basta adicionar un redireccionamiento 301 de todos los dominios para uno solo, así al ingresar a las URLs, el usuario y consecuentemente todo el link juice será direccionado para el dominio correcto.
Dominios con www vs Dominios sin www
Este es uno de los casos mas comunes de problemas con contenido duplicado. Haga una prueba: trate de ingresar su dominio con y sin www en la URL. Si obtiene el mismo contenido con las URLs diferentes entonces usted corre el riesgo de estar con una gran cantidad de contenido duplicado.
Esto sucede pues algunos usuarios pueden linkar para sus páginas con la URL misitio.com/pagina.html y otros pueden linkar para sus páginas con la URL www.misitio.com/pagina.html. Cual es la correcta?
Los mecanismos de búsqueda identifican estas páginas como diferentes y así deciden escoger una de las dos como el contenido original.
Para solucionar este problema, utilice nuevamente el redireccionamiento 301, haciendo con que al ingresar a su sitio web, todas las páginas sean direccionadas con O sin www. Es importante escoger solo un modo.
Páginas con URLs diferentes pero contenido igual
Este tipo de problema es muy común en sitios de comercio, donde se consigue ingresar dos páginas que posee el mismo contenido, a través de caminos diferentes. Por ejemplo:
Página Inicial > Televisores > 42″ > LG
Página Inicial > Televisores > LG > 42″
Imagine que haciendo los caminos ilustrados arrima, produzcan las siguientes URLs:
http://www.misitio.com/televisores/42/LG
http://www.misitio.com/televisores/LG/42
De esta manera, podemos ingresar el mismo contenido a través de dos URLs distintas, resultando en un contenido duplicado. Lo correcto en este caso es hacer uso de la Canonical Tag, que garantice que los mecanismos de búsqueda no caracterizaran las dos páginas como iguales, pero si identificar solo una como el contenido original.
Títulos y Meta Tags duplicadas
Páginas con title tags y meta description idénticas, hecho que ademas de poder ser interpretado como contenido duplicado también puede generar competencia innecesaria entre páginas de contenido diferente.
Google posee una área en el Google Webmaster Tools que muestra los problemas con títulos y meta descriptions duplicadas. Para ingresar a esta área siga los pasos:

En esta área Google muestra la cantidad de meta descriptions duplicadas, ademas de mostrar cuales son estas páginas. Lo mismo es válido para títulos, donde este indica también si existen títulos largos de mas.
Herramientas útiles para detectar contenido duplicado
Existen algunas buenas herramientas gratuitas, que pueden ayudar a identificar si u sitio tiene contenido duplicado:
1. Duplicate content tool: una herramienta gratuita solo basta registrarse y usar. Con esta es posible determinar:
- La existencia de versiones con www y sin www de su página;
- Verificar el cache de Google;
- Verificar el nivel de similaridad entre las páginas de su sitio;
- Verifica la dispersión del Pagerank ( si versiones con www y sin www de sus páginas en caso de que existan contienen diferentes PRs );
2. Xenu: Verifica su sitio y retorna una tabla conteniendo todas las URLs disponibles en su sitio, todo lo que usted tiene que hacer es verificar las meta tags y ver si ellas no están duplicadas.
3. Google Webmaster Tools: También puede ser usado para encontrar e identificar títulos y meta tags duplicadas.
Guía Rápida para Detectar Contenido Duplicado
Vimos arriba como Google Webmaster Tools puede ayudarnos con eso, pero el proprio Google también es muy útil para eso y veremos ahora como utilizarlo para verificar si usted tiene un problema de contenido duplicado.
Lo que haremos es simplemente mirar en el index de Google para ver si está indexado, identificando lo que es duplicado.
Use su buen sentido
Comience haciendo una búsqueda de tipo sitio:ejemplo.com.
Pista: después de hacer la búsqueda, adicione &filter=0 al final de la URL que fue generada en barra de dirección de su navegador para que Google no omita ningún resultado.

Preste atención en la cantidad de páginas indexadas. Usted realmente tiene ese número de páginas o el número está muy alto? Si esta, usted tiene contenido duplicado.
Recorra los resultados
Probablemente fue la primera cosa que usted pensó, y si todavía no lo hace, recorra las páginas para ver los resultados.
Busque por URLs parecidas, mal hechas, con query strings (como ?=sessionid o ?first_page etc.), que lleven a páginas
idénticas. Preste mas atención en las ultimas páginas, son en las que generalmente se quedan escondidos los errores. Vea si los títulos y descripciones no son los mismos.
Verifique los resultados sospechosos
Pegue alguna query string encontrada en los resultados, por ejemplo:
?atributo_valor
Será que esa string le va a causar problema? Verifique que está indexado (página en el cache de Google) para ver si hay algún problema.
Lo Mismo que la versión sin la string presenta un contenido diferente, ella puede tener las mismas meta tags y title. O sea, contenido duplicado.
Descubra cuantas páginas están duplicadas
No es muy difícil. Utilice el modelo para hacer una búsqueda:
sitio:ejemplo.com. inurl:atributo_valor (ejemplo que vimos arriba)
Aquí usted va a ver exactamente cuales páginas duplicadas están siendo generadas por algún atributo.
Conclusiones
Cada vez mas la web crece en contenido, sea en contenido duplicado o en contenido “original”. La cuestión es no dar paso para que su sitio web sufra de contenido duplicado, dividiendo todo su juice y haciendo que sus páginas compitan
entre si.
Incluya en su Checklist de SEO la verificación de contenido duplicado, pues esto puede hacer que usted gane una mejor
visibilidad.
Un abrazo!
Sugerimos la lectura de estos otros artículos...
- Encuentre Contenido Duplicado Con Google
- Evitando el Contenido Duplicado Accidental
- Contenido Duplicado – Y ahora?
- Canonización de URLs
- 7 Formas de Corregir Problemas de Contenido Duplicado





