
Evitando el Contenido Duplicado Accidental
Publicado por luismatos en 14 de Octubre 2009| Categoría:Contenido duplicadoEl contenido duplicado es algo muy común y que muchas veces es generado debido a simples errores de los webmasters y profesionales de optimización para motores búsqueda (SEO). Claro que existe también gente astuta que a propósito copian los contenidos ajenos y los publican como si fueran propios, pero ese no es el caso, en este artículo hablaré un poco sobre cómo evitar la generación de contenido duplicado, inclusive por usted, dentro de su propio sitio y de manera no intencional.

Algunos casos en que contenido duplicado accidental es generado:
• Problemas con la canonización de páginas, tales como la existencia y posibilidad de uso de la URL con y sin lo www sin redireccionamiento.
• Páginas con title tags y meta description idénticas, situación que además de poder ser interpretada como contenido duplicado también puede generar una competencia innecesaria entre páginas de contenido diferente.
• Home page no canonizada (ejemplo.: www.susitio.com. y www.susitio.com./index.php).
• Desconocimiento por parte de los desarrolladores s de sites porque de hecho las URLs son case sensitive (las mayúsculas y minúsculas son tenidas en cuenta). Las URLs, www.susitio.com./Coches y www.susitio.com./coches por ejemplo aunque referencia la misma página y son de un correcto modo la misma URL, para el crawler son URLs diferentes por que tenemos “C” minúscula y mayúscula.
Google viene esforzándose en desarrollar el algoritmo del Googlebot de modo que este identifique las páginas duplicadas e indexe las páginas correctas dentro de su sitio, pero sin embargo, siempre es bueno evitar el contenido duplicado porque pueden ocurrir los siguientes casos:
• La tasa de web crawl puede caer, el Googlebot puede perder tiempo identificando o hasta indexando páginas erradas y saltar las páginas que deberían realmente ser leídas.
• El Googlebot se puede equivocar y dar una página peor como la página oficial y la página correcta como contenido duplicado.
Herramientas útiles para detectar contenido duplicado
Existen algunas buenas herramientas gratuitas, que pueden ayudar a identificar si su sitio tiene contenido duplicado:
1. Duplicate content tool: Tool gratuito basta con registrarse y usar. Con esta herramienta es posible determinar:
• La existencia de versiones con wwwy sin www de su Página.
• Verificar el cache de Google
• Verificar el nivel de semejanza entre las páginas de su sitio.
• Examinar la dispersión del Pagerank (si versiones con www y sin www de sus páginas, en caso de que existan, contienen diferentes PRs).
2. Xenu: Verifique su sitio y retorne una tabla que contiene todas las URLs disponibles en su sitio, todo lo que usted tiene que hacer es verificar las meta tags y ver si ellas no están duplicadas.
3. Google Webmaster Tools: También puede ser usado para encontrar e identificar los meta tags duplicados.
Sugerimos la lectura de estos otros artículos...
- Contenido Duplicado – Casos y Soluciones
- Contenido Duplicado – Y ahora?
- Como Evitar El Contenido Duplicado Utilizando El Robots.txt
- Evitando Contenido Duplicado
- 7 Formas de Corregir Problemas de Contenido Duplicado






15 de Octubre de 2009 às 7:20 pm
[...] semana pasada, vimos acá los posts de Luís y de Bruno que mostraban cómo evitar el contenido duplicado y las pistas para solucionar ese problema. Ahora lo qué voy a hacer es mostrar otra forma de [...]
26 de Octubre de 2009 às 4:55 pm
[...] Para identificar estos contenidos lea algunos de nuestros posts relacionados a este asunto como: Evitando Contenido Duplicado Accidental, Encuentre Contenido Duplicado con el Google Webmaster Tools y aprenda las 7 Formas de Corregir [...]