
SEO y Tipos de Archivos
Publicado por frank en 8 de Septiembre 2009| Categoría:SEOUna duda diferente que las personas tienen en cuánto a la indexación de sitios y páginas en las herramientas de búsqueda en Internet, es en relación a los tipos de archivos que son de hecho indexados – PDF, SWF, PHP, JPG, ASP entre otros – y como los motores búsqueda tratan esos tipos de archivo.
Primero que todo: los bots no indexan toda URL que encuentran en el sitio, ellos analizan el tipo de URL, el tipo del archivo apuntado por la URL para entonces tratarlo. Generalmente, esto está asociado al objetivo de la barredura del bot, o sea, si él salió a buscar imágenes, los links apuntarán a archivos JPG, GIF, etc., que van a interesar; mientras en una barredura genérica, no se acostumbra a bajar imágenes y otros archivos.
Tipos de Archivos
Los archivos son separados en algunos tipos, como por imágenes, textos, audio, vÃdeos y otros, siendo identificados por la extensión del archivo. La extensión del archivo es lo que viene tras el punto, tras el nombre del archivo:
nombre_de el_archivo.extenso
TÃpicamente, los archivos con extensión JPG y GIF son imágenes, los EXE son ejecutables (programas, juegos, aplicativos), los PDF para el formato de documentos del Adobe Acrobat Reader (número 1 para buscar “click here“), y los HTM, HTML, PHP, ASP entre otros para páginas de Internet.
SEO y Tipos de Archivos
Normalmente la extensión de una página en el sitio de nada influencia en el posicionamiento de un sitio o de una página, los motores búsqueda sólo verifican el tipo de archivo, pues cuando encuentran URLs apuntando a archivos con extensión EXE, ellas no hacen el download de esos archivos. Esto mismo ocurre para archivos MP3, AVI, WMA, WMV y otros formatos de audio y vÃdeo, pues son archivos grandes y archivos cuyo contenido el motor búsqueda no consigue evaluar.
Los archivos con extensiones de documentos de sitio (HTM, HTML, PHP, ASP,…) son seguidos e indexados normalmente. Los motores búsqueda hacen el download de esos archivos y evalúan su contenido. Pero, si el motor búsqueda no está haciendo una barredura por búsqueda de imágenes, al bajar un documento del sitio, este no hace el download de imágenes que estén en ese documento siempre, pues es muy poco probable que la imagen haya sido intercambiada, asà que el motor búsqueda ahorra tiempo, anchura de banda y capacidad de transferencia de bytes.
Por otro lado, si la barredura es una búsqueda por imágenes, entonces el motor búsqueda hace el download de imágenes con atención al texto que está próximo a las imágenes.
No puedo dejar de mencionar los archivos en flash: recientemente Google y la Adobe hicieron el anuncio de que ahora Google indexa sitios en flash, pues en verdad ninguna novedad fue publicada, pues ellos divulgaron que aunque Google tenga problemas para indexar flash, lo que no es novedad, porque Google consigue indexar alguna cosa (pero fue una brillante jugada de marketing de la Adobe…). Ahora Yahoo! también está en esas. De cualquier forma, por el bien de la Optimización para motores búsqueda (SEO) del sitio, evite Flash.
Lo que llama la atención entre los tipos de archivos es el PDF, pues, además de ser indexado, tiene un valor de PageRank atribuido y los search bots siguen los links en documentos PDF. Una caracterÃstica peculiar del PDF, que yo creo es la razón para que tenga un PageRank atribuido, es el hecho de poder ser usado un navegador/browser para visualizar un documento PDF – diferente de archivos DOC o PPT, que aunque sean indexados, es difÃcil saber si poseen o no PageRank, pero es posible que tengan sus links seguidos, una vez que los search bots consiguen identificar el texto en esos documentos
Por Ultimo
Demasiadas extensiones de archivos también tienen su download hecho por parte de los search bots, pues ellos intentan identificar el contenido, pero si de nada es útil encontrarlo, entonces los search bots descartan el archivo y el download. Otro punto interesante es que los searchbots, o el Googlebot por lo menos, identifican virus en los archivos que encuentran y, naturalmente, descartan el archivo. Pero, de modo general, cualquier archivo con contenido en texto puede ser indexado.
Cualquier duda, deje un comentario o entre en contacto con la gente por email. No dejen de firmar nuestro feed .
Abrazos y hasta la próxima!
Sugerimos la lectura de estos otros artículos...
- Indexación Avanzada en Flash
- SEO y Contenido Multimedia
- Google aprende a indexar contenidos en Flash
- Optimizando el Sitio con Google Webmaster Tools Parte Final
- SEO con JavaScript y Flash como Usarlo Correctamente – Final





