<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog Maestro de SEO &#187; Robots txt</title>
	<atom:link href="http://www.maestrodeseo.com/blog/category/robots-txt/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.maestrodeseo.com/blog</link>
	<description>Just another WordPress weblog</description>
	<lastBuildDate>Tue, 29 Jun 2010 19:40:56 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Robots.txt: 4 Cosas Que Usted Debe Saber</title>
		<link>http://www.maestrodeseo.com/blog/robots-txt/robots-txt-4-cosas-que-usted-debe-saber/</link>
		<comments>http://www.maestrodeseo.com/blog/robots-txt/robots-txt-4-cosas-que-usted-debe-saber/#comments</comments>
		<pubDate>Fri, 16 Oct 2009 20:21:12 +0000</pubDate>
		<dc:creator>Leandro Riolino</dc:creator>
				<category><![CDATA[Robots txt]]></category>
		<category><![CDATA[motores de búsqueda]]></category>
		<category><![CDATA[Pistas BÁSICAS]]></category>
		<category><![CDATA[Snippet]]></category>
		<category><![CDATA[URL]]></category>
		<category><![CDATA[user-agent]]></category>

		<guid isPermaLink="false">http://www.maestrodeseo.com/blog/?p=1871</guid>
		<description><![CDATA[Hola lectores del blog de la MaestrodeSeo, la semana pasada estuvimos en el SMX Brasil realizada en la ciudad de Sao Paulo, quiero dejar acá un abrazo a todas las personas que conocí allí y por las cuales están leyendo este artículo, siguiendo la línea un poco del evento, hoy vamos a dar 4 pistas [...]<p><a href="http://www.maestrodeseo.com/blog/robots-txt/robots-txt-4-cosas-que-usted-debe-saber/">Robots.txt: 4 Cosas Que Usted Debe Saber</a> is a post from: <a href="http://www.maestrodeseo.com/blog">Blog Maestro de SEO</a></p>
]]></description>
			<content:encoded><![CDATA[<p>Hola lectores del blog de la <a href="http://www.maestrodeseo.com/" target="_blank"><strong>MaestrodeSeo</strong></a>, la semana pasada estuvimos en el SMX Brasil realizada en la ciudad de Sao Paulo, quiero dejar acá un abrazo a todas las personas que conocí allí y por las cuales están leyendo este artículo, siguiendo la línea un poco del evento, hoy vamos a dar 4 pistas BÁSICAS, o 4 cosas que usted debe saber al respecto del <a href="http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/" target="_blank"><strong>robots.txt</strong></a>.</p>
<p><span id="more-1871"></span>El uso del robots.txt se volvió  ampliamente utilizado para un método de control y seguimiento de su sitio. Así mismo, se convirtió en una de las primeras cosas que usted debe comprobar para diagnosticar problemas de indexación o algún otro problema en su sitio. Si bien casi todos los webmasters ya utilizan este archivo, todavía hay algunas cosas que causan malentendidos, vamos a ellos:</p>
<p><strong>Robots.txt no dice que la pagina sera removida del indice de los search engines o motores de búsqueda </strong></p>
<p>La utilización del robots.txt puede evitar que los bots entren en una determinada página o directorio, pero si la URL fue indexada anteriormente a partir de fuentes externas, ella usará esas informaciones para hacer el juicio de la página y formular el snippet (título y descripción que aparecerá en los players de búsqueda).</p>
<p><strong>Los robots de búsqueda siguen apenas lo que usted especifica para ellos en el robots.txt</strong></p>
<p>Si utiliza una definición general para todos los bots (es decir: user-agent: *) y una definición específica para un robot especifico (por ejemplo: User-agent: Googlebot) en las secciones del User-agent, tenga en cuenta que Google (y otros indexadores), sólo seguirán las secciones más específicas y hará caso omiso de todas las demás secciones (incluyendo la general). Ex:</p>
<p><img class="aligncenter size-full wp-image-1872" title="Robots.txt- 4 cosas que debe saber" src="http://www.maestrodeseo.com/blog/wp-content/uploads/2009/10/Robots.txt-4-cosas-que-debe-saber.png" alt="Robots.txt- 4 cosas que debe saber" width="401" height="254" /></p>
<p><strong>De instrucciones claras en su archivo robots.txt</strong></p>
<p>Dentro del archivo robots.txt los bots leen una instrucción en una url  a partir de la izquierda a la derecha, lo que significa que ellos bloquean o permiten todo después del &#8220;/&#8221; en una URL, por ejemplo, si usted coloca: &#8221; Disallow: / a &#8221; todo lo que comienza con ‘a&#8221; la &#8220;será descartado por los bots, en este caso la página www.sudominio.com./ about.html será descartada por el user-agent.</p>
<p><strong>Proteja sus archivos con el robots.txt</strong></p>
<p>Mirando hacia el lado de la seguridad y la optimización para motores búsqueda (SEO), su sitio DEBE tener ese archivo robots.txt, aunque usted no quiera dejar ninguna dirección para el bot, en este caso haga el archivo y deje el patrón:<br />
User-agent: *<br />
Disallow:</p>
<p>Por esto, tenga la certeza de que:</p>
<p>• Todos los indexadores tratan de entender lo que usted quiere decir correctamente.</p>
<p>• Los indexadores siempre consiguen acceder a su robots.txt, por lo tanto, siempre mire el Logo de <a href="http://www.maestrodeseo.com/blog/google-seo/optimizando-el-sitio-con-google-webmaster-tools/" target="_blank"><strong>Google  Webmasters Tools</strong></a> para ver si Google bot encontró su archivo correctamente.</p>
<p>• Los Bots no irán a esperar para indexar su sitio en caso de no poder entender su Robots.txt (un caso muy improbable, pero puede suceder de todos modos).</p>
<p>Espero que les hayan gustado estas pistas sobre el robots.txt y no deje de verificar nuestra herramienta para la <a href="http://www.maestrodeseo.com/herramientas-seo/generador-robots-txt/" target="_blank"><strong>generacion de robots.txt</strong></a>.</p>
<p>Un abrazo para todos.</p>
<p><a href="http://www.maestrodeseo.com/blog/robots-txt/robots-txt-4-cosas-que-usted-debe-saber/">Robots.txt: 4 Cosas Que Usted Debe Saber</a> is a post from: <a href="http://www.maestrodeseo.com/blog">Blog Maestro de SEO</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.maestrodeseo.com/blog/robots-txt/robots-txt-4-cosas-que-usted-debe-saber/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tutoría de robots.txt</title>
		<link>http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/</link>
		<comments>http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/#comments</comments>
		<pubDate>Thu, 17 Sep 2009 16:02:36 +0000</pubDate>
		<dc:creator>Heron Inouye</dc:creator>
				<category><![CDATA[Robots txt]]></category>
		<category><![CDATA[Google Webmaster Central]]></category>
		<category><![CDATA[google webmaster tools]]></category>
		<category><![CDATA[Optimización de sitios]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[sitemap xml]]></category>
		<category><![CDATA[tutoría de robots.txt]]></category>
		<category><![CDATA[URL]]></category>

		<guid isPermaLink="false">http://www.maestrodeseo.com/blog/?p=931</guid>
		<description><![CDATA[Hola. Hoy expondré una tutoría sobre el robots.txt para ayudarlos en la optimización de sitios.
Como Crear un Archivo robots.txt 
Usted puede crear un robots.txt en cualquier editor de texto, pero existen varios generadores que usted puede encontrar en el sitio. Google ofrece esta herramienta en el Google Webmasters Tools.


Analizando el robots.txt 
En el Google Webmaster [...]<p><a href="http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/">Tutoría de robots.txt</a> is a post from: <a href="http://www.maestrodeseo.com/blog">Blog Maestro de SEO</a></p>
]]></description>
			<content:encoded><![CDATA[<p>Hola. Hoy expondré una tutoría sobre el robots.txt para ayudarlos en la <strong><a href="http://www.maestrodeseo.com/" target="_blank">optimización de sitios</a>.</strong></p>
<p><strong>Como Crear un Archivo robots.txt </strong></p>
<p>Usted puede crear un robots.txt en cualquier editor de texto, pero existen varios generadores que usted puede encontrar en el sitio. Google ofrece esta herramienta en el <strong>Google Webmasters Tools.</strong></p>
<p><strong><span id="more-931"></span><br />
</strong></p>
<p><strong>Analizando el robots.txt </strong></p>
<p>En el Google Webmaster Central, existe una herramienta de análisis muy eficiente, que muestra los errores que el crawler encontró durante el análisis de su sitio. Para más detalles los pueden encontrar en mi artículo de <strong>optimización de sitios usando el Google webmaster tools.<br />
</strong><br />
<strong> </strong></p>
<p><strong>Ejemplos de Formacion del robots.txt</strong></p>
<p>Permite que todos los  archivos sean indexados</p>
<blockquote><p>User-agent: *<br />
Disallow:</p></blockquote>
<p>No permite que ningun archivo sea indexado</p>
<blockquote><p>User-agent: *<br />
Disallow: /</p></blockquote>
<p>No permite que una carpeta sea indexada, con excepción del archivo myfile.html que está dentro de la carpeta</p>
<blockquote><p>User-agent: Googlebot<br />
Disallow: /folder1/<br />
Allow: /folder1/myfile.html<br />
<strong><br />
</strong></p></blockquote>
<p><strong>Información Contenida en el robots.txt </strong></p>
<p>Los motores búsqueda son destructivos por estándar. Ellos quieren indexar el máximo de información de calidad que consigan, y presumen que pueden indexar todo, a menos que alguien los haga parar.</p>
<p>Si usted especifica datos para todos los bots (*) y datos para bots específicos (como el Googlebot), sucede que los mandos específicos para bots serán seguidos mientras el Bot. especificado (en nuestro ejemplo el Googlebot) irá a ignorar los mandos globales. Luego, si usted hace un mando global porque quiera aplicar para un bot específico, entonces usted deberá colocar el mando para el bot específico también.</p>
<p><img class="alignnone size-full wp-image-932" src="http://www.maestrodeseo.com/blog/wp-content/uploads/2008/11/tutoria-robotstxt.jpg" alt="" width="500" height="225" /></p>
<p>Cuando usted bloquea la URLs para que ellas no sean indexadas en Google por el robots.txt, Google puede todavía mostrar estas URLs en los resultados de las investigaciones. Una solución más completa es bloquearlas usando las meta tags:</p>
<ul>
<li>&lt;meta name=”robots” content=”noindex”&gt;</li>
</ul>
<ul>
<li>&lt;meta name=”robots” content=”noindex,nofollow”&gt;</li>
</ul>
<p>Si usted no tiene un archivo robots.txt, los logs de los servidores irán a retornar como errores 404 siempre que un bot intente acceder al archivo. Usted puede hacer upload del archivo en blanco con el nombre robots.txt en la carpeta raíz de su sitio.</p>
<p>Algunos motores búsqueda también permiten que usted especifique la dirección de una sitemap XML en el archivo robots.txt.</p>
<p><strong>Caracteres Especiales</strong></p>
<p>Google, Yahoo! y MSN permiten el uso de caracteres especiales en el archivo robots.txt.<br />
Para bloquear el acceso a todas las URLs que incluyen una interrogación (? &#8211; URLs con parámetros vía GET), usted debe usar el siguiente código:</p>
<blockquote><p>User-agent: *<br />
Disallow: /*?</p></blockquote>
<p>Usted también puede especificar los archivos con determinadas extensiones usando el signo monetario ($). Por ejemplo: si usted quiere bloquear todas las páginas con extensión .asp, coloque en el robots.txt :</p>
<blockquote><p>User-agent: Googlebot<br />
Disallow: /*.asp$</p></blockquote>
<p><strong> </strong></p>
<p><strong>Excentricidades </strong></p>
<p>Sabemos que Google viene “llenando” formularios de investigaciones e indexando las páginas generadas. Para evitar que tales páginas sean indexadas, bloquee por el robots.txt. Suponga que la variable de investigación en la URL sea “search”. Entonces usted realizar esto:</p>
<blockquote><p>User-agent: *<br />
Disallow: /?search=</p></blockquote>
<p>Para evitar que las páginas generadas por investigación sean generadas.</p>
<p><strong>Analizando el Robots.txt</strong><br />
En el Google Webmaster Central, existe una herramienta de análisis muy eficiente, que muestra los errores que el crawler encontró durante el análisis de su sitio. Mas detalles pueden ser encontrados en mi articulo de optimizacion de sitios usando el Google Webmaster Tools</p>
<p><strong>Conclusiones</strong><br />
El uso del robots.txt es una importante técnica de control de la indexacion de su sitio y es uno de los primeros items para verificarse cuando se realiza una consultoria de SEO. Entonces este pendientey no se olvide de verificar su robots.txt.</p>
<p><a href="http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/">Tutoría de robots.txt</a> is a post from: <a href="http://www.maestrodeseo.com/blog">Blog Maestro de SEO</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.maestrodeseo.com/blog/robots-txt/tutoria-de-robots-txt/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

