Google requiere un archivo robots.txt para indexar una web

Investigando la optimización SEO en páginas web realizadas con DRUPAL he vuelto a encontrar la siguiente afirmación de John Mueller (analista de Google) del 1 de diciembre de 2008:

Si Googlebot no puede acceder al archivo robots.txt (porque por ejemplo el servidor devuelva un código de error 5xx) entonces no va a indexar la página web.

Lo cual significa que si no hay archivo robots.txt, Google no va a indexar la página web.

El comentario está en Google Webmaster Help: “When does link exchange between sites owned by the same company cause a google penalty“. El usuario es JohnMu y la entrada es de 1 dic 2008, 13:21. La entrada está bajando bastante hacia abajo en la conversación.

  • Share/Bookmark

Entradas relacionadas:

  1. Tags regionales en resultados de búsqueda de Google
  2. Resumen breve de los puntos más importantes de SMX EAST
  3. 8 consejos para escribir mejor código web
  4. Google ha comenzado a indexar AJAX
  5. Google ha incluido dos nuevas funcionalidades en sus Webmaster Tools

 

2 comentarios para “Google requiere un archivo robots.txt para indexar una web”

  • Se me ha olvidado añadir lo siguiente al final del post:
    Yo tengo mis dudas que esto sea cierto, ya que habitualmente me encuentro con páginas realizadas por otras empresas / personas y muchas de ellas están indexadas en Google, sin tener robots.txt.
    Voy a hacer unos cuantos experimentos con este tema. Os mantengo informados.

  • [...] Google requiere un archivo robots.txt para indexar una web … Tags: internet, marketing, seo, valencia, web Share this post! Twitter Digg Facebook Delicious StumbleUpon Google Bookmarks LinkedIn Technorati Favorites This entry was posted on 4 Marzo 2010 at 13:43 pm, and is filed under Sin categoría. Follow any responses to this post through RSS 2.0. You can leave a response or trackback from your own site. [...]