aramirez.es

Alberto Ramírez Website


17 de marzo de 2009

Eliminar URL de Google

3 comentarios >>

A veces necesitamos cambiar el sistema de enrutamiento de nuestra aplicación, si í©sta lleva algún tiempo en lí­nea sus páginas estarán indexadas en Google. Según el cambio que requiramos en el routing de la web puede ocurrir que, se pierdan varias URL's (si es un cambio pequeño), se pierdan directorios completos (un cambio mayor, por ejemplo un directorio virtual que cambie de nombre) o por último y en el peor de los casos, que se necesite añadir un parámetro inicial en la URL (como por ejemplo una provincia: http://urldelaweb.com/:provincia) donde se perderá por completo el número de páginas indexadas.

Como no podí­a ser de otra forma, en uno de los proyectos que llevo se dio este último caso. Se hizo una actualización de la web para expandirla a todas las provincias de su comunidad autónoma (antes solo estaba para una provincia determinada) y además el cliente querí­a que la web se montara en su URL con la provincia como primer parámetro. Pues se perdieron las más de 1100 páginas indexadas en Google.

Investigando un poco acerca de como hacer que Google elimine las URL's que ya no existen, encontrí© varias opciones. Lo primero de todo y si una aplicación está bien hecha, la página que no se ha encontrado debe devolver un código de error 404, y no hacer una redirección al index o algo por el estilo como he visto en algunas web's. Si esto lo cumple nuestra web, las opciones que tenemos son las siguientes:

1. Archivo robots.txt: con í©l podemos decirle a los spiders que revisan nuestro sitio, a quí© páginas o directorios queremos (o no) que accedan:
    User-agent: *
    Disallow: /directorio
    Disallow: /directorio2/pagina.html

    Con í©sto le decimos que no acceda a "directorio" y que tampoco haga lo propio con "directorio2/pagina.html".

2. Herramientas para webmasters de Google: este conjunto de herramientas que ofrece Google brinda la posibilidad de eliminar páginas o directorios de su í­ndice. Para ello (si no lo tenemos hecho ya) hay que asociar y verificar la aplicación web a nuestra cuenta de Google. Esto es tan fácil como:

  • Entrar al centro de herramientas de webmasters con nuestros datos de usuario.
  • Añadir el sitio web y verificarlo.
  • En Herramientas > Eliminación de URL se le mandan a Google las peticiones de eliminación que deseemos.

3. Metaetiqueta NOINDEX: otra opción que puede complementar a las dos anteriores es, añadir una metaetiqueta noindex a la página de error 404 que devuelve la petición a la que se accede mediante el ví­nculo en Google, es decir, si se utiliza un sistema de plantillas, en el layout (general para toda la web) cuando detecte que la respuesta es un error 404 añada en el head una meta etiqueta NOINDEX. Si bien se utiliza un layout diferente para la página de error, la etiqueta NOINDEX se pondrá en í©ste.
    De esta le decimos al spider que no almacene esta página en su base de datos cuando la visite.

4. htaccess: Otra opción que se puede llevar a cabo es la de proteger mediante contraseña cierto directorio, haciendo uso del archivo .htaccess. De esta forma los spiders no pueden acceder a ese directorio. A mi personalmente no me parece una buena idea por los siguientes motivos:
    - estamos añadiendo una medida de seguridad a un directorio que, en realidad, no existe.
    - si el cambio en el routing ha sido importante, el número de directorios a proteger mediante htaccess será demasiado grande y el archivo se volverá poco legible.
    - con los 3 mí©todos anteriores podemos conseguirlo.
    - el usuario no se llevará muy buena impresión del sitio web si í©ste accede mediante Google a una página protegida con contraseña, sin embargo esta página te devuelve un código 404 personalizado y humano (explicándole los motivos que pueden haberle llevado ahí­, añadiendo un buscador interno o sugirií©ndole varios links con páginas similares de nuestro sitio) es más probable que el usuario se quede en el sitio y decida visitar otras secciones.

5. Redirección 301 (movido parcial o definitivamente):
otro punto a destacar es, en caso de cambios puntuales donde la URL que haya sido modificada está controlada y el cambio sea de http://url.com/pagina-antigua a http://url.com/pagina-nueva, la opción de añadir en la cabecera del documento (o en el controlador de la aplicación si se está trabajando con patrón MVC) una redirección 301.
    <?php header('Location: http://url.com/pagina-nueva/', true, 301); ?>

Con estas opciones , los desarrolladores podemos solucionar el problema del cambio de routing en la aplicación sin muchos conocimientos de SEO.

Tags:


Comentarios

  • wilmer752
  • #1 wilmer752 (29/12/2009 17:07)
  • amigo puedo entender todo lo que explicas ahi pero lo que no se es en que pagina o donde tengo que hacer esos procedimiendo y eso es lo que me tiene enredado
  • wilmer752
  • #2 wilmer752 (29/12/2009 17:09)
  • es mas si te doy la pagina que no quiero que se encuentre mas en google me harias el favor de eliminarla gracias ahi te va por si acaso

    http://struktura2009.blogspot.com/2009/03/blog-post.html
  • Flamenco
  • #3 Flamenco (05/03/2012 16:29)
  • Salvo el método no-index, estoy intentando todos los demás métodos para eliminar varias urls desde hace meses y siguen ahí. Nunca las elimina.
Deja tu comentario

zukeidigital 2008