¿Qué es la indexabilidad?
La indexabilidad es la capacidad de una página web para ser indexada por los motores de búsqueda. Sólo las páginas indexables pueden aparecer en los resultados de búsqueda.
Para indexar una página web, los motores de búsqueda, como Google, deben:
- Descubra la URL de la página
- Rastrearlo (descargar su contenido)
- Procesarla (comprender y extraer la información clave de las páginas rastreadas).
Sólo entonces podrá aparecer la página en los resultados de búsqueda.
Si los rastreadores web no pueden hacer su trabajo y rastrear una página de su sitio, entonces esa página no puede ser indexada adecuadamente. Y sin indexación, la página de su sitio web no puede atraer tráfico de búsqueda porque permanecerá invisible para los motores de búsqueda.
¿Por qué es importante la indexabilidad?
La indexabilidad permite a los motores de búsqueda mostrar las páginas de su sitio web en las SERP. Sin indexación, no puede dirigir tráfico de búsqueda orgánico a su sitio.
A veces, tiene más sentido hacer que ciertas páginas no sean indexables. Por ejemplo, las páginas no indexables son preferibles cuando se trata de páginas de aterrizaje, páginas de baja calidad o páginas de "Gracias por la suscripción". Después de todo, usted no quiere que estas páginas aparezcan en los resultados de búsqueda.
Sin embargo, si quiere que las URL se clasifiquen, debe asegurarse de que esas páginas sean rastreables e indexables.
¿Qué hace que una página sea indexable?
Para ser considerada "indexable", la página debe cumplir los siguientes criterios:
1. La página debe ser rastreable
Para que una página web sea indexada, los rastreadores del motor de búsqueda deben poder acceder a su contenido y rastrearlo primero. Un elemento que influye directamente en la "rastreabilidad" de una página web es el archivo robots.txt.
Un archivo robots.txt es un pequeño archivo ubicado en el directorio raíz de su sitio web. Su función es proporcionar instrucciones a los rastreadores web y decirles qué páginas de su sitio no deben ser rastreadas. De lo contrario, los robots rastrearán cualquier página que encuentren en el sitio web; lo hacen por defecto.
Hay casos en los que poner este tipo de "restricciones" tiene sentido. Aun así, es esencial asegurarse de que no está bloqueando sin saberlo las páginas que desea que se indexen.
2. La página no debe tener una etiqueta "Noindex
Una etiqueta "noindex" es una directiva en la página que indica al motor de búsqueda que no indexe una página específica. Básicamente, impide que una página aparezca en las SERPs.
A veces, es aconsejable "no indexar" determinadas páginas -como páginas de aterrizaje, páginas de inicio de sesión, páginas de baja calidad o "Gracias"- y mantenerlas "privadas".
Sin embargo, si hace un mal uso de esta directiva o, por ejemplo, se olvida de eliminarla de la página que desea indexar, perderá tráfico de búsqueda orgánico.
Puede rastrear su sitio web con la herramienta Site Audit de Ranktracker para asegurarse de que ninguna de las páginas que desea indexar tiene una etiqueta "noindex".
3. La página debe ser canónica
Una etiqueta canónica (rel="canonical") en el código de una página define la versión principal para páginas duplicadas, casi duplicadas y similares. Esto significa que solo las páginas canónicas pueden indexarse, mientras que sus versiones no canónicas quedarán excluidas.
A menos que añada la etiqueta canónica a una página, Google se basará en señales como los vínculos de retroceso internos y externos, el mapa del sitio XML y las redirecciones para decidir qué URL "representará" a ese grupo en su índice.
Esto significa que si desea que su página aparezca en los resultados de búsqueda, no debe declarar ninguna otra página como su versión canónica. Una buena práctica SEO es tener etiquetas canónicas autorreferenciadas para las páginas indexables.
Cómo ayudar a Google a indexar su página
Esto es lo que puede hacer para ayudar a Google a indexar las páginas de su sitio:
1. Enviar sitemaps a Google
Un mapa del sitio es esencialmente una lista (normalmente en formato XML) que contiene todas las páginas de su sitio web.
La función del mapa del sitio es informar a Google sobre las páginas que desea que se indexen en su sitio.
Antes de enviar un mapa del sitio, compruebe si refleja el estado actual de su sitio web y corrija cualquier error, como enlaces rotos, páginas huérfanas y similares.
Puede enviar sus sitemaps a Google mediante Google Search Console.
2. Enviar páginas individuales a través de la herramienta de inspección de URL
Si desea solicitar la indexación o la reindexación de solo algunas URL individuales, puede utilizar la herramienta de inspección de URL de Google Search Console.
La herramienta de inspección de URL es una herramienta de diagnóstico que se encuentra en Google Search Console y que le ofrece información sobre la versión indexada de Google de su página web y le permite probar las URL en directo y ver la versión renderizada de la página, entre otras cosas.
También permite enviar páginas individuales a Google.
Si desea solicitar la indexación de una nueva URL, o el rastreo y la reindexación de URL actualizadas, puede indicárselo a Google seleccionando el botón "Solicitar indexación". Si no hay errores en su URL activa, Google añadirá su página a su cola de rastreo.
Sin embargo, tenga en cuenta que existe un límite en el número de URL que puede solicitar indexar al día.
3. Proporcione enlaces internos para una mejor y más rápida localización
Otra forma de favorecer el rastreo y, a su vez, acelerar la indexación del sitio web es emplear enlaces internos.
Al recorrer Internet, las arañas de Google siguen una ruta formada por enlaces. Por lo tanto, cuando una página de su sitio web enlaza con otra, estos rastreadores seguirán la ruta existente y descubrirán nuevos contenidos.
Las páginas sin enlaces internos se llaman "páginas huérfanas".
Por eso es crucial asegurarse de que ha proporcionado enlaces internos que van hacia y desde sus páginas más importantes. Por supuesto, esto suele ocurrir de forma natural cuando se crea un sitio bien organizado.
Sin embargo, no está de más comprobar si hay páginas huérfanas -es decir, páginas que no tienen enlaces internos que apunten a ellas- en su sitio web. Puede hacerlo con la herramienta Site Audit de Ranktracker.
Por otro lado, debe asegurarse de que estos enlaces internos que apuntan a páginas indexables no tengan una etiqueta "nofollow", ya que Google no rastreará los enlaces nofollow.
Preguntas frecuentes
¿Qué papel desempeña el archivo Robots.txt en la indexabilidad?
El archivo robots.txt proporciona instrucciones a los rastreadores web sobre qué páginas o secciones de su sitio no deben ser rastreadas, lo que afecta a la rastreabilidad y, posteriormente, a la indexabilidad de sus páginas.
¿Cómo puedo comprobar si mis páginas están indexadas?
Puedes comprobar si tus páginas están indexadas utilizando Google Search Console. La herramienta proporciona información sobre el estado de indexación de sus URL.
¿Cuál es el impacto de las páginas huérfanas en la indexabilidad?
Las páginas huérfanas, que no tienen enlaces internos que apunten a ellas, tienen menos probabilidades de ser descubiertas e indexadas por los motores de búsqueda. Asegurarse de que todas las páginas importantes están bien enlazadas dentro de su sitio mejora su indexabilidad.
Si se asegura de que sus páginas son rastreables, no contienen etiquetas "noindex" y están correctamente canonizadas, puede mejorar sus posibilidades de ser indexadas y aparecer en los resultados de los motores de búsqueda. Las auditorías periódicas y la vinculación interna estratégica pueden contribuir aún más a este objetivo.