← Volver al blog
GEO / AI Search

Query fan out y RAG: así funciona la búsqueda con IA (y por qué tu web puede ser invisible)

Qué es query fan out y cómo funciona la búsqueda con IA. Guía técnica para no ser invisible en ChatGPT, Perplexity o AI Overviews. Léela ahora.

Gerard Badia·30 junio 2026·12 min de lectura
Query fan out y RAG: así funciona la búsqueda con IA (y por qué tu web puede ser invisible)
Recibe los mejores artículosUna vez al mes · Sin spam

Puedes estar en la primera posición de Google y no aparecer en ninguna respuesta de ChatGPT, Perplexity o AI Overviews. No es un error. Es que estas herramientas no buscan como el Google clásico — buscan diferente, evalúan diferente y citan diferente. Detrás de esa diferencia hay dos conceptos que conviene entender bien: RAG y query fan out. No son tendencias de marketing — son la arquitectura real sobre la que funcionan los sistemas de búsqueda con IA hoy.

Entenderlos cambia por completo cómo deberías pensar en tu contenido. Si sigues optimizando solo para el ranking de Google, estás jugando un partido con reglas de hace cinco años. Este artículo te explica cómo funcionan el query fan out y el RAG por dentro y qué puedes hacer para que la IA te encuentre, te recupere y te cite.


De una keyword a una conversación: el cambio que no verás en Google Analytics

La búsqueda tradicional funcionaba así: escribes tres palabras, Google evalúa millones de páginas contra esas palabras y devuelve una lista de diez enlaces. Sencillo, directo, predecible. La búsqueda generativa no funciona así.

Cuando haces una pregunta a [Google AI Mode](/blog/google-ai-mode), a ChatGPT con búsqueda activada o a Perplexity, el sistema no lanza tu pregunta contra un índice. La descompone. La expande. Lanza entre 8 y 20 búsquedas derivadas en paralelo, recupera fragmentos de distintas fuentes, los sintetiza y te devuelve una respuesta redactada — con citas seleccionadas.

DimensiónBúsqueda tradicionalBúsqueda con IA
Unidad de entrada1 query con keywords1 pregunta → N sub-consultas
Qué se evalúaLa página entera vs. una keywordFragmentos de texto vs. cada sub-consulta
SalidaLista de 10 enlacesRespuesta redactada + citas
Objetivo de quien optimizaRankear para una fraseSer recuperado y citado en muchas
Factor de frescuraMenor peso explícitoÚltimos 60 días tienen 1,9x más probabilidades de citarse

La búsqueda pasó de ser centrada en la query a ser centrada en el contexto. La forma de optimizar — y de medir — tiene que evolucionar en la misma dirección. Y la mayoría de webs en España todavía no ha dado ese paso.

💡 El ~80-88% de las URLs citadas en respuestas de IA no rankean en el top 100 de Google para esa misma query (Ahrefs, agosto 2025). Rankear no equivale a ser citado. Son dos juegos distintos.

Qué es RAG y por qué es la base del SEO para IA

RAG son las siglas de Retrieval-Augmented Generation — generación aumentada por recuperación. El nombre lo explica casi todo: el sistema Recupera información de una base de conocimiento externa, Aumenta el prompt original con ese contexto, y Genera la respuesta final. Es la arquitectura que permite a los modelos de lenguaje responder con información actualizada sin necesidad de reentrenamiento constante.

El concepto proviene de un paper de 2020 de Facebook AI Research (hoy Meta AI): "Retrieval-Augmented Generation for Knowledge-Intensive Tasks", de Lewis et al. La idea original era conectar cualquier modelo de lenguaje con cualquier fuente de conocimiento externa. Así se reducen las alucinaciones y se puede trabajar con información fresca. Hoy, qué es RAG es una pregunta que todo equipo de marketing debería saber responder.

Augmenting language models with a retrieval mechanism over a non-parametric memory allows for updating world knowledge without retraining.

Patrick Lewis · Investigador principal, Meta AI — paper RAG 2020

Los tres módulos que componen un sistema RAG

  1. Codificador de consulta. Convierte la pregunta del usuario en una representación matemática — un vector — que el sistema puede procesar y comparar con su índice.
  2. Recuperador. Dado ese vector, busca en la base de conocimiento los fragmentos más relevantes. Puede hacerlo por coincidencia léxica (BM25), por similitud semántica (Dense Passage Retriever) o combinando ambos métodos.
  3. Generador. Un modelo de lenguaje — GPT, Gemini, Claude — que lee la pregunta original más los fragmentos recuperados y produce la respuesta final entregada al usuario.

El flujo completo de RAG, paso a paso

  1. El usuario envía una pregunta al sistema.
  2. El recuperador busca en la base de conocimiento los fragmentos relevantes por similitud vectorial.
  3. Esos fragmentos vuelven al sistema como contexto adicional.
  4. Se construye un prompt aumentado: pregunta original + fragmentos recuperados.
  5. El modelo genera la respuesta y la entrega al usuario con las citas correspondientes.

Chunks, embeddings y vectores: lo que la IA realmente "lee" de tu contenido

Esta es la parte que más importa para entender por qué tu contenido se cita o no. Antes de que cualquier sistema RAG pueda recuperar tu contenido, tiene que haberlo procesado. Ese procesamiento tiene dos etapas críticas: chunking y embedding.

Chunking: cómo el sistema parte tu contenido

El sistema no lee tu página web entera de arriba abajo. La corta en pedazos pequeños — chunks — que indexa por separado. Hay distintas formas de hacer este corte: por número de tokens, respetando párrafos o detectando dónde cambia el significado semánticamente.

La recomendación estándar del sector es trabajar con fragmentos de 400 a 600 tokens con un 10-20% de solapamiento entre chunks consecutivos. Si el corte está mal hecho, ningún sistema posterior puede compensarlo — el dato correcto queda partido entre dos trozos y el modelo no lo ve. Tu contenido existe para el sistema tal como el sistema lo indexa, no tal como tú lo escribiste.

Embedding: convertir significado en números

Cada chunk se transforma en un vector: una lista de números que representa el significado semántico de ese fragmento. Ese vector se guarda en una base de datos vectorial. Cuando llega una consulta, el sistema la convierte también en vector y busca los chunks cuya representación matemática está más cerca de la consulta — lo que se mide habitualmente con similitud coseno.

Los chunks con mayor similitud al vector de la consulta se introducen en el contexto del modelo como material fuente. El modelo los lee, extrae lo relevante y genera la respuesta. Si tu contenido no está bien estructurado, sus vectores serán difusos — y quedará fuera del contexto.

💡 Para que la IA te cite, primero tiene que recuperarte. Y para recuperarte, tu contenido tiene que existir como un fragmento bien formado y autosuficiente en su índice. Un párrafo que solo tiene sentido tras tres párrafos de contexto previo se recupera mal — o directamente no se recupera.
  • Pon la respuesta al principio de cada sección. Si está enterrada al final, el chunk recuperado puede no contenerla.
  • Escribe pasajes que se entiendan solos. Sin depender de lo que viene antes ni de lo que viene después.
  • Usa encabezados descriptivos. Son señales de segmentación que los chunkers interpretan como fronteras naturales.

Query fan out: una pregunta, muchas búsquedas simultáneas

Query fan out es la técnica por la que un sistema de IA expande una sola consulta del usuario en múltiples sub-consultas para cubrir distintas intenciones posibles, recuperar resultados más diversos y sintetizarlos en una respuesta más completa. Es el motor que decide qué recupera el sistema RAG — y por tanto qué acaba siendo citado.

El propio Google lo describió así en [Google I/O 2025](https://blog.google/products-and-platforms/products/search/google-search-ai-mode-update/): "Bajo el capó, AI Mode usa nuestra técnica de query fan out, descomponiendo tu pregunta en subtemas y emitiendo una multitud de consultas simultáneamente en tu nombre." Y en su documentación para desarrolladores: "Tanto AI Overviews como AI Mode pueden usar una técnica de query fan out — emitiendo múltiples búsquedas relacionadas a través de subtemas y fuentes de datos — para elaborar una respuesta."

Una nota de rigor: en la documentación técnica formal de Google, el término aparece como query variant generation (patente **US11663201B2**), query decomposition o query rewriting. "Query fan out" es la jerga que se ha extendido en el sector SEO. Todos los términos describen lo mismo: una pregunta entra, muchas búsquedas relacionadas salen.

Cómo funciona el query fan out en cinco pasos

  1. Descomposición. El sistema analiza la consulta e identifica el tema principal, atributos implícitos, comparaciones posibles y preguntas de seguimiento probables.
  2. Expansión. Genera las sub-consultas internas. El usuario no las ve — son completamente opacas al exterior.
  3. Ejecución paralela. Lanza todas las sub-consultas simultáneamente contra la web y otras fuentes de datos.
  4. Síntesis. Un LLM revisa lo recuperado, detecta patrones, resuelve contradicciones y pondera qué responde mejor a la intención original del usuario.
  5. Generación contextual. Devuelve una respuesta redactada con citas, imágenes o tablas según el formato más adecuado.

Los 8 tipos de sub-consulta que genera el sistema

Tomemos como ejemplo una búsqueda real: "mejor limpiador para chicas adolescentes con piel grasa". El sistema generaría algo similar a esto:

Tipo de sub-consultaQué haceEjemplo generado
EquivalenteReformula la misma pregunta"mejor jabón facial para adolescentes con piel grasa"
De seguimientoPregunta lógica posterior"¿la piel grasa adolescente necesita gel o espuma?"
GeneralizaciónVersión más amplia del tema"mejor limpiador para piel grasa"
EspecificaciónVersión más concreta"mejor limpiador suave para piel grasa con acné"
CanonicalizaciónFraseo estándar normalizado"limpiador recomendado para adolescentes con piel grasa"
TraducciónVersión en otro idioma"best cleanser for teenage girls with oily skin"
ImplicaciónPregunta deducida de la intención"¿pueden los adolescentes con piel grasa usar ácido salicílico?"
ClarificaciónAcota la intención exacta"¿buscas control del acné o equilibrio de grasa?"

El sistema también practica lo que se llama proyección de intención latente: anticipa lo que el usuario querrá saber después de su pregunta inicial, aunque no lo haya pedido explícitamente. Es la razón por la que las respuestas de IA suelen ir más allá de la pregunta literal.

Cómo implementa el query fan out cada plataforma principal

PlataformaImplementación del query fan out
Google AI OverviewsFan out ligero orientado a respuestas rápidas
Google AI ModeFan out agresivo — puede mostrar "Searching 8 queries" con expansión visual
Google Deep SearchExtremo — puede lanzar cientos de búsquedas y generar un informe citado en minutos
Gemini (API)Genera una o varias search queries automáticamente si el prompt lo requiere
ChatGPTLo llama query rewriting — reescribe el prompt y recupera vía proveedor de búsqueda
PerplexityDescomposición en el backend con fuentes propias de rastreo
Microsoft CopilotExpansión iterativa sobre el índice de Bing
GrokFan out restringido — reformula y verifica por repetición sobre fuentes autorizadas

El pipeline completo: de tu pregunta a la respuesta citada

Juntando RAG y query fan out, el flujo real de cómo busca ChatGPT, Perplexity o Google AI Mode es este: pregunta del usuario → descomposición en sub-consultas (query fan out) → recuperación de fragmentos por similitud vectorial (RAG) → síntesis y resolución de contradicciones → respuesta citada.

Cada capa filtra. Si tu contenido no pasa el filtro del chunking y el embedding, el query fan out nunca lo encontrará. Si lo encuentra pero el fragmento es confuso o incompleto, el LLM no lo usará. Si lo usa pero no hay datos ni citas verificables que respalden la referencia, quedará relegado frente a otro contenido que sí los tenga.

💡 El 44,2% de las citas en respuestas de LLMs provienen del primer 30% del texto — el inicio del artículo (Growth Memo / SparkToro, enero-febrero 2026). Si tu introducción no responde nada concreto, ya has perdido casi la mitad de las oportunidades de citación.

Estos son los datos que sitúan la escala del problema para cualquier negocio con presencia digital en España o en mercados de habla hispana:

  • AI Overviews aparece en aproximadamente el 50% de las búsquedas en EE. UU. y llega a entre 1.500 y 2.500 millones de usuarios al mes (Google, febrero 2026; BrightEdge).
  • AI Mode superó los 1.000 millones de usuarios activos mensuales (Google I/O, mayo 2026).
  • El ~80-88% de las URLs citadas en respuestas de IA no rankean en el top 100 de Google para esa misma query (Ahrefs, agosto 2025).
  • El 52,2% de los pasajes citados contienen datos originales o propios (Search Engine Land).
  • Añadir estadísticas, citas de expertos y datos estructurados incrementa la visibilidad en IA hasta un 40% (estudio GEO, Princeton + Georgia Tech).
  • El contenido actualizado en los últimos 60 días tiene 1,9 veces más probabilidades de aparecer en respuestas de IA (BrightEdge).

Qué significa el query fan out para tu estrategia de contenido

Entender el mecanismo permite dejar de optimizar a ciegas. Estas son las seis palancas que se deducen directamente de cómo funciona el sistema — y que forman la base de cualquier estrategia de [generative engine optimization](/blog/generative-engine-optimization) (GEO) seria:

  1. Cubre el tema completo, no una keyword. La pregunta real es: ¿responde tu página todas las sub-consultas que alguien generaría sobre este tema? No "¿apunté a la keyword correcta?".
  2. Estructura el contenido para la extracción. Pasajes autosuficientes, respuesta al principio de cada sección, encabezados descriptivos → chunks limpios → mayor probabilidad de recuperación.
  3. Incluye datos propios y citas verificables. Las estadísticas originales y las referencias a fuentes concretas se citan más. No por estética — por arquitectura del sistema.
  4. Mantén el contenido fresco. La cadencia trimestral es el mínimo razonable en páginas pilar. La frescura de los últimos 60 días es un factor confirmado con impacto real en citaciones.
  5. Asegura la accesibilidad técnica. Si el crawler no puede ver tu página, nada de lo anterior importa. Las bases del SEO clásico — indexación correcta, rastreo, datos estructurados — siguen siendo la condición de entrada.
  6. No intentes adivinar las sub-consultas exactas. Google no las publica y cambian constantemente. Optimiza para la evidencia que esas sub-consultas necesitarían encontrar — no para las frases en sí.
💡 El GEO (posicionamiento para IAs) no sustituye al SEO clásico — lo amplía. El SEO te pone en el índice. El GEO decide si te citan en la respuesta. Necesitas los dos, en ese orden.

Una acción concreta que puedes hacer esta semana

Coge tu página más importante — la que más tráfico recibe o la que más debería recibir — y léela como si fuera un fragmento de 500 palabras sin contexto previo. Hazte tres preguntas: ¿se entiende sola? ¿Responde algo concreto en los primeros tres párrafos? ¿Tiene datos con fuente citada?

Si la respuesta a alguna de esas tres preguntas es no, tienes un problema de recuperación, no de posicionamiento. Y ese problema no lo resuelve una keyword nueva — lo resuelve reescribir la estructura de tu contenido con la lógica del query fan out y el RAG que acabas de leer.

Lo que no se mide, no se puede mejorar — y esto ya se puede medir: monitoriza manualmente tus keywords principales en ChatGPT, Perplexity y Google AI Mode cada semana. Comprueba si apareces. Si no apareces, tienes el diagnóstico. Si apareces pero no te citan, tienes la siguiente tarea.


  1. ¿Query fan out y RAG son lo mismo?No, pero operan en el mismo pipeline. RAG es la arquitectura general: recuperar información antes de generar la respuesta. Query fan out es la táctica que decide qué recuperar, expandiendo una pregunta en múltiples sub-consultas internas. RAG sin query fan out recupera poco. Query fan out sin RAG no tiene cómo sintetizar lo que encuentra.
  2. ¿Mi web necesita estar en Google para que la IA me cite?No necesariamente. Cada plataforma tiene su propio índice o usa proveedores distintos: ChatGPT usa Bing, Perplexity tiene su propio crawler, Google AI Mode trabaja sobre el índice de Google. Estar bien indexado en Google sigue siendo la base más sólida, pero no es la única puerta de entrada al ecosistema de búsqueda con IA.
  3. ¿Tiene sentido seguir haciendo SEO clásico si la búsqueda con IA cambia las reglas?Sí, pero el objetivo cambia. El SEO clásico te pone en el índice — condición necesaria. El GEO decide si te citan en la respuesta generativa — condición suficiente. Ambos se complementan: sin indexación no hay recuperación, y sin estructura orientada a chunks no hay citación. Son capas del mismo sistema, no alternativas.
  4. ¿Cuánto tarda en verse el efecto de optimizar para IA?Más que una campaña de pago, menos que el SEO clásico en mercados competitivos. El contenido reciente tiene ventaja — la frescura de los últimos 60 días es un factor confirmado. Actualizar páginas existentes con datos, estructura clara y pasajes autosuficientes puede generar cambios visibles en semanas, no en meses.
  5. ¿Cómo sé si la IA está citando mi contenido?Monitoriza manualmente tus keywords principales en ChatGPT, Perplexity y Google AI Mode de forma periódica. Algunas herramientas especializadas en GEO ya rastrean menciones de marca en respuestas de IA. Es un campo sin medición estándar todavía — solo el ~23% de los marketers mide su visibilidad en IA actualmente (dato de adopción GEO, 2025).
  6. ¿Qué tipo de contenido tiene más probabilidades de ser citado por la IA?El contenido con datos propios, citas de expertos verificables y estructura por fragmentos autosuficientes. El 52,2% de los pasajes citados contienen datos originales (Search Engine Land). Los formatos con cifras, tablas comparativas y respuestas directas al principio de cada sección tienen ventaja estructural frente al contenido narrativo sin referencias concretas.

En Growthlyfy trabajamos SEO y GEO como una estrategia integrada — porque visibilidad en buscadores y visibilidad en respuestas de IA ya no son dos objetivos separados. Si quieres saber cómo está posicionada tu web frente a este nuevo sistema de búsqueda, o si tu contenido actual tiene problemas de recuperación que no se ven en Google Analytics, podemos analizarlo juntos. Sin rodeos y con datos sobre la mesa. — Gerard Badía, Founder · Growthlyfy

Gerard Badia
Gerard BadiaFounder · Growthlyfy
¿Quieres aplicar esto
a tu negocio?
Agendar llamada →
¿Hablamos por WhatsApp?