Análisis Profundo del Algoritmo de Recomendación de X Open Source por xAI: De la Arquitectura Phoenix al Feed For You
Análisis Profundo del Algoritmo de Recomendación de X Open Source por xAI
Resumen
En enero de 2026, xAI abrió el código de xai-org/x-algorithm en GitHub — el algoritmo central de recomendación que impulsa el feed “For You” de X (antes Twitter). El repositorio ha acumulado más de 20,800 estrellas y 3,600 forks. A diferencia del esfuerzo de código abierto parcial de Twitter en 2023 (desestimado como “teatro de transparencia”), este lanzamiento representa una reescritura arquitectónica completa — de un sistema basado en reglas hechas a mano a una arquitectura impulsada por ML de extremo a extremo basada en el modelo Grok Transformer. El sistema utiliza un Modelo de Dos Torres (Two-Tower) para la recuperación eficiente de candidatos, un modelo de ranking Transformer con enmascaramiento de atención de Aislamiento de Candidatos (Candidate Isolation) para la puntuación detallada, y un marco de tuberías componible (Candidate Pipeline) que orquesta la hidratación de consultas, la obtención de candidatos, el filtrado, la puntuación y la selección.

Pipeline de Siete Etapas
| Etapa | Nombre | Componente | Función | Volumen |
|---|---|---|---|---|
| 1 | Query Hydration | home-mixer/query_hydrators | Obtener historial de interacciones, seguimientos, preferencias | N/A |
| 2 | Candidate Sourcing | thunder + phoenix | Thunder (seguidos) + Phoenix Two-Tower (global) | ~1,500 |
| 3 | Candidate Hydration | home-mixer/candidate_hydrators | Enriquecer metadatos | ~1,500 |
| 4 | Pre-Scoring Filters | home-mixer/filters | Eliminar duplicados, antiguos, bloqueados | ~1,200 |
| 5 | ML Scoring | Phoenix Transformer Grok | Predecir 15 probabilidades de interacción | ~1,200 |
| 6 | Selection | home-mixer/selectors | Ordenar y seleccionar Top K | ~200 |
| 7 | Post-Selection Filters | home-mixer/filters | Eliminar spam/violencia, deduplicar | ~180 |

Recuperación Two-Tower
La fase de recuperación utiliza la Arquitectura de Dos Torres, ampliamente adoptada por YouTube y Google Play. La Torre de Usuario codifica las características del usuario y el historial de interacciones en un vector de incrustación normalizado. La Torre de Candidatos codifica todas las publicaciones en incrustaciones candidatas. La búsqueda de similitud mediante producto punto selecciona los Top-K.

Aislamiento de Candidatos (Candidate Isolation)
La innovación clave en la fase de ranking es el Aislamiento de Candidatos — una máscara de atención personalizada que impide que los candidatos se atiendan entre sí. Esto garantiza consistencia de puntuación, capacidad de caché, escalabilidad e interpretabilidad.
def make_recsys_attn_mask(seq_len, candidate_start_offset, dtype=jnp.float32):
causal_mask = jnp.tril(jnp.ones((1, 1, seq_len, seq_len), dtype=dtype))
attn_mask = causal_mask.at[:, :, candidate_start_offset:, candidate_start_offset:].set(0)
candidate_indices = jnp.arange(candidate_start_offset, seq_len)
attn_mask = attn_mask.at[:, :, candidate_indices, candidate_indices].set(1)
return attn_mask

Predicción de 15 Acciones
Phoenix predice simultáneamente 15 tipos de interacción. Las interacciones negativas (No interesa, Bloquear, Silenciar, Reportar) tienen un peso de ~-74x, mientras que las positivas tienen ~0.4-1.0x.

Infraestructura
Home Mixer es la capa de orquestación escrita en Rust. Thunder proporciona almacenamiento en memoria de publicaciones de cuentas seguidas con latencia de submilisegundos. Candidate Pipeline define seis traits (Source, Hydrator, Filter, Scorer, Selector, SideEffect) para construir tuberías de recomendación modulares.
2023 vs 2026
| Dimensión | 2023 | 2026 Phoenix |
|---|---|---|
| Integridad del código | Parcial | Sistema completo |
| Consistencia con producción | Divergente | ”Publicamos lo que desplegamos” |
| Arquitectura | Reglas manuales + heurísticas | Grok Transformer ML |
| Documentación | Casi ninguna | Diagramas detallados |
| Frecuencia de actualización | Abandonada | Cada 4 semanas |
| Licencia | Poco clara | Apache 2.0 |
Importancia Industrial
X se convierte en la primera plataforma social importante en abrir completamente un sistema de recomendación de producción. Meta, TikTok, YouTube y Snapchat mantienen sus algoritmos cerrados. Esto tiene implicaciones regulatorias (Ley de Servicios Digitales de la UE), de auditoría independiente y de IA跨dominio (Grok adaptado de LLM a recomendación).
Limitaciones
Aún no se han abierto: constantes de peso específicas, datos de entrenamiento, perfiles de usuario completos, lógica de anuncios, modelos de moderación de contenido y configuración de infraestructura en tiempo real.