needhelp
← Volver al blog

Análisis Profundo del Algoritmo de Recomendación de X Open Source por xAI: De la Arquitectura Phoenix al Feed For You

por xingwangzhe
xAI
Sistema de Recomendación
Machine Learning
Grok
Transformer
Open Source

Análisis Profundo del Algoritmo de Recomendación de X Open Source por xAI

Resumen

En enero de 2026, xAI abrió el código de xai-org/x-algorithm en GitHub — el algoritmo central de recomendación que impulsa el feed “For You” de X (antes Twitter). El repositorio ha acumulado más de 20,800 estrellas y 3,600 forks. A diferencia del esfuerzo de código abierto parcial de Twitter en 2023 (desestimado como “teatro de transparencia”), este lanzamiento representa una reescritura arquitectónica completa — de un sistema basado en reglas hechas a mano a una arquitectura impulsada por ML de extremo a extremo basada en el modelo Grok Transformer. El sistema utiliza un Modelo de Dos Torres (Two-Tower) para la recuperación eficiente de candidatos, un modelo de ranking Transformer con enmascaramiento de atención de Aislamiento de Candidatos (Candidate Isolation) para la puntuación detallada, y un marco de tuberías componible (Candidate Pipeline) que orquesta la hidratación de consultas, la obtención de candidatos, el filtrado, la puntuación y la selección.

Arquitectura de componentes principales

Pipeline de Siete Etapas

EtapaNombreComponenteFunciónVolumen
1Query Hydrationhome-mixer/query_hydratorsObtener historial de interacciones, seguimientos, preferenciasN/A
2Candidate Sourcingthunder + phoenixThunder (seguidos) + Phoenix Two-Tower (global)~1,500
3Candidate Hydrationhome-mixer/candidate_hydratorsEnriquecer metadatos~1,500
4Pre-Scoring Filtershome-mixer/filtersEliminar duplicados, antiguos, bloqueados~1,200
5ML ScoringPhoenix Transformer GrokPredecir 15 probabilidades de interacción~1,200
6Selectionhome-mixer/selectorsOrdenar y seleccionar Top K~200
7Post-Selection Filtershome-mixer/filtersEliminar spam/violencia, deduplicar~180

Flujo de candidatos en pipeline

Recuperación Two-Tower

La fase de recuperación utiliza la Arquitectura de Dos Torres, ampliamente adoptada por YouTube y Google Play. La Torre de Usuario codifica las características del usuario y el historial de interacciones en un vector de incrustación normalizado. La Torre de Candidatos codifica todas las publicaciones en incrustaciones candidatas. La búsqueda de similitud mediante producto punto selecciona los Top-K.

Modelo Two-Tower

Aislamiento de Candidatos (Candidate Isolation)

La innovación clave en la fase de ranking es el Aislamiento de Candidatos — una máscara de atención personalizada que impide que los candidatos se atiendan entre sí. Esto garantiza consistencia de puntuación, capacidad de caché, escalabilidad e interpretabilidad.

def make_recsys_attn_mask(seq_len, candidate_start_offset, dtype=jnp.float32):
    causal_mask = jnp.tril(jnp.ones((1, 1, seq_len, seq_len), dtype=dtype))
    attn_mask = causal_mask.at[:, :, candidate_start_offset:, candidate_start_offset:].set(0)
    candidate_indices = jnp.arange(candidate_start_offset, seq_len)
    attn_mask = attn_mask.at[:, :, candidate_indices, candidate_indices].set(1)
    return attn_mask

Máscara de atención Candidate Isolation

Predicción de 15 Acciones

Phoenix predice simultáneamente 15 tipos de interacción. Las interacciones negativas (No interesa, Bloquear, Silenciar, Reportar) tienen un peso de ~-74x, mientras que las positivas tienen ~0.4-1.0x.

Pesos de predicción de acciones

Infraestructura

Home Mixer es la capa de orquestación escrita en Rust. Thunder proporciona almacenamiento en memoria de publicaciones de cuentas seguidas con latencia de submilisegundos. Candidate Pipeline define seis traits (Source, Hydrator, Filter, Scorer, Selector, SideEffect) para construir tuberías de recomendación modulares.

2023 vs 2026

Dimensión20232026 Phoenix
Integridad del códigoParcialSistema completo
Consistencia con producciónDivergente”Publicamos lo que desplegamos”
ArquitecturaReglas manuales + heurísticasGrok Transformer ML
DocumentaciónCasi ningunaDiagramas detallados
Frecuencia de actualizaciónAbandonadaCada 4 semanas
LicenciaPoco claraApache 2.0

Importancia Industrial

X se convierte en la primera plataforma social importante en abrir completamente un sistema de recomendación de producción. Meta, TikTok, YouTube y Snapchat mantienen sus algoritmos cerrados. Esto tiene implicaciones regulatorias (Ley de Servicios Digitales de la UE), de auditoría independiente y de IA跨dominio (Grok adaptado de LLM a recomendación).

Limitaciones

Aún no se han abierto: constantes de peso específicas, datos de entrenamiento, perfiles de usuario completos, lógica de anuncios, modelos de moderación de contenido y configuración de infraestructura en tiempo real.

Referencias

Compartir esta página