needhelp
← Volver al blog

La Ley Tau (τ) de Huawei: Reescribiendo el Escalado de Semiconductores Sin Litografía Avanzada

por needhelp
Huawei
Semiconductores
Chips IA
Ley de Moore
Ascend
Nvidia
EEUU-China
Análisis Profundo

Fecha: 28 de mayo, 2026 | Tiempo de lectura: ~25 min

Oblea semiconductora bajo microscopio


Resumen Ejecutivo

El 25 de mayo de 2026, en IEEE ISCAS 2026 en Shanghái, He Tingbo — presidenta de la división de semiconductores de Huawei — presentó la Ley de Escalado Tau (τ). Primera vez que una empresa china propone un principio rector para la industria global de semiconductores.

Esa misma semana, el Ascend 910C de Huawei — 800 TFLOPS FP16, aproximadamente 80% del H100 de Nvidia — está en producción en masa impulsando despliegues de IA a gran escala. El próximo Ascend 910D apunta a superar al H100 de plano.

Dos cosas ocurriendo a la vez: un nuevo marco teórico, y chips enviándose en volumen. Esta es la respuesta de doble vía de Huawei a las sanciones de EEUU.

Este artículo cubre:

  • Fundamentos matemáticos de la Ley τ
  • LogicFolding — arquitectura 3D sin litografía avanzada
  • Ascend 910C/910D vs. Nvidia H100/H200: benchmarks
  • La escalada de la guerra de chips EEUU-China

1. La Ley de Moore Se Quedó Sin Camino

Durante 60 años, la Ley de Moore gobernó la industria: el número de transistores se duplica cada 18–24 meses mediante miniaturización geométrica.

Esa era se está acabando. Tres muros:

1.1 Física: Efecto Túnel Cuántico

Por debajo de 3nm, las compuertas de los transistores abarcan unas pocas docenas de átomos de silicio. Los electrones atraviesan las barreras aislantes por efecto túnel. Resultado: fugas incontrolables, exceso de calor, inestabilidad.

El suelo duro está alrededor de 1.5nm. Los transistores convencionales dejan de funcionar por debajo de eso.

1.2 Economía: El Muro del Dinero

Nodo de ProcesoInversión en FabCosto de Diseño por Chip
28nm~$6B~$50M
7nm~$15B~$200M
3nm~$20B$500M–$1B
2nm~$28B (proyectado)>$1B

Una sola fábrica de 3nm cuesta casi 20 mil millones de dólares. Un tape-out supera los 100 millones. Solo TSMC y Samsung pueden permitirse la vanguardia. El motor económico que hacía de la Ley de Moore una profecía autocumplida se está gripando.

1.3 Rendimiento: Rendimientos Decrecientes

En nodos avanzados, la potencia de fuga domina sobre la potencia dinámica. El costo por transistor ha dejado de bajar. Las ganancias de rendimiento por vatio se encogen con cada reducción. La industria necesita un nuevo paradigma.


2. La Ley Tau (τ): Del Espacio al Tiempo

2.1 Principio Fundamental

La Ley τ replantea el progreso de los semiconductores. En lugar de densidad espacial (transistores/mm²), optimiza la eficiencia temporal — el retardo de propagación de señales a través de toda la pila de cómputo.

τ (tau) es la constante de tiempo en física. Huawei la propone como el objetivo universal de optimización para la jerarquía completa.

2.2 Las Matemáticas

τ=f(τtransistor,τcircuito,τchip,τsistema)\tau = f(\tau_{\text{transistor}}, \tau_{\text{circuito}}, \tau_{\text{chip}}, \tau_{\text{sistema}})

Donde:

  • $\tau_{\text{transistor}}$ — Retardo intrínseco de conmutación (picosegundos)
  • $\tau_{\text{circuito}}$ — Retardo de propagación RC en rutas críticas
  • $\tau_{\text{chip}}$ — Latencia de acceso a memoria e interconexión en el chip
  • $\tau_{\text{sistema}}$ — Paso de mensajes extremo a extremo en el centro de datos

Este τ abarca ~12 órdenes de magnitud en tiempo (de picosegundos a segundos).

Escalado generacional:

τn+1=τnα\tau_{n+1} = \frac{\tau_n}{\alpha}

El factor de escalado α depende de la carga de trabajo — no es universal:

Tipo de Carga de Trabajoα (Factor de Escalado Anual)
Móvil con restricción de potencia~1.3×
Conducción autónoma crítica en seguridad~1.5×
Entrenamiento e inferencia de IA~10×

Para IA — donde el throughput equivale a ingresos — la Ley τ permite una mejora anual de 10×. Mucho más allá de lo que la geometría sola podría ofrecer.

2.3 Por Qué τ Funciona Como Métrica Unificada

Del artículo de He Tingbo en ISCAS “A Time Scaling Theory for Multi-Layer Electronic Systems”:

“Frecuencia, latencia, ancho de banda y throughput — en cada nivel, todo está gobernado por τ. Los técnicos de proceso, los diseñadores de circuitos y los arquitectos de sistemas pueden discutir la misma magnitud usando las mismas unidades.”

Una métrica a través de cuatro capas. Esa es la clave. Antes, cada disciplina optimizaba métricas locales que no se componían entre sí.

2.4 La Pila de Co-Optimización de Cuatro Capas

flowchart TB
    subgraph System["Capa de Sistema"]
        direction TB
        UB["UnifiedBus 灵衢总线<br/>Direccionamiento Unificado de Memoria<br/>Semántica Nativa de Memoria"]
        NET["Interconexión Óptica Hi-ONE<br/>Alcance 100–200m<br/>~500× reducción de latencia"]
    end

    subgraph Chip["Capa de Chip"]
        direction TB
        SW["Software-Arquitectura-Silicio<br/>Co-Diseño de Pila Completa"]
        ARCH["Pipeline Guiado por Carga de Trabajo<br/>Control Fino de Flujo de Datos"]
    end

    subgraph Circuit["Capa de Circuito"]
        direction TB
        LF["LogicFolding<br/>Integración Vertical 3D"]
        RC["Optimización RC<br/>Dieléctricos de Bajo κ"]
    end

    subgraph Device["Capa de Dispositivo"]
        direction TB
        TR["Ingeniería de Transistores<br/>GAA / Strain / High-κ Metal Gate"]
        PAR["Reducción de R y C Parásitos<br/>Optimización de Interconexión"]
    end

    Device --> Circuit --> Chip --> System

    style System fill:#e1f5fe
    style Chip fill:#f3e5f5
    style Circuit fill:#e8f5e9
    style Device fill:#fff3e0
CapaObjetivo de OptimizaciónTécnicas Clave
DispositivoMinimizar τ_transistorMejora de movilidad, strain engineering, GAA, reducción de R/C parásitos
CircuitoMinimizar retardo RCLogicFolding (apilamiento 3D), dieléctricos de bajo κ, cableado más corto en rutas críticas
ChipMinimizar τ de cómputo + memoriaCo-diseño software-arquitectura-silicio, pipeline guiado por carga de trabajo
SistemaMinimizar τ de mensaje extremo a extremoUnifiedBus (灵衢), interconexiones ópticas, direccionamiento unificado de memoria

3. LogicFolding: 3D Sin EUV

3.1 De las Afueras a los Rascacielos

LogicFolding es la joya de la corona. Transforma cómo se distribuyen los circuitos.

2D tradicional: todos los componentes en un plano. Las señales viajan largas distancias laterales. Congestión en rutas críticas. Potencia desperdiciada transportando datos a través del dado.

LogicFolding: apila circuitos planos verticalmente. Como cambiar un barrio de casas bajas por un rascacielos con ascensores exprés. Las señales viajan distancias más cortas. Menores cargas resistivas y capacitivas. τ más rápido.

graph LR
    subgraph Traditional["Distribución 2D Tradicional"]
        direction LR
        A["Bloque A<br/>(sup-izq)"] ---|"Cable largo<br/>R alto, C alto<br/>τ lento"| B["Bloque B<br/>(inf-der)"]
    end

    subgraph LogicFolding["Distribución 3D LogicFolding"]
        direction TB
        A2["Bloque A<br/>(Capa 1)"]
        B2["Bloque B<br/>(Capa 2)"]
        A2 -.->|"Vía corta<br/>R bajo, C bajo<br/>τ rápido"| B2
    end

    style Traditional fill:#ffebee
    style LogicFolding fill:#e8f5e9

3.2 Kirin 2026: Primera Prueba

Huawei demostró LogicFolding en el próximo procesador móvil Kirin 2026:

MétricaKirin 2025 (2D)Kirin 2026 (LogicFolding)Mejora
Densidad de Transistores155 MTr/mm²238 MTr/mm²+53.5%
Frecuencia Núcleo Rendimiento~2.6 GHz3.1 GHz+19%
Eficiencia EnergéticaBase+41%+41%
ProcesoSMIC 7nmSMIC 7nm (mismo nodo)

Misma fábrica. Mismo nodo. 53.5% de ganancia en densidad. Eso equivale a tres años de escalado geométrico tradicional en un solo paso — logrado solo con arquitectura.

3.3 Hoja de Ruta de Kirin hasta 2031

timeline
    title Hoja de Ruta del Chip Kirin Bajo la Ley τ
    2026 (Otoño) : Kirin 2026 debuta LogicFolding : 3.10 GHz, 238 MTr/mm² : Primer plegado de 2 capas
    2027 : Kirin 2027 : 3.39 GHz, plegado mejorado
    2028 : Kirin 2028 : 3.71 GHz, plegado multicapa
    2029 : Kirin 2029 : >4.00 GHz, 3D a escala completa
    2031 : Objetivo: densidad equivalente a 1.4nm : ~600+ MTr/mm² proyectado

Para 2031, Huawei proyecta densidad equivalente a un proceso de 1.4nm — logrado mediante innovación arquitectónica, no reducción litográfica.


4. Ascend 910C/910D vs. Nvidia H100

La Ley τ es el juego largo. La ofensiva a corto plazo ya está en marcha.

4.1 Especificaciones

EspecificaciónAscend 910CNvidia H100 SXMNvidia H20 (China)
Nodo de ProcesoSMIC 7nm N+2TSMC 4N (5nm)TSMC 4N (5nm)
Transistores53 mil millones~80 mil millones~80 mil millones
ArquitecturaDa Vinci (doble dado)HopperHopper
FP16/BF16~752 TFLOPS989 TFLOPS296 TFLOPS
FP81.504 TFLOPS1.979 TFLOPS592 TFLOPS
INT81.504 TOPS3.958 TOPS592 TOPS
Memoria128 GB HBM2e80 GB HBM396 GB HBM3
Ancho de Banda de Memoria3.2 TB/s3.35 TB/s4.0 TB/s
TDP~310–500W700W400W
InterconexiónHCCS (392 GB/s)NVLink 4 (900 GB/s)NVLink 4 (900 GB/s)
vs. H100~76–81%100% (referencia)~30%
Área Lógica del Chip~1.6× H100ReferenciaReferencia
Contenido Nacional>90%N/AN/A
Precio Unitario (Est.)~$2.500–3.000~$25.000–30.000~$12.000–15.000

4.2 Donde Gana el 910C, Donde Se Queda Atrás

Gana en:

  • 128 GB de memoria vs. 80 GB del H100 — importa para inferencia de modelos grandes
  • Costo: aproximadamente 10× más barato
  • Co-optimización software-hardware: el framework CANN + los supernodos CloudMatrix elevan la eficiencia de inferencia por encima de las especificaciones brutas

Se queda atrás en:

  • Eficiencia arquitectónica: área lógica del dado ~60% mayor que el H100 para rendimiento similar
  • Ancho de banda de memoria: ligeramente por detrás (3.2 vs. 3.35 TB/s) — cuello de botella para entrenamiento
  • Ecosistema: CANN/CUNN vs. CUDA — brecha significativa en herramientas y librerías
  • Cargas de entrenamiento: menos optimizado para entrenamiento sostenido

4.3 CloudMatrix 384: Supernodo

graph TB
    subgraph CM["Supernodo CloudMatrix 384"]
        direction TB
        subgraph NPUs["Capa de Cómputo (384× Ascend 910C)"]
            NPU1["NPU 1"]
            NPU2["NPU 2"]
            NPU3["..."]
            NPU4["NPU 384"]
        end

        subgraph Network["Arquitectura de Red de Tres Planos"]
            UB["Plano UB<br/>Scale-Up Todos-Todos<br/>392 GB/s por NPU"]
            RDMA["Plano RDMA<br/>Scale-Out RoCE<br/>200 Gbps por NPU"]
            VPC["Plano VPC<br/>Gestión y Almacenamiento"]
        end

        subgraph CPU["Capa CPU Kunpeng"]
            CPU1["Kunpeng 920"]
        end
    end

    NPUs --> UB
    NPUs --> RDMA
    NPUs --> VPC
    CPU1 --> UB

    style CM fill:#e3f2fd
    style Network fill:#f1f8e9

CloudMatrix 384 — 384 NPUs Ascend 910C — ofrece:

  • Throughput de prefill: 6.688 tokens/s por NPU
  • Throughput de decode: 1.943 tokens/s por NPU (<50ms TPOT)
  • Eficiencia de cómputo: 4.45 tok/s/TFLOPS prefill, 1.29 tok/s/TFLOPS decode

Estas cifras de eficiencia superan despliegues optimizados de H100 (3.75 y 1.10). Co-optimización de pila completa en acción.

4.4 Ascend 910D: A Por el Liderazgo

EspecificaciónAscend 910D (Proyectado)Nvidia H100Nvidia B200
ProcesoSMIC 7nm N+2 (mejorado)TSMC 5nmTSMC 4nm
FP161.000+ TFLOPS989 TFLOPS~2.250 TFLOPS
Memoria192 GB HBM380 GB HBM3192 GB HBM3e
TDP~350–450W700W1.000W
ObjetivoSuperar al H100ReferenciaPróxima generación

El 910D está en muestreo con ByteDance, Baidu, Alibaba y China Mobile. Producción en masa prevista para finales de 2025.

Racks de servidores IA en centro de datos


5. La Capa Geopolítica: Sanciones vs. Resiliencia

5.1 Cronología de la Escalada

timeline
    title Cronología de Sanciones de Chips EEUU-China
    2019 : Huawei añadida a la Entity List : Comienza el corte de TSMC
    2020 : SMIC añadida a la Entity List : Equipos EUV bloqueados
    2022 : Ley CHIPS aprobada : Controles de exportación del 7 de octubre
    2023 : Japón/Países Bajos se unen a restricciones : Más equipos bloqueados
    2024 : Chips H20/A800 para China prohibidos : Nvidia pierde $5.5B
    2025 Ene : Regla de Difusión de IA de Biden (revocada en mayo)
    2025 May 13 : BIS advierte contra usar chips Ascend "en cualquier lugar" : Amenaza con sanciones penales

El 13 de mayo de 2025, el BIS (Bureau of Industry and Security) emitió una guía sin precedentes:

“El uso de los procesadores Ascend de Huawei (910B, 910C, 910D) en cualquier parte del mundo sin licencia constituye una violación de los controles de exportación de EEUU.”

Jurisdicción extraterritorial sobre cualquier uso de chips de IA de Huawei a nivel global.

5.2 La Cadena de Suministro a Prueba de Sanciones de Huawei

ComponenteProveedor NacionalEstado
Diseño de ChipsHuawei HiSilicon100%
Fundición (7nm)SMICProducción activa
Empaquetado AvanzadoJCET / Tongfu Micro>80%
Memoria HBMCXMT / YMTC (HBM2e)En desarrollo
Herramientas EDAHuawei + EDA nacional~40%
FotorresinaJSR China / nacionalMadurando
Framework de IACANN / MindSporeAlternativa funcional a CUDA

Cifras clave:

  • 90%+ de localización de chips para el Ascend 910C
  • 381 chips diseñados bajo los principios τ en 6 años
  • Rendimientos de SMIC 7nm N+2: ~20% (2024) → 40–50% (2025)
  • Producción mensual: ~2.600 obleas para Ascend

5.3 Mapa de Actores

graph TB
    subgraph US["Estados Unidos"]
        BIS["BIS / Depto. de Comercio"]
        Nvidia["Nvidia"]
        AMD["AMD"]
        Intel["Intel"]
    end

    subgraph China["China"]
        Huawei["Huawei / HiSilicon"]
        SMIC["SMIC"]
        CXMT["CXMT / YMTC"]
        DeepSeek["DeepSeek / ByteDance / Baidu"]
    end

    subgraph Allies["Aliados de EEUU"]
        TSMC["TSMC (Taiwán)"]
        ASML["ASML (Países Bajos)"]
        Samsung["Samsung (Corea)"]
        Tokyo["Tokyo Electron (Japón)"]
    end

    BIS -->|"Controles de Exportación"| Huawei
    BIS -->|"Prohibición de Equipos"| SMIC
    Nvidia -->|"H100/H200/B200"| TSMC
    Huawei -->|"Pedidos de Chips"| SMIC
    SMIC -->|"Producción 7nm"| Huawei
    DeepSeek -->|"Demanda de Inferencia IA"| Huawei
    ASML -->|"Equipos EUV"| TSMC
    ASML -.->|"Bloqueado"| SMIC
    TSMC -.->|"Cortado"| Huawei

    style Huawei fill:#ffebee
    style SMIC fill:#fff3e0
    style BIS fill:#e3f2fd

6. UnifiedBus (灵衢): Un Protocolo Para el Centro de Datos

Una pieza crítica pero poco discutida de la Ley τ: UnifiedBus.

6.1 El Problema de la Torre de Babel

Las interconexiones actuales en centros de datos son un mosaico:

  • PCIe para chip a chip
  • NVLink/CXL para agrupación de memoria de GPU
  • InfiniBand/RoCE para servidor a servidor
  • Ethernet para gestión

Cada traducción añade 500–1000× de sobrecarga sobre el retardo bruto del cable.

6.2 Una Sola Pila

UnifiedBus reemplaza el mosaico con un solo protocolo que abarca desde buses en el chip hasta enlaces ópticos entre racks:

CaracterísticaTradicionalUnifiedBus
Pila de ProtocolosMúltiple (PCIe + NVLink + IB + Eth)Pila unificada única
Modelo de MemoriaBasado en DMA, mediado por driverSemántica nativa de memoria
Latencia (rack a rack)~10–50 μs~1–5 μs
Alcance FísicoCobre: ~2mÓptico: 100–200m
Modelo de RecursosAsignación fijaPoolización completa
Recuperación ante FallosSegundosSub-segundo
graph LR
    subgraph Traditional["Pila Multi-Protocolo Tradicional"]
        direction TB
        APP1["Aplicación"]
        DRV1["Drivers"]
        PCIe["Capa PCIe"]
        NVLink["Capa NVLink"]
        IB["Capa InfiniBand"]
        ETH["Capa Ethernet"]
        APP1 --> DRV1 --> PCIe
        DRV1 --> NVLink
        DRV1 --> IB
        DRV1 --> ETH
    end

    subgraph UB["Pila Única UnifiedBus"]
        direction TB
        APP2["Aplicación"]
        UBL["Capa UnifiedBus"]
        PHY["Capa Física Universal<br/>(Cobre + Óptico)"]
        APP2 --> UBL --> PHY
    end

    style Traditional fill:#ffebee
    style UB fill:#e8f5e9

Más de 300 supernodos Atlas 900 enviados con UnifiedBus 1.0 desde marzo de 2025. La especificación UnifiedBus 2.0 es de código abierto.


7. Impacto en el Mercado

7.1 Movimientos de Acciones (26 de mayo, 2026)

EmpresaCambio
SMIC+17–19%
Hua Hong Semiconductor+20%
JCET+12%
Naura Technology+15%
Nvidia-2.3%

7.2 Lo Que Dicen los Analistas

Futurum Group (optimista):

“La Ley de Escalado Tau y LogicFolding marcan el intento más ambicioso de China hasta la fecha de redefinir el progreso de los semiconductores en sus propios términos.”

Omdia / The Register (escéptico):

“Las afirmaciones de Huawei son más branding que avance real. LogicFolding es una innovación de diseño, pero hacer chips que rindan a cierto nivel y fabricar millones con rendimiento aceptable son problemas diferentes.”

虎嗅 / Huxiu (equilibrado):

“La Ley Tau no surge de la nada. De Nvidia a TSMC, de AMD a SK Hynix, toda la industria lleva una década explorando esta dirección. La contribución de Huawei es formalizar esta exploración en un marco claro — el primer principio sistemático de este tipo propuesto por una empresa china.”

7.3 Panorama Competitivo

quadrantChart
    title Panorama Competitivo de Chips de IA (2026)
    x-axis Baja Madurez de Ecosistema --> Alta Madurez de Ecosistema
    y-axis Bajo Rendimiento Bruto --> Alto Rendimiento Bruto
    quadrant-1 Jugadores de Nicho
    quadrant-2 Líderes de Mercado
    quadrant-3 Retadores Emergentes
    quadrant-4 Especialistas en Rendimiento
    "Nvidia H100/B200": [0.95, 0.95]
    "Nvidia H20": [0.90, 0.30]
    "Huawei Ascend 910C": [0.35, 0.75]
    "Huawei Ascend 910D": [0.40, 0.90]
    "AMD MI300X": [0.70, 0.85]
    "Intel Gaudi 3": [0.60, 0.70]
    "Google TPU v5": [0.55, 0.80]
    "Amazon Trainium2": [0.50, 0.65]

8. La Conexión DeepSeek

DeepSeek — el laboratorio chino de IA cuyos modelos R1 y V3 alteraron la economía global de los LLM — ejecuta una capacidad significativa de inferencia en CloudMatrix de Huawei.

8.1 Economía de la Inferencia

MétricaDeepSeek en Ascend 910CDeepSeek en Nvidia H800
Costo de inferencia (V3)~1 CNY / 1M tokens~7 CNY / 1M tokens
Costo de inferencia (R1)~4 CNY / 1M tokens~20+ CNY / 1M tokens
Eficiencia de prefill4.45 tok/s/TFLOPS3.96 tok/s/TFLOPS
Eficiencia de decode1.29 tok/s/TFLOPS1.17 tok/s/TFLOPS

Ventaja de costo de 10× para inferencia. Cuando el software está co-optimizado para el hardware — CANN, kernels CUNN, operadores personalizados — la brecha efectiva se estrecha drásticamente.

8.2 Sinergia de Pila Completa

flowchart LR
    subgraph HW["Pila de Hardware Huawei"]
        A["Ascend 910C/910D<br/>NPU"]
        B["CloudMatrix 384<br/>Supernodo"]
        C["UnifiedBus<br/>Interconexión"]
    end

    subgraph SW["Pila de Software"]
        D["CANN / CUNN<br/>Alternativa a CUDA"]
        E["MindSpore / PyTorch<br/>Framework"]
        F["DeepSeek R1/V3<br/>Modelos Optimizados"]
    end

    subgraph Market["Impacto en el Mercado"]
        G["1 CNY / 1M tokens<br/>Inferencia V3"]
        H["90% Reducción de Costo<br/>vs. Nube Nvidia"]
        I["20.000+ Desarrolladores<br/>en el Ecosistema"]
    end

    A --> B --> C
    D --> E --> F
    HW --> SW --> Market

    style HW fill:#e3f2fd
    style SW fill:#e8f5e9
    style Market fill:#fff3e0

9. Evaluación Crítica: Qué es Real, Qué es Proyección

AfirmaciónEstado de la EvidenciaEvaluación
Marco de la Ley τPublicado en IEEE ISCASRevisado por pares; base sólida
381 chips en producción masivaDivulgación de HuaweiVerosímil; múltiples líneas de producto
LogicFolding: 53.5% de ganancia en densidadDatos del Kirin 2026No verificado; el lanzamiento en otoño 2026 lo validará
Equivalente a 1.4nm para 2031ProyecciónAmbicioso; depende del plegado multicapa
Ascend 910C al 80% del H100Estimaciones independientesConsenso de analistas; validado por DeepSeek
Eficiencia de CloudMatrix > H100Benchmarks publicadosCompetitivo para inferencia MoE; la brecha en entrenamiento persiste

Riesgos Clave

  1. Fabricación: Los rendimientos de SMIC 7nm (40–50%) están muy por debajo de TSMC (>80%). Sin EUV, bajar de 7nm es una economía brutal.

  2. Cuello de botella de memoria: HBM3/HBM3e casi imposible de conseguir bajo sanciones. La HBM nacional de CXMT aún está en fase temprana.

  3. Brecha de ecosistema: CANN/CUNN es funcional. No es CUDA. La promesa de migración con “una línea de import” es optimista para modelos complejos.

  4. Área del dado: El área del chip Ascend 910C es ~60% mayor que el H100. La arquitectura es menos eficiente por transistor.

  5. Acceso al mercado: Las sanciones de EEUU limitan Ascend a China + mercados aliados (Oriente Medio, Rusia, partes del sudeste asiático).


10. Hacia Dónde Va Esto: Cinco Escenarios Hasta 2030

  1. Convergencia: Huawei alcanza a la vanguardia mediante EUV nacional o relajación de sanciones. La brecha se cierra a <1 generación.

  2. Bifurcación Sostenida: Dos ecosistemas paralelos. China domina el mercado nacional + la Franja y la Ruta. Occidente mantiene el mercado global premium.

  3. Occidente se Distancia: TSMC alcanza 1nm con GAA/CFET. La arquitectura no puede compensar. Huawei cae 3+ generaciones por detrás.

  4. Cambio de Paradigma: Los principios de la Ley τ ganan adopción en toda la industria. La innovación arquitectónica se convierte en la palanca principal. El nodo de proceso importa menos.

  5. Desacoplamiento Total: Ruptura completa. China logra autosuficiencia al costo de un retraso de 5–10 años. La innovación global se ralentiza.


11. Un Creador de Reglas, No un Seguidor

La Ley τ es más que un artículo técnico:

  • Contribución científica: marco revisado por pares para optimización post-Moore
  • Estrategia de ingeniería: 381 chips comerciales ya producidos bajo sus principios
  • Señal geopolítica: las sanciones de EEUU catalizaron en lugar de paralizar la innovación china en semiconductores
  • Invitación a la industria: UnifiedBus 2.0 es de código abierto

El Ascend 910C — ~80% del rendimiento del H100 a ~10% del costo — demuestra que el ingenio arquitectónico puede compensar la desventaja de nodo de proceso. El 910D apunta a cerrar la brecha por completo.

Las respuestas que obtengamos en los próximos cinco años determinarán si la Ley τ rivaliza con la Ley de Moore en importancia histórica:

  • ¿Puede SMIC alcanzar rendimientos del 70%+ en 7nm y avanzar hacia 5nm?
  • ¿Cumplirá el Kirin 2026 con LogicFolding este otoño?
  • ¿Puede CANN cerrar la brecha de ecosistema con CUDA?
  • ¿Se alcanzará el objetivo de densidad equivalente a 1.4nm para 2031?

Una cosa ya está clara: Huawei ha pasado de 追赶者 (seguidor) a 规则制定者 (creador de reglas).

Como dijo He Tingbo en ISCAS 2026:

“Creemos que la apertura y la colaboración son clave para impulsar el progreso continuo en la industria de semiconductores. Ninguna empresa puede encontrar por sí sola todas las respuestas en el camino de la evolución de los semiconductores.”

La Ley τ es la respuesta de Huawei. El resto de la industria decide ahora si quiere comprometerse con la pregunta.


Apéndice A: Fórmulas Clave

Descomposición de la Constante de Tiempo

τtotal=τtransistor2+τcircuito2+τchip2+τsistema2\tau_{\text{total}} = \sqrt{\tau_{\text{transistor}}^2 + \tau_{\text{circuito}}^2 + \tau_{\text{chip}}^2 + \tau_{\text{sistema}}^2}

τ a nivel de circuito:

τcircuito=RcableCtotal=ρLA(ϵoxAtox+Cparaˊsito)\tau_{\text{circuito}} = R_{\text{cable}} \cdot C_{\text{total}} = \frac{\rho \cdot L}{A} \cdot \left(\epsilon_{\text{ox}} \cdot \frac{A}{t_{\text{ox}}} + C_{\text{parásito}}\right)

LogicFolding reduce $L$ (longitud del cable) en un 50–90%, disminuyendo directamente $\tau_{\text{circuito}}$.

Equivalencia de Densidad de Transistores

ρefectiva=ρfıˊsica×(1+i=1nfiηi)\rho_{\text{efectiva}} = \rho_{\text{física}} \times \left(1 + \sum_{i=1}^{n} f_i \cdot \eta_i\right)

Para Kirin 2026 ($n=2$, $f=0.55$, $\eta=0.95$):

ρefectiva=155×(1+0.55×0.95)238 MTr/mm2\rho_{\text{efectiva}} = 155 \times (1 + 0.55 \times 0.95) \approx 238 \text{ MTr/mm}^2

Eficiencia de Entrenamiento de IA

TentrenamientoNparaˊmetrosDtokensPcoˊmputoηutilizacioˊnT_{\text{entrenamiento}} \propto \frac{N_{\text{parámetros}} \cdot D_{\text{tokens}}}{P_{\text{cómputo}} \cdot \eta_{\text{utilización}}}

Huawei apunta a $\eta_{\text{utilización}}$ — logrando >90% en CloudMatrix para MoE frente al promedio de la industria de 40–60%.


Apéndice B: Glosario

TérminoDefinición
τ (tau)Constante de tiempo — tiempo característico de propagación de señal a través de un sistema electrónico
LogicFoldingArquitectura de chip 3D que apila capas de circuitos verticalmente para acortar las rutas de señal
UnifiedBus (灵衢)Protocolo unificado de interconexión para centros de datos que reemplaza PCIe/NVLink/InfiniBand
CANNCompute Architecture for Neural Networks — pila de software de IA de Huawei
CUNNCapa de migración CUDA-a-CANN para modelos PyTorch en Ascend
CloudMatrixArquitectura de supercomputadora de IA de Huawei usando NPUs Ascend
SMIC N+2Proceso de clase 7nm de SMIC usando litografía DUV (ultravioleta profundo)
HBMHigh Bandwidth Memory — DRAM apilada en 3D para aceleradores de IA
MoEMixture of Experts — arquitectura de red neuronal que usa cómputo condicional
EUVLitografía ultravioleta extrema — tecnología más avanzada de patronado de chips

Referencias

  1. He Tingbo, “A Time Scaling Theory for Multi-Layer Electronic Systems,” IEEE ISCAS 2026, Shanghái.
  2. Huawei Official Newsroom, “Huawei Announces Tau (τ) Scaling Law,” 25 de mayo de 2026.
  3. Agencia de Noticias Xinhua, “Huawei Unveils New Chip Design Approach,” 26 de mayo de 2026.
  4. DeepSeek / Huawei Cloud, “Serving Large Language Models on Huawei CloudMatrix384,” 2025.
  5. Morgan Stanley Research, “SMIC Advanced Node Yield Analysis,” septiembre de 2025.
  6. US Bureau of Industry and Security, “Export Control Guidance on PRC Advanced Computing ICs,” 13 de mayo de 2025.
  7. Hot Chips 31, “Huawei Da Vinci Architecture Deep Dive,” 2019.
  8. Wall Street Journal, “Huawei Tests Ascend 910D as Nvidia Alternative,” abril de 2025.
  9. 21st Century Business Herald, “Huawei Tau Law Analysis,” 25 de mayo de 2026.
  10. Futurum Group Research, “Does Huawei’s Tau Scaling Law Challenge Logic Leadership?” 26 de mayo de 2026.

Compilado a partir de publicaciones de IEEE, divulgaciones oficiales de Huawei, reportes de Xinhua, investigación de analistas financieros y documentación técnica. Las cifras de rendimiento son las mejores estimaciones disponibles; los resultados reales varían según el despliegue.

Última actualización: 28 de mayo de 2026

Compartir esta página