needhelp
← Back to blog

হুয়াওয়ের টাউ (τ) সূত্র: অ্যাডভান্সড লিথোগ্রাফি ছাড়াই সেমিকন্ডাক্টর স্কেলিং-এর নতুন দিগন্ত

by needhelp
হুয়াওয়ে
সেমিকন্ডাক্টর
AI চিপস
মুরের সূত্র
অ্যাসেন্ড
Nvidia
US-China
গভীর বিশ্লেষণ

তারিখ: ২৮ মে, ২০২৬ | পড়ার সময়: ~২৫ মিনিট

Semiconductor wafer under microscope


সারসংক্ষেপ

২০২৬ সালের ২৫ মে, সাংহাইতে IEEE ISCAS 2026 সম্মেলনে হি থিংবো (He Tingbo) — হুয়াওয়ের সেমিকন্ডাক্টর বিজনেস প্রেসিডেন্ট — টাউ (τ) স্কেলিং সূত্র উন্মোচন করেন। কোনো চীনা কোম্পানি প্রথমবারের মতো বৈশ্বিক সেমিকন্ডাক্টর শিল্পের জন্য একটি পথনির্দেশক নীতি প্রস্তাব করল।

একই সপ্তাহে, হুয়াওয়ের Ascend 910C৮০০ TFLOPS FP16, Nvidia-র H100-এর প্রায় ৮০% — ব্যাপক উৎপাদনে আছে, বড় মাপের AI ডিপ্লয়মেন্ট চালাচ্ছে। আসন্ন Ascend 910D H100-কে সরাসরি ছাড়িয়ে যাওয়ার লক্ষ্য নিয়েছে।

একসাথে দুটি ঘটনা: একটি নতুন তাত্ত্বিক কাঠামো, এবং চিপ বাজারে আসছে ভলিউমে। মার্কিন নিষেধাজ্ঞার (sanctions) প্রতি হুয়াওয়ের এই দ্বৈত-ট্র্যাক উত্তর।

এই নিবন্ধে যা থাকছে:

  • τ সূত্রের গাণিতিক ভিত্তি
  • LogicFolding — অ্যাডভান্সড লিথোগ্রাফি ছাড়া 3D চিপ আর্কিটেকচার
  • Ascend 910C/910D বনাম Nvidia H100/H200 বেঞ্চমার্ক
  • বাড়তে থাকা US-চীন চিপ যুদ্ধ

১. মুরের সূত্র রাস্তার শেষ প্রান্তে

৬০ বছর ধরে মুরের সূত্র (Moore’s Law) শিল্প চালিয়েছে: জ্যামিতিক ক্ষুদ্রীকরণের মাধ্যমে প্রতি ১৮–২৪ মাসে ট্রানজিস্টর সংখ্যা দ্বিগুণ হয়।

সেই যুগ শেষ হচ্ছে। তিনটি দেয়াল:

১.১ পদার্থবিজ্ঞান: কোয়ান্টাম টানেলিং

৩nm-এর নিচে ট্রানজিস্টর গেট কয়েক ডজন সিলিকন পরমাণু নিয়ে গঠিত। ইলেকট্রন ইনসুলেটিং বাধা ভেদ করে টানেল করে বেরিয়ে যায়। ফলাফল: অনিয়ন্ত্রিত লিকেজ (leakage), অতিরিক্ত তাপ, অস্থিরতা।

হার্ড ফ্লোর (hard floor) প্রায় ১.৫nm। প্রচলিত ট্রানজিস্টর তার নিচে কাজ করা বন্ধ করে দেয়।

১.২ অর্থনীতি: অর্থের দেয়াল

প্রসেস নোডফ্যাব বিনিয়োগপ্রতি চিপ ডিজাইন খরচ
28nm~$6B~$50M
7nm~$15B~$200M
3nm~$20B$500M–$1B
2nm~$28B (প্রাক্কলিত)>$1B

একটি একক 3nm ফ্যাব-এর খরচ প্রায় $20 বিলিয়ন। একটি টেপ-আউট (tape-out) $100 মিলিয়ন ছাড়িয়ে যায়। শুধু TSMC আর Samsung-ই লিডিং এজ (leading edge) বহন করতে পারে। যে অর্থনৈতিক ইঞ্জিন মুরের সূত্রকে আত্মপূরণকারী (self-fulfilling) করেছিল, সেটি স্থবির হয়ে পড়ছে।

১.৩ পারফরম্যান্স: কমতে থাকা আয়

অ্যাডভান্সড নোডে লিকেজ পাওয়ার ডায়নামিক পাওয়ারকে ছাপিয়ে যায়। প্রতি ট্রানজিস্টর খরচ কমা বন্ধ হয়ে গেছে। প্রতিটি সংকোচনে (shrink) পারফরম্যান্স-প্রতি-ওয়াট লাভ কমছে। শিল্পের একটি নতুন দৃষ্টান্ত (paradigm) দরকার।


২. টাউ (τ) সূত্র: স্থান থেকে সময়ে

২.১ মূল নীতি

τ সূত্র সেমিকন্ডাক্টর অগ্রগতির কাঠামো পুনর্গঠন করে। স্থানিক ঘনত্ব (ট্রানজিস্টর/mm²)-এর পরিবর্তে এটি টেম্পোরাল ইফিশিয়েন্সি (temporal efficiency) অপ্টিমাইজ করে — পুরো কম্পিউটিং স্ট্যাক জুড়ে সিগনাল প্রবাহ বিলম্ব (signal propagation delay)।

পদার্থবিজ্ঞানে τ (টাউ) হলো সময় ধ্রুবক (time constant)। হুয়াওয়ে প্রস্তাব করে এটিকে পুরো স্তরক্রমের (hierarchy) জন্য সার্বজনীন অপ্টিমাইজেশন লক্ষ্য হিসেবে ব্যবহার করা হোক।

২.২ গণিত

τ=f(τtransistor,τcircuit,τchip,τsystem)\tau = f(\tau_{\text{transistor}}, \tau_{\text{circuit}}, \tau_{\text{chip}}, \tau_{\text{system}})

যেখানে:

  • $\tau_{\text{transistor}}$ — অন্তর্নিহিত সুইচিং বিলম্ব (পিকোসেকেন্ড)
  • $\tau_{\text{circuit}}$ — ক্রিটিক্যাল পথে RC প্রবাহ বিলম্ব
  • $\tau_{\text{chip}}$ — মেমোরি অ্যাক্সেস এবং অন-চিপ ইন্টারকানেক্ট লেটেন্সি (latency)
  • $\tau_{\text{system}}$ — ডেটাসেন্টার জুড়ে এন্ড-টু-এন্ড মেসেজ পাসিং

এই τ সময়ের ~১২ অর্ডার অফ ম্যাগনিটিউড (পিকোসেকেন্ড থেকে সেকেন্ড) জুড়ে বিস্তৃত।

প্রজন্মগত স্কেলিং:

τn+1=τnα\tau_{n+1} = \frac{\tau_n}{\alpha}

স্কেলিং ফ্যাক্টর α ওয়ার্কলোড-নির্ভর — সর্বজনীন নয়:

ওয়ার্কলোডের ধরনα (বার্ষিক স্কেলিং ফ্যাক্টর)
পাওয়ার-সীমাবদ্ধ মোবাইল~1.3×
সুরক্ষা-সংকটপূর্ণ স্বয়ংচালিত~1.5×
AI প্রশিক্ষণ ও ইনফারেন্স~10×

AI-র জন্য — যেখানে থ্রুপুট = রাজস্ব — τ সূত্র বার্ষিক ১০× উন্নতি সম্ভব করে। যা শুধু জ্যামিতি দিয়ে কখনোই সম্ভব হতো না।

২.৩ τ কেন একীভূত মেট্রিক হিসেবে কাজ করে

হি থিংবোর ISCAS পেপার “A Time Scaling Theory for Multi-Layer Electronic Systems” থেকে:

“ফ্রিকোয়েন্সি, লেটেন্সি, ব্যান্ডউইথ, এবং থ্রুপুট — প্রতিটি স্তরে এগুলো τ দ্বারা নিয়ন্ত্রিত। প্রসেস টেকনিশিয়ান, সার্কিট ডিজাইনার, এবং সিস্টেম আর্কিটেক্ট একই এককে একই পরিমাণ নিয়ে আলোচনা করতে পারেন।”

চার স্তর জুড়ে একটি মেট্রিক। এটাই মূল চাবিকাঠি। আগে প্রতিটি শাখা স্থানীয় মেট্রিক অপ্টিমাইজ করত যা একে অপরের সাথে যুক্ত হতো না।

২.৪ চার-স্তর সমন্বিত অপ্টিমাইজেশন স্ট্যাক

flowchart TB
    subgraph System["সিস্টেম লেয়ার"]
        direction TB
        UB["UnifiedBus 灵衢总线<br/>ইউনিফাইড মেমোরি অ্যাড্রেসিং<br/>নেটিভ মেমোরি সেমান্টিক্স"]
        NET["Hi-ONE অপটিক্যাল ইন্টারকানেক্ট<br/>100–200m রিচ<br/>~500× লেটেন্সি হ্রাস"]
    end

    subgraph Chip["চিপ লেয়ার"]
        direction TB
        SW["সফটওয়্যার-আর্কিটেকচার-সিলিকন<br/>ফুল-স্ট্যাক কো-ডিজাইন"]
        ARCH["ওয়ার্কলোড-চালিত পাইপলাইন<br/>সূক্ষ্ম ডেটা ফ্লো নিয়ন্ত্রণ"]
    end

    subgraph Circuit["সার্কিট লেয়ার"]
        direction TB
        LF["LogicFolding<br/>3D উল্লম্ব ইন্টিগ্রেশন"]
        RC["RC অপ্টিমাইজেশন<br/>Low-κ ডাইইলেকট্রিক"]
    end

    subgraph Device["ডিভাইস লেয়ার"]
        direction TB
        TR["ট্রানজিস্টর ইঞ্জিনিয়ারিং<br/>GAA / স্ট্রেন / High-κ মেটাল গেট"]
        PAR["প্যারাসিটিক R ও C হ্রাস<br/>ইন্টারকানেক্ট অপ্টিমাইজেশন"]
    end

    Device --> Circuit --> Chip --> System

    style System fill:#e1f5fe
    style Chip fill:#f3e5f5
    style Circuit fill:#e8f5e9
    style Device fill:#fff3e0
স্তরঅপ্টিমাইজেশন লক্ষ্যমূল কৌশল
ডিভাইসτ_transistor ন্যূনতম করামোবিলিটি বর্ধন, স্ট্রেন ইঞ্জিনিয়ারিং, GAA, প্যারাসিটিক R/C হ্রাস
সার্কিটRC বিলম্ব ন্যূনতম করাLogicFolding (3D স্ট্যাকিং), low-κ ডাইইলেকট্রিক, সংক্ষিপ্ত ক্রিটিক্যাল-পাথ তার
চিপকম্পিউট + মেমোরি τ ন্যূনতম করাসফটওয়্যার-আর্কিটেকচার-সিলিকন কো-ডিজাইন, ওয়ার্কলোড-চালিত পাইপলাইন
সিস্টেমএন্ড-টু-এন্ড মেসেজ τ ন্যূনতম করাUnifiedBus (灵衢), অপটিক্যাল ইন্টারকানেক্ট, ইউনিফাইড মেমোরি অ্যাড্রেসিং

৩. LogicFolding: EUV ছাড়াই 3D

৩.১ শহরতলি থেকে আকাশচুম্বী

LogicFolding হলো মুকুটের রত্ন। এটি সার্কিট বিন্যাসের পদ্ধতি বদলে দেয়।

প্রচলিত 2D: সব উপাদান সমতল পৃষ্ঠে। সিগনাল দীর্ঘ পার্শ্বীয় দূরত্ব অতিক্রম করে। ক্রিটিক্যাল পাথে জট। ডাই (die) জুড়ে ডেটা স্থানান্তরে শক্তি নষ্ট।

LogicFolding: সমতল সার্কিটগুলিকে উল্লম্বভাবে স্তূপীকৃত করে। যেন একতলা শহরতলিকে এক্সপ্রেস লিফটযুক্ত আকাশচুম্বী ভবনে রূপান্তর করা। সিগনাল কম দূরত্বে ভ্রমণ করে। রেজিস্টিভ ও ক্যাপাসিটিভ লোড কম। τ দ্রুততর।

graph LR
    subgraph Traditional["প্রচলিত 2D বিন্যাস"]
        direction LR
        A["ব্লক A<br/>(উপর-বাম)"] ---|"লম্বা তার<br/>উচ্চ R, উচ্চ C<br/>ধীর τ"| B["ব্লক B<br/>(নিচ-ডান)"]
    end

    subgraph LogicFolding["LogicFolding 3D বিন্যাস"]
        direction TB
        A2["ব্লক A<br/>(স্তর 1)"]
        B2["ব্লক B<br/>(স্তর 2)"]
        A2 -.->|"ছোট ভায়া<br/>নিম্ন R, নিম্ন C<br/>দ্রুত τ"| B2
    end

    style Traditional fill:#ffebee
    style LogicFolding fill:#e8f5e9

৩.২ Kirin 2026: প্রথম প্রমাণ

হুয়াওয়ে আসন্ন Kirin 2026 মোবাইল প্রসেসরে LogicFolding প্রদর্শন করেছে:

মেট্রিকKirin 2025 (2D)Kirin 2026 (LogicFolding)উন্নতি
ট্রানজিস্টর ঘনত্ব155 MTr/mm²238 MTr/mm²+53.5%
পারফরম্যান্স কোর ফ্রিকোয়েন্সি~2.6 GHz3.1 GHz+19%
শক্তি দক্ষতাবেসলাইন+41%+41%
প্রক্রিয়াSMIC 7nmSMIC 7nm (একই নোড)

একই ফ্যাব। একই নোড। ৫৩.৫% ঘনত্ব লাভ। এটি এক ধাপে তিন বছরের প্রথাগত জ্যামিতিক স্কেলিং-এর সমান — শুধুমাত্র আর্কিটেকচারের মাধ্যমে অর্জিত।

৩.৩ Kirin রোডম্যাপ ২০৩১ পর্যন্ত

timeline
    title τ সূত্রের অধীনে Kirin চিপ রোডম্যাপ
    2026 (শরৎ) : Kirin 2026 LogicFolding আত্মপ্রকাশ : 3.10 GHz, 238 MTr/mm² : প্রথম 2-স্তর ফোল্ডিং
    2027 : Kirin 2027 : 3.39 GHz, উন্নত ফোল্ডিং
    2028 : Kirin 2028 : 3.71 GHz, বহু-স্তর ফোল্ডিং
    2029 : Kirin 2029 : >4.00 GHz, পূর্ণ-স্কেল 3D
    2031 : লক্ষ্য: 1.4nm-সমতুল্য ঘনত্ব : ~600+ MTr/mm² প্রাক্কলিত

২০৩১ সালের মধ্যে হুয়াওয়ে 1.4nm প্রক্রিয়ার সমতুল্য ঘনত্ব প্রজেক্ট করছে — আর্কিটেকচারাল উদ্ভাবনের মাধ্যমে, লিথোগ্রাফিক সংকোচন নয়।


৪. Ascend 910C/910D বনাম Nvidia H100

τ সূত্র দীর্ঘমেয়াদী খেলা। নিকট-মেয়াদী আক্রমণ এখনই শিপিং হচ্ছে।

৪.১ স্পেসিফিকেশন

স্পেসিফিকেশনAscend 910CNvidia H100 SXMNvidia H20 (চীন)
প্রসেস নোডSMIC 7nm N+2TSMC 4N (5nm)TSMC 4N (5nm)
ট্রানজিস্টর53 বিলিয়ন~80 বিলিয়ন~80 বিলিয়ন
আর্কিটেকচারDa Vinci (ডুয়াল-ডাই)HopperHopper
FP16/BF16~752 TFLOPS989 TFLOPS296 TFLOPS
FP81,504 TFLOPS1,979 TFLOPS592 TFLOPS
INT81,504 TOPS3,958 TOPS592 TOPS
মেমোরি128 GB HBM2e80 GB HBM396 GB HBM3
মেমোরি ব্যান্ডউইথ3.2 TB/s3.35 TB/s4.0 TB/s
TDP~310–500W700W400W
ইন্টারকানেক্টHCCS (392 GB/s)NVLink 4 (900 GB/s)NVLink 4 (900 GB/s)
বনাম H100~76–81%100% (বেসলাইন)~30%
চিপ লজিক এরিয়া~1.6× H100বেসলাইনবেসলাইন
দেশীয় উপাদান>90%N/AN/A
ইউনিট মূল্য (আনুমানিক)~$2,500–3,000~$25,000–30,000~$12,000–15,000

৪.২ যেখানে 910C জেতে, যেখানে পিছিয়ে

জয়:

  • H100-এর 80 GB-র বিপরীতে 128 GB মেমোরি — বড় মডেল ইনফারেন্সের জন্য গুরুত্বপূর্ণ
  • খরচ: প্রায় ১০× সস্তা
  • সফটওয়্যার-হার্ডওয়্যার কো-অপ্টিমাইজেশন: CANN ফ্রেমওয়ার্ক + CloudMatrix সুপার নোড কাঁচা স্পেক-এর উপরে ইনফারেন্স দক্ষতা বাড়ায়

পিছিয়ে:

  • আর্কিটেকচার দক্ষতা: সমান পারফরম্যান্সের জন্য লজিক ডাই এরিয়া H100-এর চেয়ে ~60% বড়
  • মেমোরি ব্যান্ডউইথ: সামান্য পিছিয়ে (3.2 বনাম 3.35 TB/s) — প্রশিক্ষণের জন্য বাধা
  • ইকোসিস্টেম: CANN/CUNN বনাম CUDA — টুলিং ও লাইব্রেরিতে বড় ব্যবধান
  • প্রশিক্ষণ ওয়ার্কলোড: ধারাবাহিক প্রশিক্ষণের জন্য কম অপ্টিমাইজড

৪.৩ CloudMatrix 384: সুপার নোড

graph TB
    subgraph CM["CloudMatrix 384 সুপার নোড"]
        direction TB
        subgraph NPUs["কম্পিউট লেয়ার (384× Ascend 910C)"]
            NPU1["NPU 1"]
            NPU2["NPU 2"]
            NPU3["..."]
            NPU4["NPU 384"]
        end

        subgraph Network["ত্রি-প্লেন নেটওয়ার্ক আর্কিটেকচার"]
            UB["UB প্লেন<br/>Scale-Up অল-টু-অল<br/>392 GB/s প্রতি NPU"]
            RDMA["RDMA প্লেন<br/>Scale-Out RoCE<br/>200 Gbps প্রতি NPU"]
            VPC["VPC প্লেন<br/>ব্যবস্থাপনা ও স্টোরেজ"]
        end

        subgraph CPU["Kunpeng CPU লেয়ার"]
            CPU1["Kunpeng 920"]
        end
    end

    NPUs --> UB
    NPUs --> RDMA
    NPUs --> VPC
    CPU1 --> UB

    style CM fill:#e3f2fd
    style Network fill:#f1f8e9

CloudMatrix 384 — ৩৮৪টি Ascend 910C NPU — যা দেয়:

  • প্রিফিল থ্রুপুট: 6,688 টোকেন/s প্রতি NPU
  • ডিকোড থ্রুপুট: 1,943 টোকেন/s প্রতি NPU (<50ms TPOT)
  • কম্পিউট দক্ষতা: 4.45 tok/s/TFLOPS প্রিফিল, 1.29 tok/s/TFLOPS ডিকোড

এই দক্ষতার সংখ্যা অপ্টিমাইজড H100 ডিপ্লয়মেন্টকে (3.75 এবং 1.10) ছাড়িয়ে যায়। ফুল-স্ট্যাক কো-অপ্টিমাইজেশন কার্যকর হচ্ছে।

৪.৪ Ascend 910D: নেতৃত্বের লক্ষ্যে

স্পেসিফিকেশনAscend 910D (প্রাক্কলিত)Nvidia H100Nvidia B200
প্রক্রিয়াSMIC 7nm N+2 (উন্নত)TSMC 5nmTSMC 4nm
FP161,000+ TFLOPS989 TFLOPS~2,250 TFLOPS
মেমোরি192 GB HBM380 GB HBM3192 GB HBM3e
TDP~350–450W700W1,000W
লক্ষ্যH100-কে ছাড়ানোবেসলাইনপরবর্তী-প্রজন্ম

910D ByteDance, Baidu, Alibaba, এবং China Mobile-এর সাথে স্যাম্পলিং (sampling)-এ আছে। ব্যাপক উৎপাদন ২০২৫-এর শেষ দিকে আশা করা হচ্ছে।

AI server racks in data center


৫. ভূরাজনৈতিক স্তর: নিষেধাজ্ঞা বনাম সহনশীলতা

৫.১ বৃদ্ধির সময়রেখা

timeline
    title US-চীন চিপ নিষেধাজ্ঞা সময়রেখা
    2019 : হুয়াওয়ে এন্টিটি লিস্টে যুক্ত : TSMC বিচ্ছিন্নতা শুরু
    2020 : SMIC এন্টিটি লিস্টে যুক্ত : EUV সরঞ্জাম অবরুদ্ধ
    2022 : CHIPS আইন পাস : অক্টোবর ৭ রপ্তানি নিয়ন্ত্রণ
    2023 : জাপান/নেদারল্যান্ডস নিষেধাজ্ঞায় যোগদান : আরও সরঞ্জাম অবরুদ্ধ
    2024 : H20/A800 চীন-কাস্টম চিপ নিষিদ্ধ : Nvidia $5.5B হারায়
    2025 জানুয়ারি : Biden AI ডিফিউশন রুল (মে মাসে প্রত্যাহৃত)
    2025 মে 13 : BIS Ascend চিপ "যেকোনো স্থানে" ব্যবহারের বিরুদ্ধে সতর্কতা : অপরাধমূলক শাস্তির হুমকি

২০২৫ সালের ১৩ মে, BIS অভূতপূর্ব নির্দেশনা জারি করে:

“হুয়াওয়ের Ascend প্রসেসর (910B, 910C, 910D) লাইসেন্স ছাড়া বিশ্বের যেকোনো স্থানে ব্যবহার US রপ্তানি নিয়ন্ত্রণের লঙ্ঘন।”

বৈশ্বিকভাবে হুয়াওয়ে AI চিপের যেকোনো ব্যবহারের উপর আন্তর্জাতিক এখতিয়ার (extraterritorial jurisdiction)।

৫.২ হুয়াওয়ের নিষেধাজ্ঞা-প্রতিরোধী সরবরাহ শৃঙ্খল

উপাদানদেশীয় সরবরাহকারীঅবস্থা
চিপ ডিজাইনHuawei HiSilicon100%
ফাউন্ড্রি (7nm)SMICসক্রিয় উৎপাদন
অ্যাডভান্সড প্যাকেজিংJCET / Tongfu Micro>80%
HBM মেমোরিCXMT / YMTC (HBM2e)উন্নয়নাধীন
EDA টুলসহুয়াওয়ে + দেশীয় EDA~40%
ফটোরেসিস্টJSR China / দেশীয়পরিপক্ব হচ্ছে
AI ফ্রেমওয়ার্কCANN / MindSporeকার্যকরী CUDA বিকল্প

মূল সংখ্যা:

  • Ascend 910C-এর জন্য 90%+ চিপ স্থানীয়করণ
  • τ নীতির অধীনে ৬ বছরে ৩৮১টি চিপ ডিজাইন করা হয়েছে
  • SMIC 7nm N+2 ইল্ড: ~20% (2024) → 40–50% (2025)
  • মাসিক উৎপাদন: Ascend-এর জন্য ~2.6K ওয়েফার

৫.৩ অংশীজন মানচিত্র

graph TB
    subgraph US["মার্কিন যুক্তরাষ্ট্র"]
        BIS["BIS / বাণিজ্য দপ্তর"]
        Nvidia["Nvidia"]
        AMD["AMD"]
        Intel["Intel"]
    end

    subgraph China["চীন"]
        Huawei["হুয়াওয়ে / HiSilicon"]
        SMIC["SMIC"]
        CXMT["CXMT / YMTC"]
        DeepSeek["DeepSeek / ByteDance / Baidu"]
    end

    subgraph Allies["US মিত্র"]
        TSMC["TSMC (তাইওয়ান)"]
        ASML["ASML (নেদারল্যান্ডস)"]
        Samsung["Samsung (কোরিয়া)"]
        Tokyo["Tokyo Electron (জাপান)"]
    end

    BIS -->|"রপ্তানি নিয়ন্ত্রণ"| Huawei
    BIS -->|"সরঞ্জাম নিষেধাজ্ঞা"| SMIC
    Nvidia -->|"H100/H200/B200"| TSMC
    Huawei -->|"চিপ অর্ডার"| SMIC
    SMIC -->|"7nm উৎপাদন"| Huawei
    DeepSeek -->|"AI ইনফারেন্স চাহিদা"| Huawei
    ASML -->|"EUV সরঞ্জাম"| TSMC
    ASML -.->|"অবরুদ্ধ"| SMIC
    TSMC -.->|"বিচ্ছিন্ন"| Huawei

    style Huawei fill:#ffebee
    style SMIC fill:#fff3e0
    style BIS fill:#e3f2fd

৬. UnifiedBus (灵衢): ডেটাসেন্টারের জন্য একটি প্রোটোকল

τ সূত্রের একটি গুরুত্বপূর্ণ কিন্তু কম আলোচিত অংশ: UnifiedBus

৬.১ ব্যাবিলনের টাওয়ার সমস্যা

বর্তমান ডেটাসেন্টার ইন্টারকানেক্ট একটি তালি দেওয়া কাপড়:

  • চিপ-টু-চিপের জন্য PCIe
  • GPU মেমোরি পুলিং-এর জন্য NVLink/CXL
  • সার্ভার-টু-সার্ভারের জন্য InfiniBand/RoCE
  • ব্যবস্থাপনার জন্য ইথারনেট

প্রতিটি অনুবাদ কাঁচা তারের বিলম্বের উপর ৫০০–১০০০× ওভারহেড যোগ করে।

৬.২ একটি স্ট্যাক

UnifiedBus অন-চিপ বাস থেকে ইন্টার-র্যাক অপটিক্যাল লিঙ্ক পর্যন্ত বিস্তৃত একটি একক প্রোটোকল দিয়ে তালি দেওয়া কাপড় প্রতিস্থাপন করে:

বৈশিষ্ট্যপ্রচলিতUnifiedBus
প্রোটোকল স্ট্যাকএকাধিক (PCIe + NVLink + IB + Eth)একক ইউনিফাইড স্ট্যাক
মেমোরি মডেলDMA-ভিত্তিক, ড্রাইভার-মধ্যস্থনেটিভ মেমোরি সেমান্টিক্স
লেটেন্সি (র্যাক-টু-র্যাক)~10–50 μs~1–5 μs
ভৌত পৌঁছানোকপার: ~2mঅপটিক্যাল: 100–200m
রিসোর্স মডেলনির্দিষ্ট বরাদ্দপূর্ণ পুলাইজেশন
ফেইলওভারসেকেন্ডসাব-সেকেন্ড
graph LR
    subgraph Traditional["প্রচলিত বহু-প্রোটোকল স্ট্যাক"]
        direction TB
        APP1["অ্যাপ্লিকেশন"]
        DRV1["ড্রাইভার"]
        PCIe["PCIe স্তর"]
        NVLink["NVLink স্তর"]
        IB["InfiniBand"]
        ETH["ইথারনেট"]
        APP1 --> DRV1 --> PCIe
        DRV1 --> NVLink
        DRV1 --> IB
        DRV1 --> ETH
    end

    subgraph UB["UnifiedBus একক স্ট্যাক"]
        direction TB
        APP2["অ্যাপ্লিকেশন"]
        UBL["UnifiedBus স্তর"]
        PHY["ইউনিভার্সাল ফিজিক্যাল লেয়ার<br/>(কপার + অপটিক্যাল)"]
        APP2 --> UBL --> PHY
    end

    style Traditional fill:#ffebee
    style UB fill:#e8f5e9

মার্চ ২০২৫ থেকে UnifiedBus 1.0-এ ৩০০+ Atlas 900 সুপার নোড শিপ করা হয়েছে। UnifiedBus 2.0 স্পেসিফিকেশন ওপেন-সোর্স করা হয়েছে।


৭. বাজার প্রভাব

৭.১ স্টক মুভমেন্ট (২৬ মে, ২০২৬)

কোম্পানিপরিবর্তন
SMIC+17–19%
Hua Hong Semiconductor+20%
JCET+12%
Naura Technology+15%
Nvidia-2.3%

৭.২ বিশ্লেষকরা কী বলছেন

Futurum Group (আশাবাদী):

“টাউ স্কেলিং সূত্র এবং LogicFolding চীনের নিজস্ব শর্তে সেমিকন্ডাক্টর অগ্রগতি পুনঃসংজ্ঞায়িত করার সবচেয়ে উচ্চাকাঙ্ক্ষী প্রচেষ্টা।”

Omdia / The Register (সংশয়বাদী):

“হুয়াওয়ের দাবি যুগান্তকারীর চেয়ে ব্র্যান্ডিং বেশি। LogicFolding একটি ডিজাইন উদ্ভাবন, কিন্তু নির্দিষ্ট পারফরম্যান্সে চিপ তৈরি করা এবং গ্রহণযোগ্য ইল্ডে লাখ লাখ তৈরি করা ভিন্ন সমস্যা।”

虎嗅 / Huxiu (ভারসাম্যপূর্ণ):

“টাউ সূত্র আকাশ থেকে পড়েনি। Nvidia থেকে TSMC, AMD থেকে SK Hynix — পুরো শিল্প এক দশক ধরে এই দিক অন্বেষণ করছে। হুয়াওয়ের অবদান এই অন্বেষণকে একটি স্পষ্ট কাঠামোয় রূপ দেওয়া — চীনা কোম্পানি থেকে প্রথম এমন পদ্ধতিগত নীতি।“

৭.৩ প্রতিযোগিতামূলক দৃশ্যপট

quadrantChart
    title AI চিপ প্রতিযোগিতামূলক দৃশ্যপট (2026)
    x-axis নিম্ন ইকোসিস্টেম পরিপক্বতা --> উচ্চ ইকোসিস্টেম পরিপক্বতা
    y-axis নিম্ন কাঁচা পারফরম্যান্স --> উচ্চ কাঁচা পারফরম্যান্স
    quadrant-1 বিশেষ খেলোয়াড়
    quadrant-2 বাজার নেতা
    quadrant-3 উদীয়মান প্রতিযোগী
    quadrant-4 পারফরম্যান্স বিশেষজ্ঞ
    "Nvidia H100/B200": [0.95, 0.95]
    "Nvidia H20": [0.90, 0.30]
    "Huawei Ascend 910C": [0.35, 0.75]
    "Huawei Ascend 910D": [0.40, 0.90]
    "AMD MI300X": [0.70, 0.85]
    "Intel Gaudi 3": [0.60, 0.70]
    "Google TPU v5": [0.55, 0.80]
    "Amazon Trainium2": [0.50, 0.65]

৮. DeepSeek সংযোগ

DeepSeek — চীনা AI ল্যাব যার R1 এবং V3 মডেল বৈশ্বিক LLM অর্থনীতিকে নাড়া দিয়েছে — হুয়াওয়ের CloudMatrix-এ উল্লেখযোগ্য ইনফারেন্স ক্ষমতা চালায়।

৮.১ ইনফারেন্স অর্থনীতি

মেট্রিকAscend 910C-এ DeepSeekNvidia H800-এ DeepSeek
ইনফারেন্স খরচ (V3)~1 CNY / 1M টোকেন~7 CNY / 1M টোকেন
ইনফারেন্স খরচ (R1)~4 CNY / 1M টোকেন~20+ CNY / 1M টোকেন
প্রিফিল দক্ষতা4.45 tok/s/TFLOPS3.96 tok/s/TFLOPS
ডিকোড দক্ষতা1.29 tok/s/TFLOPS1.17 tok/s/TFLOPS

ইনফারেন্সের জন্য ১০× খরচ সুবিধা। যখন সফটওয়্যার হার্ডওয়্যারের জন্য কো-অপ্টিমাইজড হয় — CANN, CUNN কার্নেল, কাস্টম অপারেটর — কার্যকরী ব্যবধান নাটকীয়ভাবে সংকুচিত হয়।

৮.২ ফুল-স্ট্যাক সমন্বয়

flowchart LR
    subgraph HW["হুয়াওয়ে হার্ডওয়্যার স্ট্যাক"]
        A["Ascend 910C/910D<br/>NPU"]
        B["CloudMatrix 384<br/>সুপার নোড"]
        C["UnifiedBus<br/>ইন্টারকানেক্ট"]
    end

    subgraph SW["সফটওয়্যার স্ট্যাক"]
        D["CANN / CUNN<br/>CUDA বিকল্প"]
        E["MindSpore / PyTorch<br/>ফ্রেমওয়ার্ক"]
        F["DeepSeek R1/V3<br/>অপ্টিমাইজড মডেল"]
    end

    subgraph Market["বাজার প্রভাব"]
        G["1 CNY / 1M টোকেন<br/>V3 ইনফারেন্স"]
        H["90% খরচ হ্রাস<br/>বনাম Nvidia ক্লাউড"]
        I["20,000+ ডেভেলপার<br/>ইকোসিস্টেমে"]
    end

    A --> B --> C
    D --> E --> F
    HW --> SW --> Market

    style HW fill:#e3f2fd
    style SW fill:#e8f5e9
    style Market fill:#fff3e0

৯. সমালোচনামূলক মূল্যায়ন: কী বাস্তব, কী প্রক্ষেপণ

দাবিপ্রমাণের অবস্থামূল্যায়ন
τ সূত্র কাঠামোIEEE ISCAS-এ প্রকাশিতপিয়ার-রিভিউ করা; শক্ত ভিত্তি
৩৮১টি চিপ ব্যাপক উৎপাদিতহুয়াওয়ে প্রকাশবিশ্বাসযোগ্য; একাধিক পণ্য লাইন
LogicFolding 53.5% ঘনত্ব লাভKirin 2026 ডেটাঅযাচাইকৃত; শরৎ 2026 লঞ্চ যাচাই করবে
2031 সালের মধ্যে 1.4nm-সমতুল্যপ্রক্ষেপণউচ্চাকাঙ্ক্ষী; বহু-স্তর ফোল্ডিং-এর উপর নির্ভরশীল
Ascend 910C H100-এর 80%স্বাধীন অনুমানবিশ্লেষক ঐকমত্য; DeepSeek দ্বারা যাচাইকৃত
CloudMatrix দক্ষতা > H100প্রকাশিত বেঞ্চমার্কMoE ইনফারেন্সের জন্য প্রতিযোগিতামূলক; প্রশিক্ষণের ব্যবধান রয়ে গেছে

মূল ঝুঁকি

  1. উৎপাদন: SMIC 7nm ইল্ড (40–50%) TSMC (>80%)-এর অনেক নিচে। EUV ছাড়া 7nm-এর নিচে যাওয়া নৃশংস অর্থনীতি।

  2. মেমোরি বাধা: নিষেধাজ্ঞার অধীনে HBM3/HBM3e উৎস করা প্রায় অসম্ভব। CXMT দেশীয় HBM এখনো প্রাথমিক পর্যায়ে।

  3. ইকোসিস্টেম ব্যবধান: CANN/CUNN কার্যকরী। CUDA নয়। “এক-লাইন ইম্পোর্ট” মাইগ্রেশন প্রতিশ্রুতি জটিল মডেলের জন্য আশাবাদী।

  4. ডাই এরিয়া: Ascend 910C চিপ এরিয়া H100-এর চেয়ে ~60% বড়। আর্কিটেকচার প্রতি ট্রানজিস্টরে কম দক্ষ।

  5. বাজার অ্যাক্সেস: US নিষেধাজ্ঞা Ascend-কে চীন + বন্ধুত্বপূর্ণ বাজারে (মধ্যপ্রাচ্য, রাশিয়া, SE এশিয়ার অংশ) সীমাবদ্ধ করে।


১০. এটি কোথায় যাচ্ছে: ২০৩০ পর্যন্ত পাঁচটি দৃশ্যপট

  1. অভিসরণ (Convergence): হুয়াওয়ে দেশীয় EUV বা নিষেধাজ্ঞা শিথিলের মাধ্যমে ধরে ফেলে। ব্যবধান <1 প্রজন্মে নেমে আসে।

  2. স্থায়ী দ্বিখণ্ডন (Sustained Bifurcation): দুটি সমান্তরাল ইকোসিস্টেম। চীন দেশীয় + বেল্ট অ্যান্ড রোডে আধিপত্য বিস্তার করে। পশ্চিম প্রিমিয়াম বৈশ্বিক বাজার ধরে রাখে।

  3. পশ্চিমা এগিয়ে যাওয়া (Western Pull-Ahead): TSMC GAA/CFET সহ 1nm-এ পৌঁছায়। আর্কিটেকচার ক্ষতিপূরণ দিতে পারে না। হুয়াওয়ে 3+ প্রজন্ম পিছিয়ে পড়ে।

  4. দৃষ্টান্ত পরিবর্তন (Paradigm Shift): τ সূত্র নীতি শিল্প-ব্যাপী গ্রহণ পায়। আর্কিটেকচারাল উদ্ভাবন প্রাথমিক লিভার হয়। প্রসেস নোড কম গুরুত্বপূর্ণ হয়।

  5. পূর্ণ বিচ্ছিন্নকরণ (Full Decoupling): সম্পূর্ণ বিভাজন। চীন ৫–১০ বছরের বিলম্বের মূল্যে স্বয়ংসম্পূর্ণতা অর্জন করে। বৈশ্বিক উদ্ভাবন ধীর হয়।


১১. একজন নিয়ম-নির্ধারক, অনুসারী নয়

τ সূত্র একটি টেকনিক্যাল পেপারের চেয়ে বেশি:

  • বৈজ্ঞানিক অবদান: পোস্ট-মুর অপ্টিমাইজেশনের জন্য পিয়ার-রিভিউ করা কাঠামো
  • ইঞ্জিনিয়ারিং কৌশল: এর নীতির অধীনে ইতিমধ্যে ৩৮১টি বাণিজ্যিক চিপ উৎপাদিত
  • ভূরাজনৈতিক সংকেত: US নিষেধাজ্ঞা চীনা সেমিকন্ডাক্টর উদ্ভাবনকে পঙ্গু না করে অনুঘটক (catalyst) করেছে
  • শিল্প আমন্ত্রণ: UnifiedBus 2.0 ওপেন-সোর্স করা হয়েছে

Ascend 910C — H100-এর ~80% পারফরম্যান্স ~10% খরচে — প্রমাণ করে যে আর্কিটেকচারাল উদ্ভাবন প্রসেস নোড অসুবিধা ক্ষতিপূরণ করতে পারে। 910D ব্যবধান পুরোপুরি বন্ধ করার লক্ষ্য নিয়েছে।

আগামী পাঁচ বছরে আমরা যে উত্তর পাব তা নির্ধারণ করবে τ সূত্র ঐতিহাসিক গুরুত্বে মুরের সূত্রের প্রতিদ্বন্দ্বী হবে কিনা:

  • SMIC কি 7nm-এ 70%+ ইল্ডে পৌঁছে 5nm-এ প্রবেশ করতে পারবে?
  • Kirin 2026 কি এই শরতে LogicFolding সরবরাহ করবে?
  • CANN কি CUDA-র সাথে ইকোসিস্টেম ব্যবধান বন্ধ করতে পারবে?
  • 2031 সালের জন্য 1.4nm-সমতুল্য লক্ষ্য অর্জিত হবে?

একটি জিনিস ইতিমধ্যে স্পষ্ট: হুয়াওয়ে 追赶者 (অনুসারী) থেকে 规则制定者 (নিয়ম-নির্ধারক)-এ স্থানান্তরিত হয়েছে।

হি থিংবো ISCAS 2026-এ যেমন বলেছিলেন:

“আমরা বিশ্বাস করি উন্মুক্ততা এবং সহযোগিতা সেমিকন্ডাক্টর শিল্পের চলমান অগ্রগতি চালানোর চাবিকাঠি। কোনো একক কোম্পানি স্বাধীনভাবে সেমিকন্ডাক্টর বিবর্তনের পথে সব উত্তর খুঁজে পেতে পারে না।”

τ সূত্র হুয়াওয়ের উত্তর। বাকি শিল্প এখন সিদ্ধান্ত নেয় এই প্রশ্নের সাথে যুক্ত হবে কিনা।


পরিশিষ্ট A: মূল সূত্রসমূহ

সময় ধ্রুবক বিয়োজন

τtotal=τtransistor2+τcircuit2+τchip2+τsystem2\tau_{\text{total}} = \sqrt{\tau_{\text{transistor}}^2 + \tau_{\text{circuit}}^2 + \tau_{\text{chip}}^2 + \tau_{\text{system}}^2}

সার্কিট-স্তরের τ:

τcircuit=RwireCtotal=ρLA(ϵoxAtox+Cparasitic)\tau_{\text{circuit}} = R_{\text{wire}} \cdot C_{\text{total}} = \frac{\rho \cdot L}{A} \cdot \left(\epsilon_{\text{ox}} \cdot \frac{A}{t_{\text{ox}}} + C_{\text{parasitic}}\right)

LogicFolding $L$ (তারের দৈর্ঘ্য) ৫০–৯০% কমায়, সরাসরি $\tau_{\text{circuit}}$ হ্রাস করে।

ট্রানজিস্টর ঘনত্ব সমতা

ρeffective=ρphysical×(1+i=1nfiηi)\rho_{\text{effective}} = \rho_{\text{physical}} \times \left(1 + \sum_{i=1}^{n} f_i \cdot \eta_i\right)

Kirin 2026-এর জন্য ($n=2$, $f=0.55$, $\eta=0.95$):

ρeffective=155×(1+0.55×0.95)238 MTr/mm2\rho_{\text{effective}} = 155 \times (1 + 0.55 \times 0.95) \approx 238 \text{ MTr/mm}^2

AI প্রশিক্ষণ দক্ষতা

TtrainingNparamsDtokensPcomputeηutilizationT_{\text{training}} \propto \frac{N_{\text{params}} \cdot D_{\text{tokens}}}{P_{\text{compute}} \cdot \eta_{\text{utilization}}}

হুয়াওয়ে $\eta_{\text{utilization}}$ লক্ষ্য করে — MoE-র জন্য CloudMatrix-এ >90% অর্জন, শিল্প গড় 40–60%।


পরিশিষ্ট B: শব্দকোষ

শব্দসংজ্ঞা
τ (টাউ)সময় ধ্রুবক — একটি ইলেকট্রনিক সিস্টেমের মধ্য দিয়ে সিগনাল প্রবাহের বৈশিষ্ট্যগত সময়
LogicFoldingসিগনাল পথ সংক্ষিপ্ত করতে সার্কিট স্তর উল্লম্বভাবে স্তূপীকৃত করার 3D চিপ আর্কিটেকচার
UnifiedBus (灵衢)PCIe/NVLink/InfiniBand প্রতিস্থাপনকারী ইউনিফাইড ডেটাসেন্টার ইন্টারকানেক্ট প্রোটোকল
CANNCompute Architecture for Neural Networks — হুয়াওয়ের AI সফটওয়্যার স্ট্যাক
CUNNAscend-এ PyTorch মডেলের জন্য CUDA-to-CANN মাইগ্রেশন লেয়ার
CloudMatrixAscend NPU ব্যবহার করে হুয়াওয়ের AI সুপারকম্পিউটার আর্কিটেকচার
SMIC N+2DUV লিথোগ্রাফি ব্যবহার করে SMIC-র 7nm-শ্রেণির প্রক্রিয়া
HBMHigh Bandwidth Memory — AI অ্যাক্সিলারেটরের জন্য 3D-স্তূপীকৃত DRAM
MoEMixture of Experts — শর্তাধীন কম্পিউটেশন ব্যবহারকারী নিউরাল নেটওয়ার্ক আর্কিটেকচার
EUVExtreme Ultraviolet লিথোগ্রাফি — সবচেয়ে উন্নত চিপ প্যাটার্নিং প্রযুক্তি

তথ্যসূত্র

  1. He Tingbo, “A Time Scaling Theory for Multi-Layer Electronic Systems,” IEEE ISCAS 2026, Shanghai.
  2. Huawei Official Newsroom, “Huawei Announces Tau (τ) Scaling Law,” May 25, 2026.
  3. Xinhua News Agency, “Huawei Unveils New Chip Design Approach,” May 26, 2026.
  4. DeepSeek / Huawei Cloud, “Serving Large Language Models on Huawei CloudMatrix384,” 2025.
  5. Morgan Stanley Research, “SMIC Advanced Node Yield Analysis,” September 2025.
  6. US Bureau of Industry and Security, “Export Control Guidance on PRC Advanced Computing ICs,” May 13, 2025.
  7. Hot Chips 31, “Huawei Da Vinci Architecture Deep Dive,” 2019.
  8. Wall Street Journal, “Huawei Tests Ascend 910D as Nvidia Alternative,” April 2025.
  9. 21st Century Business Herald, “Huawei Tau Law Analysis,” May 25, 2026.
  10. Futurum Group Research, “Does Huawei’s Tau Scaling Law Challenge Logic Leadership?” May 26, 2026.

IEEE প্রকাশনা, হুয়াওয়ে আনুষ্ঠানিক প্রকাশ, সিনহুয়া প্রতিবেদন, আর্থিক বিশ্লেষক গবেষণা, এবং প্রযুক্তিগত ডকুমেন্টেশন থেকে সংকলিত। পারফরম্যান্স পরিসংখ্যান সেরা উপলব্ধ অনুমান; প্রকৃত ফলাফল ডিপ্লয়মেন্ট অনুযায়ী পরিবর্তিত হয়।

সর্বশেষ আপডেট: ২৮ মে, ২০২৬

Share this page