證明生成的過程中,約有60%的時間花在MSM上,其余時間由NTT/FTT主導(dǎo)。MSM和NTT都存在性能挑戰(zhàn),通常的解決辦法:
●MSM可以在多線程上執(zhí)行,從而支持并行處理。然而,當(dāng)處理大型數(shù)據(jù)向量時,例如6700萬個參數(shù),乘法運(yùn)算可能仍然很慢,并且需要大量的內(nèi)存資源。此外,MSM存在可擴(kuò)展性方面的挑戰(zhàn),即使在廣泛并行化的情況下也可能保持緩慢。
綜上來看,內(nèi)存和帶寬是限制證明生成的主要瓶頸。對于顯卡來說,這里的內(nèi)存指的是顯存,并不是主板上的內(nèi)存,主板上的內(nèi)存主要是參與CPU的計(jì)算。當(dāng)然目前有些芯片技術(shù)可以打通主板上的內(nèi)存和顯存,讓內(nèi)存為顯存計(jì)算來用。
目前零知識證明(ZKP)應(yīng)用的主要2個方向:隱私和可驗(yàn)證計(jì)算,Aleo是隱私L1公鏈,同時兼具可編程性,像ZCash等雖然也是隱私公鏈,但是不具備可編程性。以太坊L2上的ZK-Rollup項(xiàng)目,屬于可驗(yàn)證計(jì)算,我們之前的文章也分析過:重磅分析!為什么說FPGA或者ZK通用服務(wù)器在Aleo項(xiàng)目上機(jī)會是零?,在證明的需求量上完全不是一個級別。
早在2021年,英偉達(dá)就曾公開表示過“禁止使用轉(zhuǎn)換層在其他硬件平臺上運(yùn)行基于CUDA的軟件”,2024年3月,英偉達(dá)更是將其升級為“CUDA禁令”,直接添加在了CUDA的終用戶許可協(xié)議中,已禁止用轉(zhuǎn)譯層在其他GPU上運(yùn)行CUDA軟件