为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

其实是有的:它就是默默发展的龙芯CPU。

前几代不说了。2019年12月24日,龙芯3A4000/3B4000在北京发布,使用与上一代产品相同的28nm工艺,通过设计优化,实现了性能的成倍提升。使用龙芯公司最新研制的新一代处理器核GS464V,主频1.8GHz-2.0GHz。

而实验的计算机采用:龙芯3A4000处理器、16GB内存及256GB SSD固态硬盘。首先是办公软件,主要是“Word、Excel、PPT”这三件套,当然龙芯跑的是Linux系统,使用的办公软件主要是WPS、永中Office等。还有视频软件,都使用正常,和其他CPU差不多。

但是很多资深的电脑爱好者认为其性能最多相当于Intel Core i5-3320M @ 2.60GHz。这款产品什么时候出现的呢?2012年。也就是说中国现在的最先进CPU仅仅大约相当于几年前的主流CPU。

所以即使出现,也没有人购买。当然龙芯也走了另一条道路,就是集成在很多设备上出售。例如智能空调等。

龙芯是中科院计算所基于MIPS指令集(买断版权>设计的处理起。除了指令集,几乎每一个功能部件都是独立设计的,当然也有一些算法参考了国外经典的教科书。这和上交”打磨”的汉芯,huawei 购买整个ARM设计版图的海思完全是不同的。龙芯国产化程度远远高于麒麟处理器。但由于性能差距,导致中国CPU没有生产出来的环境氛围,从而又反过来影响了CPU的研发。

同时由于由这个CPU的存在,美国哪怕和中国在高科技领域闹的这么凶。却不敢禁止CPU向中国的出口。

因为一旦禁止出口,龙芯马上就可以获得环境和市场。一旦批量生产,获得资金,那就再也没有美国什么事了!

龙芯目前并不是靠国家经费活下来的,而是一直艰难的寻求细分市场,卖设备。这点,就值得骄傲!

为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

我2014年现场参观过银河2号。

全球顶级的超级计算机(非军用)。

就是个大房子,至少一个足球场大。里面一柜子一柜子的CPU,全部都是美国造。基本上都是至强。主板是自己设计的。

当时的印象,感觉还是个高级组装厂而已。不能完全脱离美国。

当然有自己的技术在里面。我前面说过了,主板。可是,CPU确实造不了。

我说的是2014年。后来没有再关注,其变化就不了解了。

为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

嘿嘿!中国的超算最顶级?谁和你说的是顶级?我们国家超算机数量确实是世界第一,这点毋容置疑,但技术方面,目前远远还未达到顶级。

2019年11月,超算TOP500榜,我国上榜超级计算机达到228台,总体算力占据32.3%,美国上榜的超级计算机117台,总体算力占据37.1%。

也就是说,我们228台超算算力抵不过美国117台超算算力。

今天我们就来说说,中国的超算技术为什么和顶级无关?首先,中国超算的总体思路,我感觉就是不差钱,只要整出来就完事了,至于其它的不需要考虑。

所以一开始就倾向于所谓的总体设计,尤其是主板,处理器的主核、从核都是完整配套的,最后集成在主板上。

好处是,集成度高,缺点是成本过高,通用性无,也无法民用。

而这种所谓的整体配套在历史上我们其实吃过很多亏,因为它很难适应科学技术的快速发展,后果就是牵一发而动全身,反而造成了技术的滞后。

实际上,结果已经来了,就在2020年6月23日,TOP500发布了世界超级计算机TOP500排名,日本超级计算机Fugaku( 富岳)以每秒23047 TFlop的峰值速度,超越美国“顶点”计算机,夺取第一名宝座。

Fugaku超算这次不仅在TOP500上取得了第一,在HPCG、HPL-AI和Graph500的排名中均取得了第一。

Fugaku采用了富士通的48核A64FX SoC,这是500强榜上唯一一个由ARM处理器,也是ARM处理器首次登陆超算排行榜500强。

Fugaku每秒达到41.55亿亿次的运算速度,约是第二名美国"顶点”超算运算速度每秒14.88亿亿次的2.8倍。

这就是技术的先进性带来的巨大贡献,ARM处理器的运用将改变以往整个超算硬件设备。

前三中没有中国的超算,神威.太湖之光超级计算机和天河2A超级计算机排在第四和第五,运算速度分别是9.3亿亿次和6.14亿亿次。

太湖之光采用了40960个“申威26010”众核处理器板。该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1京为1亿亿)

而申威26010处理器是我国江南所自主研发的,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops。

每片处理器包含4个核心,片上的4个核心通过片上网络互联,并通过PCI-E 3.0对外连接,每个核心拥有独立的128位DDR3控制器连接到8GB DDR3-2133内存,这样4个核心一共拥有32GB的DDR3内存。

你理解成,一片申威26010处理器上粘了4块CPU就可以了,最后核心总数为10,649,600 个。

单纯从技术来讲,SW26010的协处理器只有16KB的L1指令缓存和64KB的本地存储,intel的phi处理器轻松吊打SW26010的计算核心,一点问题没有。

一片申威26010处理器板,我们无从得知多少钱。

但太湖之光的总投资我们是知道的,18个亿的国家拨款,包括了硬件、研发和软件费用,但不包括运营维护费用。

综上所述,您还觉得我们的超算在世界上是顶级的吗?

未来,中国的超算将朝着高性能、低功耗的方向拓展。而芯片设计、任务分配、算法优化、应用范围、散热系统等依然是努力的重点。

为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

%首先是架构上,超算不是我们常规个人电脑上使用单个中央处理器,而是由多个运算单元组成的混合加速体系(可以理解为多路CPU联合运算),比如经典的天河1号,就是由是Intel提供的大约10万颗Ivy Bridge-EP Xeon E5、10万颗Xeon Phi组成的。

超算不是简单地将这些单元组装起来,就能实现最大的运算效果,而是需要很强的整体架构设计能力,后来还利用GPU进行运算加速,因此我国在超算领域的核心竞争力应该是优秀的整体设计能力,这也一定程度上避开了在单体芯片上的劣势

单体芯片在近年来也有国产化的趋势,虽然在性能上还远远比不过英特尔、英伟达和AMD,但是仍可以通过优秀的联合设计能力获了相当强悍的整体运算能力。

比如我国自主研发的“神威·太湖之光”超级计算机,就是使用4万多颗“申威26010”芯片组成,并且一度登顶全球No.1

不过需要正视的是,目前世界范围内大部分顶级超算中,大部分用的是英伟达的GPU和英特尔的CPU,国产芯片在单体算力和运行效率(算力与功耗比)上还是有不少距离的

而在消费者CPU市场,光今年就已经推出过不少产品,但是离“能用”的确还是有一定的距离的

这个差距还是在单体芯片的制程工艺和算力上,而这个差距是很难利用超算的集群优势和整体设计方案来拉近的(总不能让家用机堆个10路CPU)

所以就导致了超算市场强悍,但是个人消费市场仍缺乏具有实用价值的产品

为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

我国的超级计算机也被美日两国的给比下去了,2020年最新超算排名为“富岳,顶点,山脊,神威太湖之光,天河2A”,以前是中美两国在争夺超算的第一名,现在又加入了日本。另外,国内也有民用消费级CPU的,如“鲲鹏,麒麟,龙芯,兆芯,申威,海光,飞腾,”,只不过,在桌面级CPU上,国产的性能上与因特尔和AMD相差较远,所以市场基本上被因特尔和AMD瓜分了。

另外,全部国产化的第一台计算机“天玥”已经被制造出来了。随着国家对半导体技术的重视,性能更加强悍的国产CPU,内存条,储存器都会出现的。

国产超级计算机

目前计算能力最强的也就是排名第四的神威太湖之光了,其计算速度为9.3亿亿次。神威太湖之光采用了40960个申威20610型处理器。要知道超级计算机的浮点运算能力并不是单独依赖单个CPU的性能,而是靠全部CPU共同的协作能力。那就得将40960个申威处理器的性能全部发挥出来,这就要用到极为厉害的并行度设计了。只有用越多的CPU和越强的并行度,制造出来的超级计算机的运算速度才最快。

从神威太湖之光超级计算机的研发过程中可以看到,国内在专用CPU,超算并行度设计上已经达到了国际先进水平。而至于消费级别的CPU,这玩意你除了要有市场之外,还要有领先同行的性能。可以这样说,我国在专用CPU技术的发展上并不落后国际先进水平,但是在民用消费级CPU上,压根就没有可以与因特尔和AMD相抗衡的芯片存在。

消费级CPU需要的制造能力

总而言之,制造现在的CPU就离不开先进的光刻机和领先的制程工艺。目前来看因特尔最先进的制程工艺节点为10纳米,同样采用X86架构的国产兆芯处理器的制程工艺节点为16纳米,这是在2019年6月推出的。而完全是国内自研的CPU如“龙芯,申威”等等其最低工艺制程节点为28纳米。毕竟在缺乏EUV光刻机的前提下,想要将芯片制程推向16纳米,10纳米,7纳米是极为困难的。目前来说,全球也只有台积电可以用DUV光刻机制造出制程工艺节点为7纳米的芯片了。所以说,国产消费级CPU落后米国的原因之一就是制造工艺的限制。

消费级CPU的生态

要知道现在消费级电脑的操作系统就是Windows系列的,想要打进这个市场,国产CPU就必须支持Windows系统,否则就没有生态环境。没有人们所需要的软件,游戏等,那么这样的CPU又有谁会去买呢?没有市场,就没有资金去研发下一代CPU和先进的制程技术。这也是国产消费级操作系统和CPU始终无法打入消费市场的原因之一。

综合来看,国产专用CPU技术与国际的差距,是没有民用的大的。

为什么有人说中国有最顶级的超级计算机,却没有一个能用的消费级CPU?

到了超算级别,核心技术已经不是单CPU计算,而是如何让数万甚至数十万、数百万CPU充分发挥计算能力的问题。看似乎简单,联起来不就完了吗?还真不是这样。2000年之前的作法是把多个CPU放在一个主板上,用总线高速连结,大家共享内存,这种大型计算机效率非常高,用UNIX操作系统,价格很贵,只用在少数领域:石油勘探、天气预报、核模拟等。后来网络技术发达了,发现把多个台式个人机用交换机联上网,让他们协同工作也能达到相同的算力,又非常廉价,取名叫:PC集群,这一方式快速发展很快,当时最大的IBM的巨型机竞争不过,也转向了PC集群。用这种集群计算,首先要解决数据分发问题,大量的数据输入(I/O)如何分发到各CPU?同步计算,就像一个小区里,大家上网平时挺快,但要是同时下载同一个电影,or打同一个游戏会不会卡。第二,是一个复杂计算如何分解给大家算?就象一个师三万士兵抢滩登陆战,是一排一排登陆or并排行进,不论哪种协调不好都会出乱子。第三个难题是,内存的共享。PC单机内存都不大,而上“超算机”的计算内存需求都很大,要用的算法数据进不了内存还怎么算?。第四是硬件层面,解决各节点负载不平衡情况下,供电、散热、网络的运行问题。上面这四个问题看单CPU已经不是超算的核心问题。有些科学计算利GPU效率更高。

目前制约我国超算的主要是软件应用问题。以PC集群架构的超算,使用linux操作系统,大型服务器几乎都用这个。但要上超算的超级应用有很多类,例如,核模拟是以大型计算为主,要求巨大内存和多节点同步计算;石油勘探,是大数据流量加大型计算为主;银行和微信服务器是以多事件触发式计算,这些不同种类的应用要充分在超算上发挥,需要软件并行算法的优化和配置优化。因此国家定制的银河、太湖之光等超算很难跑上面说的应用。

内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请与我们联系,我们将及时删除。

相关推荐