amd吧 关注:791,543贴子:18,191,607
  • 49回复贴,共1

讲一讲关于CUDIMM与USB4之间的那些事

只看楼主收藏回复

首先,此贴可能会是CUDIMM出来之前最后一个分析贴,此贴的相关论点所涉及到的东西是任何所谓的PPT和小道消息搬运不来的,所以可能会超出很多人的认知和观点,当然你们认为是臆识也好,还是民科笑料也罢,最后都交由时间去验证,不与争论。
对于X870与USB4(协议)之间的那些事,应该从全吧来说,应该还从未有人涉及相关的讨论,所以对于你们有任何的质疑都是合理的,毕竟这东西涉及到的东西很多,从服务器端到桌面端,从协议与协议直接的通信与互联等。
要讲X870与USB4之间的关系,就必须先从去服务器端入手,从架构入手。
简单作一个对比:
EYPC(CXL总线协议)----RDIMM------主板(CPU直出PCIE通道)
ZEN5(AXI4总线协议)----CUDIMM-----主板(CPU直出PCIE通道)
这是一张EPYC的soc platform overview图,可以看到两个关键性的节点,直出PCIE和SerDes以及CXL协议。特别要讲一讲SerDes这个东西,这是实现与内存建立通信的关键所在。

SerDes全称叫SERializer(串行器)/DESerializer(解串器),这种主流的高速的时分多路复用(TDM)点对点的串行通信技术可以充分利用通信的信道容量,提升通信速度。
Serdes具有以下优点:
1.减少布线冲突(非独立时钟嵌入在数据流中,解决了限制数据传输速率的Sinal时钟的Jilter时钟抖动题):带宽高
2.引脚数目少 :
3.抗噪声、抗干扰能力强(差分传输)
4.降低开关噪声:
5.扩展能力强;
6.更低的功耗和封装成本;
Serdes结构
其结构主要包括以下几个部分:
时钟恢复模块(Cock Recovery Module) 时钟恢复模块的作用是从接收到的串行数据中提取时钟信号,以便后续电路正确解析收到的数据。时钟恢复模块通常采用 PLL、DLL等技术实现。
数据编解码模块(Data Encoding and Decoding Module)
串行器(Serializer)
解串器(Deseraizer)包括数据解码、时钟恢复、数据缓存和对齐等部分,可以实现高速、稳定的数据传输。
时钟校正(ClockCorecion)在高速串行通信中,由于发送端和接收端时钟的不完全同步,数据可能会出现位移和抖动,导致误码率增加。为了解决这个问题,可以采用Clock Correction技术,该技术会利用特定的算法来对接收端的时钟进行校正,以使其与发送端的时钟同步,
从而能够更准确地接收数据。
通道捆合(Channel Bonding)是一种将多个物理通道绑定在一起,形成一个逻辑通道的技术。在SerDes(串行器/解串器)中,它可以通过将多个高速串行通道捆绑在起、实现更高带宽的传输。
锁相环 PLL
PLL重要应用:数据时钟恢复(Clock Data Recovery,CDR),去除时钟偏移;
使用PLL去除时钟偏移
在SoC中,时钟树被用于将时钟信号分配给物理上分布在芯片各个区域的触发器。在时钟树的通路上,分布着带有延迟的驱动器。由于时钟分布路径上存在延迟,叶节点上的时钟与根节点上的时钟相比,存在相移(相位滞后)。此时,可以使用PLL消除叶节点上时钟的相移
使之和根节点上的时钟相位对准,如图所示。

CUDIMM因为是下放的产物加入了一个CKD(时钟驱动器),即使用CKD模式(单PLL或双PLL)。这样CUDIM才能通过PCIE通道与CPU之间建立起链接进行通信。

由于EYPC服务器端PCIE通道足够多,同时EYPC主板并没有USB4接口的需求,所以在EYPC上是PCIE通道直出,并不需要直出到USB4;
但是在桌面端,受限于PCIE通道总数量的限制,同时又有USB4接口的需求,所以单直出PCIE通道作为CPU与内存之间的链接通道显然是浪费的,但是正是由于USB4协议支持多协议,,即支持USB、又支持PCIE和DP,并能够根据实际需求动态分配带宽,所以在X870上巧妙的实现了通过直出pCIE通道给USB4,通过USB4协议即实现了USB4接口的需求,又满足了CPU与内存之间的链接通道的需求,所以这就是CUDIMM与USB4之间的那些事。


IP属地:四川1楼2024-10-02 23:52回复
    CUDIMM的下放对于桌面端的最重大的意义就在于从此在桌面端也能实现1+1>1.5这种读写叠加的惊喜,4插槽远远>2插槽,读写110G,120G+都不在是梦,而不是现在的1+1=1甚至小于1的平淡无奇,随便摘录一下EYPC的内存带来的那种几百个G的ENJOY。




    IP属地:四川2楼2024-10-02 23:54
    收起回复
      最后再次致敬吹逼一下Xilinx,毕竟是上至深空,下至深海,天上飞的,地上跑的都能涉及,Xilinx也是把多种协议玩的很6才有今天AMD的成就。


      IP属地:四川3楼2024-10-02 23:56
      回复
        你能不能少发表点暴论,PCIE是差分串行总线,DRAM是单端信号,而且PCIE的PHY层远比DRAM的PHY层负载,你是怎么得出“CUDIMM通过PCIE通道与CPU建立连接”这种傻子结论的?没学过计组闹麻了,原来主存是外设啊哦,因为PCIE和CKD都有PLL,所以PCIE能接使用了CKD的CUDIMM?那我能不能给同样使用了PLL的STM32F103接上CUDIMM扩展出128GB内存


        IP属地:广东来自Android客户端4楼2024-10-03 00:38
        回复
          你说得对,但是我觉得火箭就应该烧水洗煤,普通的无烟煤都不行。你们认为这是民科笑话也好,最后都交由时间去认证


          IP属地:加拿大来自Android客户端5楼2024-10-03 01:49
          回复
            CUDIMM那个事你是一点也没有细说,我可不可以简单理解成CUDIMM的作用就是把1分4变成是一分2再分2


            IP属地:广东7楼2024-10-03 02:46
            收起回复
              顺便再讲一点关于 bypass mode only'(即所谓旁路模式)最最最基本的知识。
              在X870主板上介绍说明的最后一行写着这么一句
              "Supports CUDlMM, Clock Driver bypass mode only'翻译过来就是:
              支持CUDIMM,仅时钟驱动器旁路模式。
              这句话什么意思呢,它只是一个注释,它表达了两个含义,一个含义就是X870支持CUDIMM(即标注的XMP8400 OC),另一层含义就是以及时钟驱动器旁路模式。这两个分别代表着什么呢;首先就要从CUDIMM的运行模式说起:
              CUDIMM最关键的就是加入了一个CKD,同时与现在使用的标准DDR5 DIMM的阵脚相同-288针,所以它依然能够兼容现有的DDR5内存控制器,CUDIMM有两种模式(一种是CKD模式,另一种即旁路模式)
              但是如果你要想在X870上实现CUDIMM的主板标注的XMP8000+以上的频率,首先就是你的CPU的内存控制器需要支持CUDIMM,如果你的内存控制器不支持CUDIMM,那么就会以另一种模式bypass mode即旁路模式运行,最高的频率也就能达到DDR5-6000(3000MHz)的这么一个速度。
              现在X870主板上支持3个系列的CPU,即7000系,8000系和9000系。分别能运行的模式大概就分为以下几种:
              X870+9000系+CUDIMM(可完美实现CUDIMM XMP8200+的频率,并且分频比同频的读写更高,4插槽读写>2插槽,延迟4插槽>2插槽,读写能力大概率能达到110-130G)
              X870+9000系+标准DDR5 DIMM(无CUDIMM,根据体质部分可实现XMP8200+,手动看能力,分频与分频的读写能力差距不太大,4插槽读写<2插槽,延迟4插槽>2插槽)
              X870+8000 APU系+CUDIMM(大概率不支持CUDIMM模式,看支持情况只能以bypass mode(旁路模式)运行,最高只能6000)
              X870+8000 APU系+标准DDR5 DIMM(APU系列能超,手动看能力10000+以上不是梦,4插槽读写<2插槽)
              X870+7000 系+CUDIMM(不支持CUDIMM,看后期AMD支持情况是否下放技术支持以bypass mode(旁路模式))
              X870+7000 系+标准DDR5 DIMM(无CUDIMM,根据体质部分可实现XMP8200+,手动看能力,4插槽读写<2插槽)


              IP属地:四川8楼2024-10-03 09:06
              收起回复
                鬼扯。。。
                一个phy就是不同的东西了。。


                IP属地:福建9楼2024-10-03 09:49
                收起回复
                  聊一聊一个有趣的现象,CUDIMM XMP9600也出来了这些天了,X870也上市了,X890也出来了,按理说正是各家表现的时候,但是直到现在依然没有任何一家内存厂商出来秀CUDIMM在A平台还是I平台上的具体表现,也没有一家板厂的员工或博主比如某些群体的信仰之神林大工程师,我记得前不久在某一期视频里拿着一对CUDIMM讲那些关于X870的事,甚至某些魔怔人口口声声解读为X870不支持CUDIMM,只能bypass mode,这是一个发生在15代即将上市微妙的时间平衡点,难得一致的都保持默契,毕竟牙膏现在的市场声誉可经不起考验,所以对于CUDIMM的真实性能大概也只有等15代上市之后才能一见真知


                  IP属地:四川来自iPhone客户端10楼2024-10-03 10:13
                  收起回复
                    P老师永远的神,我太崇拜你了


                    IP属地:安徽11楼2024-10-03 11:39
                    收起回复
                      桌面端超过120G读写很奇怪吗


                      IP属地:广西12楼2024-10-03 13:08
                      收起回复
                        X870滞销 奸商急了


                        IP属地:福建来自Android客户端13楼2024-10-03 13:41
                        回复
                          @又是一个夏天 真特马可怜的云玩家,随便找的2根和4根的跑分图,来告诉我你桌面端插4根和2根读写的差别在哪里,就算给你插满12根你的读写能增加一丝一毫?


                          IP属地:四川来自iPhone客户端14楼2024-10-03 15:01
                          收起回复
                            你真了解cxl是啥吗


                            IP属地:福建来自Android客户端15楼2024-10-03 17:09
                            收起回复
                              能分享下妳是如何做到自我高潮的吗?


                              IP属地:湖南来自iPhone客户端16楼2024-10-03 17:18
                              收起回复