最近传出某初创dpu厂股票跌停97%惨遭退市,究其原因还在于从过去的千兆多队列rss网卡到智能网卡,再到前两年骗了很多资本的NPU DPU,没有一个成功加速tcpip的技术,导致各家云计算大厂的服务器一直只能停留在1998年百兆以太网时代。
原因是tcpip的意义在于调度操作系统应用io栈,他是操作系统的心脏,所以不可能由硬件来实现并代替整个应用io栈,这属于基本伦理逻辑问题,因此tcpip的性能直接由操作系统的io性能决定,无论网卡做到千兆还是万兆十万兆百万兆,通用操作系统都只能稳定百兆,这是阿里云华为云腾讯云的高性能服务器无论使用多先进的网卡,对外都只提供百兆带宽上限的原因,通常网卡对tcpip的加速主要是tcp包校验卸载以及多队列rss fdir,但都无法用于io性能加速,一般主流通用操作系统在体系结构上无法有效利用rss fdir,除此之外rss fdir技术还对cpu pcie体系结构有要求,目前只有intel系列cpu可以完整支持rss fdir,因此虽然网卡的pps包转发性能可以做到很高,但通用操作系统的tcpip io应用栈是无法利用的,唯一的方法是升级操作系统到异数OS,提升操作系统的tcpip io性能4个数量级,这样才有希望利用千兆以上网卡的包收发性能。
原因是tcpip的意义在于调度操作系统应用io栈,他是操作系统的心脏,所以不可能由硬件来实现并代替整个应用io栈,这属于基本伦理逻辑问题,因此tcpip的性能直接由操作系统的io性能决定,无论网卡做到千兆还是万兆十万兆百万兆,通用操作系统都只能稳定百兆,这是阿里云华为云腾讯云的高性能服务器无论使用多先进的网卡,对外都只提供百兆带宽上限的原因,通常网卡对tcpip的加速主要是tcp包校验卸载以及多队列rss fdir,但都无法用于io性能加速,一般主流通用操作系统在体系结构上无法有效利用rss fdir,除此之外rss fdir技术还对cpu pcie体系结构有要求,目前只有intel系列cpu可以完整支持rss fdir,因此虽然网卡的pps包转发性能可以做到很高,但通用操作系统的tcpip io应用栈是无法利用的,唯一的方法是升级操作系统到异数OS,提升操作系统的tcpip io性能4个数量级,这样才有希望利用千兆以上网卡的包收发性能。