日前,硅谷创业芯片公司Tachyum公布了一颗神奇的处理器“Prodigy”,号称全球第一颗“通用处理器”(universal processor),最多拥有128个核心,而且频率高达5.7GHz,着实不可思议。
现在,更多细节来了。
Tachyum Prodigy处理器采用的是自研架构,64位VLIW架构核心,顺序执行,但对编译器优化后也可做4路乱序执行。
每个核心有另两个1024-bit矢量单元、一个4096-bit矩阵单元、64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,而且闲置的二级缓存还可以给其他核心用作三级缓存。
顶级型号“Prodigy T16128-AIX”,频率高达5.7GHz,支持16通道DDR5-7200内存,最大容量8TB,还支持64条PCIe 5.0,功耗也高达950W,必须液冷散热。
它主要面向高端AI、HPC领域,AI推理训练性能12PFlops(1.2亿亿次计算每秒),FP64 HPC计算性能90TFlops(90万亿次计算每秒)——AMD RISC-V MI250X计算卡可以跑到96TFlops,而且只需560W。
支持双路、四路并行,也就是单系统最多可以做到512个核心、32TB内存。
另外三颗128核心,分别叫做T16128-AIM、T16128-AIE、T16128-HT,频率分别为4.5GHz、4.0GHz、4.5GHz,功耗分别为700W、600W、300W,其中HT版本内存频率降至DDR5-6400。
64核心有两款,T864-HS、T864-HT,频率分别5.7GHz、4.5GHz,支持八通道DDR5-6400、32条PCIe 5.0,功耗都是300W。
32核心也有两款,T832-HS、T832-LP,频率分别5.7GHz、3.2GHz,后者内存频率降至DDR5-4800,功耗分别为300W、180W。
不过,Tachyum至今还没有一颗硅片,一切顺利的话预计8月中旬完成流片,使用台积电N5P 5nm增强版,核心面积预估不超过500平方毫米,12月份获得第一颗硅片。
这次现场展示的,还是用FPGA模拟的平台,四颗模拟八核心。
即便第一代还停留在PPT上,Tachyum已经开始展望下一代了:台积电N3 3nm,支持PCIe 6.0,同等功耗下性能翻一番!