跳轉到

硬體 baseline

參考機器

項目 規格
CPU Intel Xeon E-2388G @ 3.20GHz (8 cores)
最大頻率 5.10 GHz turbo
Memory ≥ 16 GB(hugepage 預配 512MB)
NIC Xilinx/Solarflare X2522 25G
Driver sfc + onload 9.1.1.66
OS RHEL 9(kernel 5.14.0)

Core-to-Core 通訊延遲

量測工具:nviennot/core-to-core-latency 量測方式:CAS(Compare-And-Swap)on a single shared cache line 參數:每樣本 1,000 次迭代,300 個樣本

延遲矩陣(單位 ns)

           core0   core1   core2   core3   core4   core5
core0
core1       34±0
core2       34±0    33±0
core3       27±0    27±0    26±0
core4       31±0    31±0    31±0    24±0
core5       32±0    32±0    31±0    24±0    30±0
統計項目 數值 核心對
最小延遲 24.0 ns ±0 core (5,3)
最大延遲 34.5 ns ±0 core (1,0)
平均延遲 30.0 ns

記憶體子系統特性

量測工具:Intel Memory Latency Checker (MLC) v3.12

項目 數值
DRAM idle latency(隨機存取) 69.6 ns
L2→L2 cache transfer(HIT) 25.2 ns
L2→L2 cache transfer(HITM) 29.3 ns
Peak memory bandwidth(all reads) 23,555 MB/s

L2→L2 HIT(25.2 ns)與上方 core-to-core 最小延遲(24.0 ns)高度吻合—— CAS 跨核操作走的正是 L2 cache coherence 路徑,兩項量測互相驗證。

DRAM idle latency 69.6 ns 列於此作為背景參考; Tapio 熱路徑設計目標為 zero L3 miss,正式執行時不應觸及 DRAM。