硬體 baseline¶
參考機器¶
| 項目 | 規格 |
|---|---|
| CPU | Intel Xeon E-2388G @ 3.20GHz (8 cores) |
| 最大頻率 | 5.10 GHz turbo |
| Memory | ≥ 16 GB(hugepage 預配 512MB) |
| NIC | Xilinx/Solarflare X2522 25G |
| Driver | sfc + onload 9.1.1.66 |
| OS | RHEL 9(kernel 5.14.0) |
Core-to-Core 通訊延遲¶
量測工具:nviennot/core-to-core-latency 量測方式:CAS(Compare-And-Swap)on a single shared cache line 參數:每樣本 1,000 次迭代,300 個樣本
延遲矩陣(單位 ns)¶
core0 core1 core2 core3 core4 core5
core0
core1 34±0
core2 34±0 33±0
core3 27±0 27±0 26±0
core4 31±0 31±0 31±0 24±0
core5 32±0 32±0 31±0 24±0 30±0
| 統計項目 | 數值 | 核心對 |
|---|---|---|
| 最小延遲 | 24.0 ns ±0 | core (5,3) |
| 最大延遲 | 34.5 ns ±0 | core (1,0) |
| 平均延遲 | 30.0 ns | — |
記憶體子系統特性¶
量測工具:Intel Memory Latency Checker (MLC) v3.12
| 項目 | 數值 |
|---|---|
| DRAM idle latency(隨機存取) | 69.6 ns |
| L2→L2 cache transfer(HIT) | 25.2 ns |
| L2→L2 cache transfer(HITM) | 29.3 ns |
| Peak memory bandwidth(all reads) | 23,555 MB/s |
L2→L2 HIT(25.2 ns)與上方 core-to-core 最小延遲(24.0 ns)高度吻合—— CAS 跨核操作走的正是 L2 cache coherence 路徑,兩項量測互相驗證。
DRAM idle latency 69.6 ns 列於此作為背景參考; Tapio 熱路徑設計目標為 zero L3 miss,正式執行時不應觸及 DRAM。