方法论

我们如何计算 GPU 性价比评分并标准化市场数据。

性能指数的构建方式

GPU 的原始速度来自多个公开跑分套件 — 3DMark Time Spy、3DMark Steel Nomad 和 PassMark — 但它们的刻度不统一,也并非每项测试都覆盖所有显卡。我们不依赖单一测试,而是将所有测试映射到同一刻度并加以融合,使单一数值能在不同测试框架下公平地对每款 GPU 进行排名。

单一固定基准

每张显卡均以 GeForce RTX 3060 12GB 这一参考 GPU 为基准,该 GPU 固定设为 100 分。乘以 87.35 可还原网站上熟悉的 3DMark 风格数值(RTX 3060 对应 8,735 分)。由于基准从不更改,评分可跨世代进行比较。

对齐各项跑分

各跑分测试的差异具有规律性 — 部分测试(如 PassMark)会压缩快慢显卡之间的差距,而游戏类测试则会拉大差距。我们通过显卡间的重叠数据学习每项测试的伸缩幅度并加以修正,使任意测试的评分都落在共同刻度的对应位置。

按可信度融合,填补缺口

对齐后的评分通过加权平均进行融合:游戏类跑分权重最高,合成类跑分权重较低。某张显卡缺少某项跑分时,仍可从其他跑分中公平评分,确保数据不完整不会导致排名虚高或虚低。仅当某张显卡完全没有真实跑分时,才将峰值 FP32 TFLOPS 作为最后手段。

缩放至 0–100% 便于参考

上述步骤生成原始 3DMark 风格指数。对于 GPU 和上架页面显示的「性能」数值,我们将该指数标准化至 0–100% 刻度:数据库中最快的 GPU 为 100%,其他所有显卡以其占最高分的百分比表示。这让相对速度一目了然 — 72% 的显卡约能发挥最快显卡实测性能的 72%。

显示计算过程

我们将每项跑分视为对单一隐藏量的噪声测量:GPU 的真实对数性能 θ(theta),参考 GPU 固定为 θ = 0。在对数空间中,每个来源 s 通过自身的直线与 θ 关联,斜率 bₛ 表示该跑分对性能范围的拉伸或压缩程度:

ln(scoreg,s) ≈ as + bs · θg

我们从数据中拟合每条直线 — 对于参考 GPU 参与的跑分以参考点为枢纽,否则使用普通最小二乘法 — 然后取逆,将任意实测分数映射回共同 θ 轴:

θ̂g,s = ( ln(scoreg,s) − as ) / bs

最后,我们在 θ 轴上用加权平均融合某张显卡的可用来源(权重 wₛ 为编辑信任度),从对数空间转换回来,并重新缩放至历史 3DMark 范围:

Indexg = 100 · exp( Σ ws·θ̂g,s / Σ ws )
perf_index = round( Indexg × 87.35 )

注:Time Spy 为与历史指数保持连续性,其刻度斜率固定为 1,因此这是一种务实校准,而非不偏向任何单一跑分的纯潜变量估计。每个来源的残差散度作为置信度信号被追踪,但不会改变融合权重。

性价比评分

性价比评分 = (性能指数 / 价格)

我们独特的性价比评分能识别市场的「甜蜜点」,代表你每花一元钱所获得的性能量。评分越高,性价比越好。