核心目标:《算力边际》不是单纯买卡堆钱的游戏,而是围绕“资金流、授权、硬件、供电、散热、专线、任务效率”建立完整经营闭环。真正的目标是用更合理的结构,把有限预算变成更稳定、更高效的算力帝国。
集群架构:游戏的资源结构是服务器 → 机柜 → 集群。服务器负责跑任务、吃电和发热;机柜负责承载服务器与散热压力;集群负责地区、电价、网络拓扑和总电网容量。随着规模扩大,单纯买 GPU 已经不够,基础设施会反过来决定上限。
硬件系统:GPU 提供显存与算力,但 CPU、内存、网卡和存储链路会决定这些 GPU 是否真正跑得起来。高端 GPU 放在错误的服务器里,或者被低网卡、低内存拖住,最终效率会比看面板数字低得多。
模型授权:没有授权就不能合法承接对应模型任务。模型等级越高,通常意味着更高显存需求、更高并行开销和更强的系统链路要求,所以授权购买顺序必须和硬件扩容同步考虑。
任务机制:普通任务、科研任务、长期任务并不是只换了名字。普通任务更适合现金流,科研任务更吃效率和算力,长期任务更考验稳定性和持续。不同任务类型,适合的 GPU 组合、服务器分布和经营策略都不一样。
网络专线:当业务规模变大后,网络与延迟会逐渐变成第二类硬瓶颈。专线不是装饰,它会直接影响跨节点协同、任务稳定性和高并行链路质量,所以只有当规模和业务形态真的需要时,投入才划算。
存档分享:分享功能提供的是只读快照,仅用于展示某一时刻的存档状态。分享快照不会继续经营、不会参与正式排行榜,也不能替代正常云存档。
核心公式与公开机制
等级经验:升级需求采用二次曲线。
XPNeeded = Level × Level × 1000
模型并行显存开销:多卡部署不是简单把显存加起来,显卡越多,通信开销越高。
ModelVramNeed = BaseVram × (1 + (GPU数 - 1) × 0.05)
并发缓存占用:并发越高,KV Cache 占用越高,显存不足时会严重掉效率。
CachePerRequest ≈ (参数量 / 10) × 0.03 GB
任务效率核心:实际效率不是只看 GPU 算力,而是取决于整条链路。
综合效率 ≈ PCIe × NVLink × CPU × 内存 × 网络 × 存储 × 散热 × 健康度 × 电网系数
排行榜估值:当前排行榜会综合资金、声望、等级和运营效率。
Score ≈ √Funds ÷ 10 + Reputation × 1.2 + Level² × 1.8
电网过载惩罚:集群总耗电超过电网上限时,超额电费按 5 倍计,且整体算力会被压制。
超额部分电费 × 5,集群效率最低压到 60%
散热过载惩罚:机柜热负荷过高时,不仅效率下降,显卡健康度损耗也会显著加快。
过热时散热效率下压,显卡额外折损明显增加
合同与声望:不接合同不会掉声望,但毁约会受到更重处罚。
毁约声望惩罚 = 正常完成可得声望 × 2.3(向上取整)