别只盯着那笔巨额训练账单——人工智能公司真正的烧钱之处,远不止一次性的模型运行。这也解释了为什么它们对模型蒸馏等知识产权威胁如此敏感。
AI模型开发的真实成本,远比外界想象的要高。研究机构Epoch AI拆解了构建一个新模型所需的全部开支,并由此揭示了为何AI公司如此紧张自家知识产权的安全。
早在去年,Epoch就曾给出过一个惊人的估算:在OpenAI高达50亿美元的研发支出中,仅有约10%用于最终的模型训练。其余绝大部分资金,都流向了规模扩展、合成数据生成以及基础研究。
当时,Epoch并不确定这是否只是OpenAI的特例。但如今,两家中国公司——MiniMax和Z.ai——也披露了各自的研发计算支出。结果发现,尽管公司体量不同,它们最终训练运行所占的研发支出比例同样很小。
Epoch进一步阐述了这一现象的深层含义:如果一家公司的大部分研发支出都花在了“探索”而非“执行”上,那么那些从中学习到有效方法的竞争对手,就可以用原始成本的一小部分来复制其结果。
这一直是美国AI公司长期以来的隐忧。谷歌曾多次表达对知识产权盗窃的担忧。Anthropic则将MiniMax视为一家试图提取Claude的能力来增强自身产品的公司。显然,任何有志于开发AI模型的企业,都必须承诺巨额的资金投入——而训练,真的只是其中很小的一块。