摘要
特高含水期是油田重要的开采阶段,我国东部大部分油田已经进入特高含水期,研究处于该阶段的油田产量预测问题具有重要意义。由于处于特高含水期阶段的油田一般采集到的开发指标和影响因素的样本数较小,所以基于统计学理论的常规预测方法都不太适合该阶段的产量预测。文中从数据挖掘和机器学习角度提出了油田产量预测的新方法——基于主成分分析和支持向量机(SVM)方法的油田产量预测模型。先把由影响产量的众多因素构成的高维向量通过主成分分析技术进行数据降维后作为SVM的输入,通过SVM训练得到模型,并利用遗传算法(GA)优选模型的参数建立特高含水期油田产量预测模型。与其他方法相比,该方法减少了模型输入变量的维数,提高了模型收敛的速度和预测精度,能较好地反映特高含水期油田产量的动态变化规律。