要做数学建模,现在利用实验测量出了某两个量的数据,用A和B代替。实测共200组左右。最终是想通过拟合找出A和B的关系。
现在的问题是,200组数据量太大,里面又含有很多的异常点。所以拟合的曲线很不准(尝试了多种曲线类型)。散点图和某一多项式拟合曲线见图。
想请教: 1.如何预处理这些数据,去除那些重复的,异常的数据点?
2.曲线拟合时,数据量是否越大越好?200组数据是否太多?该如何选取合适的数据呢?多少组适合呢?(我看其他人做的建模用的数据都是二三十组左右)
3.如果我从200组数据中挑30组出来,是否会影响准确率?(我的两个变量,A的变化范围广,50~1000;B的变化范围窄,1~5)
针对我的这个问题,有没有好的方法可以处理下数据,得到比较好的拟合呢?谢谢!