项目中遇到的一个问题,关于数据处理的
问题描述如下:(项目中遇到的,原问题专业性较强,我抽象出下面的模型)
我有一批数据X-y,假如新给一个X‘,希望得到y。
这个问题本身不是很难,我现在的领域中,做法如下:对于新给的X',拿它去跟数据库的X对比,看哪个X跟X'最接近,那么这个X对应的y就是X'的y。
上面这种做法肯定是比较粗糙的,但是,我并不想改这个过程,因为没什么意思。
我的问题是,给的数据库X-y中,由于测量误差的关系,得到的X实际上是不准确的,实际上是有一个噪声的,所谓的X-y,实际上应该是X+b-y(这里的b应该是一个噪声)。那么对于新给的X',怎么得到准确的y值?
大家有什么好的想法吗?
我现在的想法是:虽然得到的测量值X是不精确的,但是,实际上我可以花费一些代价,去得到少量的精确的X-y,然后用这个真实值去指导测量值。这个是初步的想法,有没有什么好的算法可以用呀?