项目中遇到的一个问题,关于数据处理的

yingzijuntuan 2016-06-16 07:59:33
问题描述如下:(项目中遇到的,原问题专业性较强,我抽象出下面的模型)

我有一批数据X-y,假如新给一个X‘,希望得到y。

这个问题本身不是很难,我现在的领域中,做法如下:对于新给的X',拿它去跟数据库的X对比,看哪个X跟X'最接近,那么这个X对应的y就是X'的y。

上面这种做法肯定是比较粗糙的,但是,我并不想改这个过程,因为没什么意思。

我的问题是,给的数据库X-y中,由于测量误差的关系,得到的X实际上是不准确的,实际上是有一个噪声的,所谓的X-y,实际上应该是X+b-y(这里的b应该是一个噪声)。那么对于新给的X',怎么得到准确的y值?

大家有什么好的想法吗?

我现在的想法是:虽然得到的测量值X是不精确的,但是,实际上我可以花费一些代价,去得到少量的精确的X-y,然后用这个真实值去指导测量值。这个是初步的想法,有没有什么好的算法可以用呀?
...全文
228 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
阿麦 2016-07-08
  • 打赏
  • 举报
回复
误差不好解决,花再多的精力,它还是存在的。 能否用一些方法,对X-Y先理一理呢,而不是把测量结果直接使用。 比如,在精算上,生命表的计算,就需要根据测量(大数人群的统计值)结果一些调整后才能得到比较靠谱的生命表数值。
tanta 2016-07-07
  • 打赏
  • 举报
回复
实际上就是一个数据的匹配是吧?
ahu9870 2016-06-23
  • 打赏
  • 举报
回复
引用 2 楼 yingzijuntuan 的回复:
你的意思是说,利用真实值X,和测量值X,做一个误差,然后把这个误差延伸到其他测量值,希望以此来得到准确的X?
从测量的角度来讲,实际是没有所谓“准确的值”,插值的目的是让误差更小。当然如果你的数据真的有准确的值,那你应当设法去找到那个“准确的值”。
ahu9870 2016-06-18
  • 打赏
  • 举报
回复
如果数据X的大小有确定的规律,那么可以采用一个插值函数来得到更接近的X值。
yingzijuntuan 2016-06-18
  • 打赏
  • 举报
回复
引用 1 楼 ahu9870 的回复:
如果数据X的大小有确定的规律,那么可以采用一个插值函数来得到更接近的X值。
你的意思是说,利用真实值X,和测量值X,做一个误差,然后把这个误差延伸到其他测量值,希望以此来得到准确的X?

33,009

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧