请教:一个关于数据均匀性(波动性,稳定性)的算法

rmk258 2009-12-15 04:17:32
数据1:1460 1460 1460 395 1460 1460 1460 1460

数据2:167 468 345 789 365 1024 1448 1460 801

比如上术的一组数据,寻找一种算法,这个算法能检测出数据1具有均匀性(更稳定,波动不大),近乎完美,能检测检测出数据2不具有
均匀性。

请问各位大侠 有没有什么好的算法或者是想法,给小弟分享一下...
...全文
6586 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
周睿 2009-12-17
  • 打赏
  • 举报
回复
[Quote=引用 13 楼 lc2228 的回复:]
用彩票中求“散度”的公式就可以了
[/Quote]
qiangren
lc2228 2009-12-16
  • 打赏
  • 举报
回复
中奖号码的散度分析

散度的概念叙述和理解起来都有一定的难度。举例来说,有这样两组号码:3、7、12、18、23、28、31和10、11、14、15、17、23、24,很显然,这两组号码的集中程度差别很大,前者非常分散,而后者的号码相当集中,出现了多个号码集中的区间。

我们可以引入一个新的指标来度量基本号码的集中程度,那就是基本号码的散度。所谓散度,指的是01~32这32个号码(以北京风采为例),如果是北京体彩,那么就是01~36共36个号码与7个基本号码之差(以结果的绝对值为准)的最小值中的最大的一个。这样说理解起来可能有点费劲,我们不妨来看一个例子。


例16 以北京风采32选7为例
一组中奖号码:3,7,12,18,23,28,31,我们可以看出,01与这7个号码的差分别为2、6、11、17、22、27、30,最小的差为2;同理,02与这7个基本号码的差中最小为1;03为0;……,32与这7个基本号的差的绝对值最小为1。具体计算过程见下表(表3-40)。可以看出,这32个最小的差中一定会有一个最大的值,在本例中该值为3。所以这组号码的散度为3。具体计算过程如下表。


散度计算表
基本号码 基本号减中奖号码 绝对值 最小值
01 -2,-6,-11,-17,-22,-27,-30 2,6,11,17,22,27,30 2
02 -1,-5,-10,-16,-21,-26,-29 1,5,10,16,21,26,29 1
03 0,-4,-9,-15,-20,-25,-28 0,4,9,15,20,25,28 0
04 1,-3,-18,-14,-19,-24,-27 1,3,8,14,19,24,27 1
05 2,-2,-7,-13,-18,-23,-26 2,2,7,13,18,23,26 2
06 3,-1,-16,-12,-17,-22,-25 3,1,16,12,17,22,25 1
07 以下类推 以下类推 0
08 以下类推 以下类推 1
09 2
10 2
11 1
12 0
13 1
14 2
15 3
16 2
17 1
18 0
19 1
20 2
21 2
22 1
23 0
24 1
25 2
26 2
27 1
28 0
29 1
30 1
31 0
32 1

再以10,11,14,15,17,23,24为例:01与这7个号码的差分别为9、10、13、14、16、22、23,最小的差为9;同理02与这7个基本号码的差的最小值为8;03为7;……依此类推,32与这7个基本号的差的绝对值最小为8。这32个号码最小的差中的最大值为9,所以这组号码的散度为9。
注意,散度的值越大,说明号码的集中程度越高;散度的值越小,说明号码越分散。理论上,散度有最大值和最小值。以北京风采32选7型为例,最小的散度为3,最大的散度为25,但这只是理论上存在,只有两号码才具这个散度:01、02、03、04、05、06、07与26、27、28、29、30、31、32。实际上,散度为5或6的号码是最常同见的,散度大于10的号码很少见。
各种彩票的散度走势是很有规律的
lc2228 2009-12-16
  • 打赏
  • 举报
回复
用彩票中求“散度”的公式就可以了
skooby 2009-12-15
  • 打赏
  • 举报
回复
求出方差,建议你参考一下《概率论与数理统计》
donkey301 2009-12-15
  • 打赏
  • 举报
回复
转换到频域分析波动情况
令数据1:1460 1460 1460 395 1460 1460 1460 1460 对应时刻t=1,2,3,4,5,6,...
做FFT变换,得到频谱,如果频谱越靠近0,那么表示波动性越小
rmk258 2009-12-15
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 feathersky 的回复:]
均值,方差, 高阶矩
[/Quote]
能说明白一点吗 谢谢了
rmk258 2009-12-15
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 new_006 的回复:]
瞎说的

我的意思是依次取差分的绝对值,累加到最后,再比较两组数的差分绝对值之和的大小(如果两组数的取值范围不一样可以乘一个比例因子)。

我觉得这样适合这种数据流的处理。
[/Quote]
嗯 实际应用中就是给一个数据流而已,不是真正的有俩组数据
alphaxiang 2009-12-15
  • 打赏
  • 举报
回复
瞎说的

我的意思是依次取差分的绝对值,累加到最后,再比较两组数的差分绝对值之和的大小(如果两组数的取值范围不一样可以乘一个比例因子)。

我觉得这样适合这种数据流的处理。
feathersky 2009-12-15
  • 打赏
  • 举报
回复
均值,方差, 高阶矩
rmk258 2009-12-15
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 new_006 的回复:]
取差分
[/Quote]
差分,楼上的什么意思。。。?
alphaxiang 2009-12-15
  • 打赏
  • 举报
回复
取差分
rmk258 2009-12-15
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 asxinyu_usst 的回复:]
根据平均值来比较算了啊。。。
先求平均值,然后把所有的元素与其想减,就是差值,把这些差值相加,那个小,就那个稳定。。。

这是比较直观的,当然还要看你的实际问题中,稳定性是怎么度量的。。。。
[/Quote]
嗯,这个均值我想过了,貌似不行,实际问题中,就是给一个数据流(没有一个标准数据流与之对比),加入就是:
1460 1460 1460 395 1460 1460 1460 1460
,那么就判断这串数据均匀不,如果判断是均匀的,就pass掉,否则就进行后续处理。
rmk258 2009-12-15
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 litaoye 的回复:]
没有阀值么?怎么算均匀,怎么算不均匀?还是相比较而言?
[/Quote]
没有阈值,就是看数据是不是处在同一个级别上,相对而言。
数据之巅 2009-12-15
  • 打赏
  • 举报
回复
根据平均值来比较算了啊。。。
先求平均值,然后把所有的元素与其想减,就是差值,把这些差值相加,那个小,就那个稳定。。。

这是比较直观的,当然还要看你的实际问题中,稳定性是怎么度量的。。。。
绿色夹克衫 2009-12-15
  • 打赏
  • 举报
回复
没有阀值么?怎么算均匀,怎么算不均匀?还是相比较而言?

33,007

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧