诚心邀请,请教数值分析或数据挖掘高手

Lixin19821010 2007-06-14 02:03:49
加精
大家好:最近老板布置一个任务,对我来说就是IM(impossible mission),:).如果大家有兴趣,我把任务描述一下:
A B C D E Ratio
0.075 8.641 1.906 6.649 82.729 180
0.097 9.090 2.026 6.852 81.936 192
0.086 8.736 1.927 6.618 82.633 184
0.034 14.550 1.243 4.978 79.195 283
0.047 14.635 1.244 4.586 79.487 282
0.034 14.701 1.249 5.034 78.982 286
0.038 14.761 1.215 4.767 79.220 287
6.775 62.070 7.766 8.677 14.712 7789
6.027 59.546 7.438 8.519 18.470 5298
6.477 61.458 7.688 8.810 15.567 6748
6.617 62.048 7.779 8.890 14.666 7509
16.017 45.219 4.805 11.903 22.056 3827
1.518 2.440 0.859 10.293 84.889 67
1.272 2.080 0.727 8.889 87.031 53
0.839 1.334 0.477 7.092 90.257 34
16.012 45.204 4.803 11.899 22.082 3827
0.021 1.415 0.925 7.992 89.646 45
0.115 10.969 1.883 10.736 76.297 207
0.106 13.379 2.642 10.770 73.104 308
2.864 79.304 0.835 1.061 15.936 6839
0.211 35.754 6.357 11.471 46.207 1209
0.233 9.904 1.599 4.120 84.145 187
0.219 9.293 1.496 3.586 85.407 171
0.218 9.553 1.495 3.467 85.266 179
0.229 10.138 1.633 4.200 83.801 191
0.160 97.679 0.362 0.109 1.689 71653
0.147 97.234 0.370 0.955 1.294 96858
0.352 73.037 6.579 7.027 13.004 10317
0.283 73.869 5.215 5.968 14.665 8051
0.029 0.036 0.010 0.715 99.210 1
0.017 0.000 0.005 2.129 97.849 1
0.026 0.052 0.012 0.526 99.384 2
2.664 46.045 10.286 20.890 20.115 5238
6.571 41.757 9.683 23.393 18.596 5240
7.302 47.444 8.011 16.450 20.793 5305
13.841 56.975 2.356 7.183 19.645 5357
2.794 55.096 8.782 13.137 20.191 5380
0.948 51.797 10.097 16.314 20.843 5393
10.565 55.640 4.475 9.214 20.106 5421
7.979 48.396 8.216 15.249 20.160 5443
21.450 43.907 9.097 9.497 16.049 5449
11.567 55.398 2.735 9.641 20.659 5536
0.821 51.784 10.144 16.403 20.848 5553
0.271 82.789 7.368 6.657 2.914 80925
0.746 83.802 6.796 5.186 3.470 83683
0.159 70.716 10.495 14.068 4.563 85783
2.052 49.864 17.241 22.859 7.984 87673
0.150 68.182 10.192 14.107 7.368 96611
0.567 0.150 0.054 0.296 98.933 6
0.170 5.421 0.825 7.301 86.283 114
0.006 0.271 0.297 4.216 95.211 11
0.080 9.402 2.000 9.642 78.876 210
6.556 23.721 3.420 7.778 58.525 681
0.000 0.860 0.230 0.840 98.070 13
0.058 4.981 0.515 2.049 92.396 86
0.062 0.482 0.176 1.754 97.526 15
0.021 1.027 0.958 5.588 92.405 35
7.131 11.721 2.401 7.189 71.558 309
0.130 18.661 4.803 10.766 65.639 457
0.034 0.974 0.164 4.206 94.623 20
0.075 59.639 5.061 10.112 25.113 3453
0.313 5.447 2.056 8.306 83.877 115
0.547 3.313 2.784 11.033 82.324 115
0.063 4.214 1.799 10.376 83.548 116
1.531 5.673 1.469 4.105 87.223 117
1.377 4.897 1.390 7.642 84.694 118
0.171 5.614 1.823 7.340 85.052 120
1.338 4.379 1.625 7.929 84.730 120
1.089 4.896 2.203 9.564 82.247 122
0.560 4.229 2.829 12.814 79.567 125
0.103 5.722 2.147 8.611 83.416 125
1.252 5.203 1.719 5.211 86.615 126
0.243 4.715 2.941 10.748 81.353 127
0.655 5.983 1.715 4.887 86.759 127
0.502 6.817 1.050 2.242 89.389 128
0.143 6.139 1.987 9.002 82.729 131
1.263 5.845 1.945 8.776 82.171 132
0.844 4.676 2.670 13.023 78.787 134
1.569 5.726 1.565 7.924 83.216 136
1.430 7.157 1.537 5.109 84.767 140
0.171 7.646 1.958 4.236 85.989 141
1.599 6.290 1.890 5.057 85.165 143
1.141 6.647 1.731 8.008 82.473 143
0.346 8.049 1.458 3.541 86.606 145
0.429 8.349 1.227 3.975 86.020 149
0.817 5.966 3.153 11.234 78.830 152
0.952 5.529 2.829 13.212 77.478 155
1.987 6.359 1.825 7.139 82.690 165
1.560 7.105 2.180 5.383 83.772 171
1.660 7.857 2.124 10.303 78.057 176
1.255 8.351 2.245 5.513 82.637 179
0.085 7.687 2.442 6.879 82.907 182
2.315 8.086 1.629 7.790 80.180 185
2.181 7.319 1.958 7.385 81.157 189
1.116 7.645 2.190 7.986 81.063 192
0.731 7.731 3.554 8.927 79.057 197
1.058 8.261 3.075 7.776 79.830 199
0.226 6.898 4.381 12.628 75.867 199
2.111 8.737 1.954 8.556 78.642 206
0.925 7.188 4.020 11.902 75.965 207
0.104 9.095 2.804 13.178 74.819 212
2.064 8.830 2.111 8.496 78.499 216
1.025 6.310 2.590 18.511 71.565 230
0.251 9.455 3.191 13.070 74.034 233
0.396 9.521 4.093 11.907 74.083 243
0.143 7.660 4.199 15.100 72.898 243
0.365 8.878 4.155 12.338 74.264 243
1.195 7.325 4.570 14.931 71.979 250
0.488 11.767 2.458 9.344 75.942 264
0.638 9.048 3.803 8.895 77.615 270
1.780 11.389 3.025 8.548 75.258 273
1.392 11.702 3.759 8.598 74.549 290
0.228 11.649 3.707 11.777 72.640 309
1.086 9.812 7.061 15.090 66.951 314
0.465 5.355 3.838 15.888 74.454 321
2.460 12.471 3.234 6.904 74.931 352
1.765 12.930 3.030 12.103 70.172 394
3.995 15.734 5.778 15.529 58.964 759
2.077 22.969 10.597 18.763 45.594 982
1.907 28.974 8.072 21.651 39.397 1516
3.975 35.371 3.703 17.836 39.114 1712
1.751 45.493 6.252 10.463 36.041 2237
1.073 37.895 12.885 18.857 29.290 2684
3.653 39.434 13.143 16.450 27.320 2819
0.661 44.035 10.548 15.067 29.689 2887
5.922 43.261 6.761 13.543 30.512 2900
7.121 44.918 7.716 15.595 24.649 3480
0.706 46.495 11.005 15.520 26.274 3621
4.286 39.261 10.858 22.881 22.714 4011
20.681 42.302 8.820 9.218 18.978 4194
0.733 48.670 11.464 16.061 23.072 4660
21.124 42.973 8.991 9.339 17.573 4733
4.175 44.607 14.675 16.445 20.098 4737
0.634 50.851 10.246 17.658 20.611 5817
0.605 52.022 10.187 17.112 20.075 6009
0.753 50.345 11.809 16.539 20.554 6073
7.532 49.052 8.261 16.680 18.475 6726
4.246 58.751 8.092 10.897 18.014 6776
2.086 47.344 14.562 19.361 16.647 7277
9.708 61.738 3.522 8.826 16.206 7421
2.057 62.258 7.602 14.323 13.760 9028
7.831 56.564 9.226 11.040 15.337 10402
10.596 57.297 7.627 11.650 12.830 11377
11.529 53.157 9.971 13.653 11.690 12061
13.019 63.686 3.018 8.001 12.276 12331
1.925 47.971 16.008 21.698 12.398 14964
0.690 60.208 6.396 20.546 12.161 18153
2.987 61.770 12.105 14.542 8.596 20237
5.534 71.938 7.090 7.132 8.307 22529
0.740 61.218 6.521 20.680 10.840 24038
3.572 64.785 9.325 13.176 9.142 28533
0.583 72.983 9.100 9.805 7.529 28868
3.762 57.142 11.219 19.540 8.336 29069
0.624 80.388 6.597 5.745 6.646 29484
2.320 53.131 16.135 20.130 8.284 30613
4.627 74.173 7.226 6.700 7.274 38765
3.433 53.118 14.650 18.916 9.882 38941
1.138 76.119 7.742 8.896 6.105 39845
3.616 64.908 9.762 13.880 7.833 40383
3.876 57.442 11.701 20.216 6.766 57401
0.000 62.903 20.505 12.355 4.237 60305
6.317 65.752 9.715 10.937 7.278 72520
3.792 44.950 9.023 14.502 27.733 2848
1.878 6.678 0.752 2.630 88.061 131
0.515 82.361 1.951 4.352 10.821 11837
0.160 9.846 2.151 7.895 79.948 211
0.351 64.531 3.515 7.943 23.659 3989
8.935 8.748 1.740 7.009 73.568 261
0.252 2.563 1.212 13.889 82.084 79
4.607 1.716 1.512 6.369 85.796 86
7.887 7.722 1.536 6.190 76.666 211
0.100 13.174 2.603 10.311 73.811 291

这是一张Excel表单,总共有几千行数据,我选取了一些具有代表性的行,粘贴出来,大家可以看到有A,B,C,D,E 5个字段,至于Ratio这个字段做什么用的,我问了老板,他的回答是:不知道。。。需求就是,假设有个字段P,如何根据每行的A[n],B[n],C[n],D[n],E[n]得到P[n],即是找出P = F(A,B,C,D,E),的这个F()然后得到P。坦白地说我真的是懵了。在我看来,更离谱的是,假如又有字段F,G等加入进来,这个F()要具有扩展性,即P = F(A,B,C,D,E,F,G), F依然适合。
我所知道的需求就这么多,问了一些,老板说他自己也不知道。
所以我想请教的是:1,这个是可以做的么;2,假如n-dimension的不可以做,那么现有的这个5-dimision,即P = F(A,B,C,D,E),这是可以做的么(我觉得这一部肯定是可以做的),如果能做,不知道是否能提供一些思路,相关书籍,给与指导; 3,如果不能做,那么我想知道为什么不能做。
十分感激各位的相助。小弟联系方式: mail,lixin19821010@163.com, MSN, lixin19821010@hotmail.com, QQ: 147370451
...全文
1309 78 打赏 收藏 转发到动态 举报
写回复
用AI写文章
78 条回复
切换为时间正序
请发表友善的回复…
发表回复
LOCAS1120 2011-12-28
  • 打赏
  • 举报
回复
有木有会数值分析的,小弟有道题目不会编程
na2650945 2009-01-20
  • 打赏
  • 举报
回复
学习了。
phonlee 2008-11-28
  • 打赏
  • 举报
回复

感觉是微分呀,
高等数学里面的思路能用上。
不过是一元的。

不过这个搞科研的太牛了。把这个任务都交代给他人了。

LeoDiao 2007-08-17
  • 打赏
  • 举报
回复
给你个思路:
1、你老板是不是想通过这些数据得到一条知识:
已知A B C D E,那么可以得到P, ok,那么这个问题就是数据挖掘的分类,具体就是决策树问题。前提是有训练数据(即历史数据),如果你要根据这些数据来求出P,而没有任何训练数据(即A B C D E P都已知,利用它进行训练)。
2、如果你的老板想让你把这些数据划分一下,那么可以采用聚类分析,将这些数据划分成几个集合,每一个集合中的数据具有某种相似性,可以给他一个值。
呵呵,我能说得只能这么多,希望有用。
  • 打赏
  • 举报
回复
:)
  • 打赏
  • 举报
回复
这些天把寝室(A, B屋)的B屋退了,结果住进来同学校的几个数学系的本科生,聊了起来,有点投机,结果问起我最近在外面实习在做什么,回答:被神经网络搞神经了!碰巧,他们有点思路,在他们的指导下训练神经网络,刚刚训练一个玩玩,误差大概是20%,但是可以进一步改进。非常感谢大家的关注。
------------------------------------------------------------------------------------
综上所述,我并不建议LZ自己去解决这个问题,有预算的话还是请这方面的学者帮忙吧
------------------------------------------------------------------------------------
绝对没有预算,一点实习工资,刚好把肚子弄饱 :)
libany 2007-07-17
  • 打赏
  • 举报
回复
这个是属于数值分析里边的内容了,确实是一个很有难度的问题!
跟你们想的一样,就是知道N组的数据,然后找出一个适合的f(x,y,z,k,n)使得给出的方程尽可能接近没组数据,关键还是要知道P在什么时候是合适的,就是说用对于P=f(x,y,z,k,n)正确或者近式正确的标准是什么,不然P=f(x,y,z,k,n)=x+y+z+k+n都是正确的了
ImN1 2007-07-16
  • 打赏
  • 举报
回复
这样说吧,这个事情数学模式不同,方法也不同,神经网络只是其中比较多人认识的一种模式
目前世界上没有最好,甚至没有“更好”的数学模式,
大多数这方面的工作者都在寻求,或者努力在发掘这“更好”的数学模式

至于具体怎么做,我只能说一个最简单的例子

x,y
2,12.56
1.5,9.42
9.9,62.172
……
求y=f(x)

反应比较快的人就会知道,y=2*3.14*x
但计算机是没有这种“知觉”的

f(x)=a*x^0 + b*x^1 + c*x^2 + d*x^3 …… + mx^n
计算机必须通过大量数据,反复迭代运算,最后得出a≈0,b≈6.28,c≈0,d=0...m≈0

这个数学模式的建立就是通过“建立圆求圆周率”
--------------------------------------


就目前所知,很多工作者都是以代数几何学入手设计数学模型的

例如,所有的数字通过转换制成坐标(转换方法可以参照“多因素分析 数字标准化”的相关文献),根据其中某个有“意义”的坐标进行“聚类”——其实就是找“点的密集范围”


至于怎样建立坐标,这就是数学模型建立的问题

最简单的如上面建立圆、矩形,三角形……还有三维的形状……
复杂的还要引入新坐标——通过特殊的数学方法建立一套辅助坐标

求出“聚类”后该类中心的坐标及范围,然后用刚求得的方法代入未知数,
求出它与哪一个“类别”的中心距离最近,就属于哪一类了
------------------------------------------------------
这里有几个要说明的
1.数学模型有无数种
2.目前的学界没有哪种模型能解决大多数问题
3.一种模型失败要换其他尝试(换7、8种模型都没能求解是常有的事)
4.除了算法还有机器的能力(386时代试过用basic跑20天没结果,但不是死机啊,嘿嘿)
---------------------------------------------------------




综上所述,我并不建议LZ自己去解决这个问题,有预算的话还是请这方面的学者帮忙吧


keyword:聚类分析


fire_woods 2007-07-02
  • 打赏
  • 举报
回复
楼主貌似狠迷糊嘛,建议多看看关于数据挖掘的书.

如果是临时抱佛脚的话,可以试试看神经网络是否适用.

你的sample集用BP神经网络应该就可以解决的.
楼主可以google,有c++/c的源代码的,c#的有没有就不知道啦,我没搞过c#.
然后稍微了解一些BP神经网络的原理就ok啦.
先训练一个出来再说.

另外,如果训练集数据只有几千个的话,推荐使用2个中间层,中间层节点64-128个都行,多了会过学习,要想得到好的结果,增加训练集会是个好的方案.
  • 打赏
  • 举报
回复
kaintgteyl(命运之轮) ( ) 信誉:100 Blog 加为好友 2007-6-28 21:23:55 得分: 0

恩..交作业的话,神经网络的google代码有好多..
http://leenissen.dk/fann/ 刚看到的
---------------------------------------------------------------------------------
你说的这个东西能拟合结果,但是能拟合函数么?




  • 打赏
  • 举报
回复
我是交任务,在公司里做事情比在学校里相对来说压力还要大一些。呵呵。挺麻烦的:)
biosheep 2007-07-02
  • 打赏
  • 举报
回复
建议:直接BP网络一下,看看成不成?
要是试过BP,预测值不好的话,那我估计其他方法也够呛!!

要是楼主有什么要求,请在社区内发消息给我!
fire_woods 2007-07-02
  • 打赏
  • 举报
回复
有代码就直接用呗.
  • 打赏
  • 举报
回复
坦白地说,书,程序,看的都只是大概意思明白,只是面对自己这个项目的时候,就还是差很多。C#也有代码,google一下就可以找到
  • 打赏
  • 举报
回复
不是貌似,就是很迷糊。看了几本书,大概的意思都明白,但是好像没有看得比较深。现在就不知道如何具体动手做。。。
kaintgteyl 2007-06-28
  • 打赏
  • 举报
回复
画图模拟出来大致图形后,用误差(概率里的平方差?)跟拟合的函数可以计算吧.图形有规律的话,应该比神经网络好解得多吧

偶对你的那道题比较好奇,还特地看了神经网络的书.推荐你点
<人工智能:一种现代方法>第2版,20.5节,可以不看前面单独看
<人工神经网络原理及应用>

偶还没完全看完,概括来说就是,神经网络就是模拟一堆神经原,其中有输入神经原,(隐含层)输出神经原,如果没隐含层,只能模拟线形的,有则能模拟非线形的(阀值函数不能是线形的)
每个神经原的特点是,他有一堆来自其他神经原的输入,每个输入乘以一个权重,所有的在相加看大于一个阀值不,大于则输出
基本输入输出都可以定为0,1或-1,1
几层传出到输出层后,看输出层输出跟想要的输出之间的差,算方差
用方差,当前接点各输入的导数? 还有个系数(跟你想要的训练速度有关,是自己定的吧)来决定前面某神经原到他的权的变化.这个是训练.具体的建议看第一本推荐你的书..偶还没实践呢,不是完全明白还..

kaintgteyl 2007-06-28
  • 打赏
  • 举报
回复
恩..交作业的话,神经网络的google代码有好多..
http://leenissen.dk/fann/ 刚看到的
bigc2000 2007-06-28
  • 打赏
  • 举报
回复
shan_ghost() ( ) 信誉:100 Blog 加为好友 2007-6-20 14:40:41 得分: 0

-----------------------------------
你说的很有道理,一般来说必须预先知道一定的关联 ,比如球星的上场时间与球队的成绩。

但是有时候,确实不知道,所以这是可能能够做得(我的水平很菜,只知道)就是采用aprior来发现平凡模式。

楼主,我觉得,不一定需要用神经网络搞的这么复杂,线性回归,主成分析这些统计方法也许就可以了
bigc2000 2007-06-28
  • 打赏
  • 举报
回复
唉,同是天涯沦落人!

我也是要求从一大堆各种各样的数据中学习一种模式(规则),也是不知道怎么搞!而且是AI的大作业,50分,不过就挂了


不过,楼上的大虾们方法说得很多,可是估计没有一个人去做过。
不过,我倒觉得,先可以看看是否满足线性?用spss,or sas等等做一下线性回归,检验一下就知道了。如果不是,那就没有什么好办法了,但是可以先把R进行分类,比如,5等份,然后用大虾们的方法
  • 打赏
  • 举报
回复
十分感谢。我现在正在看shan_ghost(),kaintgteyl(命运之轮) 推荐的书籍,或者搜集推荐的有关资料。至于神经网络的一系列,比如概念,建立模型,代码这些概念还是比较薄弱。十分感谢大家的关注。我会继续努力,深入学习的。谢谢
加载更多回复(58)

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧