有关等高线(数据挖掘)
本人需要做一个有关数据预处理的模块(即等高线图)
等高线图主要牵涉到两个普通变量和一个目标变量。
因为一般的等高线图,等高线是封闭的,且等高线之间互不相交。
如下所示的文本文件,其中
no----代表记录号
c----代表分类号
t----代表目标变量
a1,a2,a3,a4----代表普通变量
譬如我选取a1,a2两个作为等高线图的两维坐标,把目标变量分为若干类(该文本文件是分为两类,当然我们也可以把它分为好几类)
但问题的关键是如何做等高线图呢?
1、是设想该等高线是封闭的,则在选取每一个横坐标(a1)的同时,取得对应该值的最大和最小值,然后用折线把他们连起来,但是感觉这样做的话,觉得等高线之间肯定是要相交的,但是我觉得这样做的话,比较简单,不用怎么费脑子。
2、(别人的建议),是用回归的方法来取得等高线,不知道有哪位哥们试过,请指教,因为我没有作过有关曲线的拟合。
no c t a1 a2 a3 a4
1 1 93 0.1 1.0 0.3 2.05
2 1 96 0.2 1.0 0.4 2.00
3 1 97 0.1 1.0 0.2 2.04
4 1 97 0.1 0.97 0.1 2.03
5 2 80 0.1 0.96 0.1 2.02
6 2 80 0.1 0.80 0.2 2.00
7 2 75 0.2 0.75 0.2 2.00
8 2 70 0.1 0.70 0.2 2.05
9 2 65 0.2 0.65 0.2 1.95
10 2 60 0.1 0.60 0.2 1.95
11 2 75 0.1 1.20 0.3 2.20
12 2 70 0.2 1.30 0.4 2.30
13 2 70 0.1 1.40 0.4 2.30
14 2 65 0.2 1.20 0.3 2.30
15 2 60 0.1 1.20 0.3 2.40
16 2 75 0.3 1.20 0.4 1.80
17 2 70 0.4 1.30 0.3 2.70
18 2 70 0.3 1.40 0.4 2.70
19 2 65 0.4 1.30 0.3 2.60
20 2 60 0.3 1.40 0.3 2.64
21 1 95 1.0 0.70 0.4 2.40
22 1 94 1.0 0.70 0.3 2.35
23 1 93 1.0 0.70 0.2 2.45
24 1 95 1.0 0.70 0.1 2.50
25 1 96 1.0 0.70 0.2 2.31
26 2 75 1.0 1.00 0.4 2.00
27 2 70 1.0 1.00 0.3 2.00