用numpy和sklearn分析波士顿房价数据集出现了大问题,我是菜鸟,来个大神

weixin_31487823 2024-03-11 13:45:38
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.linear_model import LinearRegression
#houseprice= pd.read_csv('boston_housing.csv')
# 指定要读取的CSV文件路径
csv_file = 'boston_housing.csv'
 
# 使用np.genfromtxt函数读取CSV文件并将其转换为NumPy数组
housedata = np.genfromtxt(csv_file, delimiter=',')

X = housedata
y = housedata[:,13]
feature_names = np.array(['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV'])
feature_names
#y.shape

index = np.arange(506)
np.random.shuffle(index)
index
train_index = index [:405]
#train_index.shape
test_index = index [405:]
#test_index.shape
X_train = X[train_index]
y_train = y[train_index]
X_train.shape

X_test = X[test_index]
y_test = y[test_index]

display(X_test.shape,y_test.shape)
#np.set_printoptions(suppress = True)
model = LinearRegression(fit_intercept= True)
model.fit(X_train,y_train)
display(model.coef_,model.intercept_)
y_train
index
#X_train[100]

#θ = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y).round(4)
#print('二元斜率截距分别是',w,b)
#print('二通过正规方程球的结果',θ.reshape(-1))
#display(houseprice)

 

 

运行后

array([-0., -0., -0.,  0.,  0.,  0., -0., -0., -0., -0., -0., -0., -0.,
        1.])
1.4921397450962104e-13

 

14个回归系数和截距都为0,咋回事,来个大神救我。

...全文
582 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
代码下载地址: https://pan.quark.cn/s/a4b39357ea24 在计算机视觉技术中,数据集扮演着训练和评估模型的核心角色。Labelme作为一个广受欢迎的开源工具,能够支持用户以交互方式对图像进行标注,而COCO(Common Objects in Context)则是一种被广泛采纳的数据集标准格式,适用于包括物体检测、图像分割在内的多种任务。本文将详细阐述如何将Labelme生成的标注数据转换为COCO数据集的标准格式。 Labelme标注的图像在输出为JSON格式时,会包含以下核心内容: 1. `version`: 指明JSON文件的版本信息。 2. `flags`: 目前未定义或保持为空,预留用于未来的功能扩展。 3. `shapes`: 列表形式存储对象的形状信息,每个形状项包含`label`(对象类别名称),`points`(构成对象边缘的多边形顶点),以及`shape_type`(通常为“polygon”)。 4. `imagePath`和`imageData`: 提供原始图像的存储路径和二进制数据,便于后续图像的还原。 5. `imageHeight`和`imageWidth`: 明确标注图像的垂直和水平尺寸。 COCO数据集的标准格式中定义了三种主要的标注类型: 1. Object instances(目标实例):主要用于执行物体检测任务。 2. Object keypoints(目标上的关键点):适用于人体姿态估计相关应用。 3. Image captions(看图说话):用于生成图像的文本描述。 COCO的JSON结构中包含以下基本组成部分: 1. `images`:记录图像的基本属性,包括`height`(高度)、`...
内容概要:本文围绕基于Basisformer模型的时间序列锂离子电池SOC(State of Charge,荷电状态)预测展开研究,利用PyTorch深度学习框架构建并训练模型,旨在提升锂电池SOC估计的准确性与鲁棒性。该方法融合Transformer架构的核心机制,通过引入基函数(Basis)分解策略,有效捕捉电池充放电过程中长时序、非线性动态特征,增强模型对复杂工况的适应能力。研究不仅详细阐述了Basisformer的网络结构设计、注意力机制优化与训练流程,还提供了完整的Python代码实现方案,涵盖数据预处理、模型搭建、损失函数定义、训练验证及结果可视化等环节,便于科研人员快速复现、调优并拓展至其他电池状态预测任务。; 适合人群:具备一定深度学习与Python编程基础,熟悉PyTorch框架,从事电池管理系统(BMS)、新能源汽车、储能系统、智能传感等领域的高校研究生、科研人员及工程技术人员。; 使用场景及目标:①应用于动力电池与储能系统的实时SOC估算模块,提升系统安全性与能量利用效率;②作为学术研究的基础模型,用于复现、改进基于Transformer的时间序列预测方法在电化学系统中的应用;③为数据驱动的电池健康状态(SOH)、剩余使用寿命(RUL)联合估计提供可扩展的技术框架。; 阅读建议:建议读者结合所提供的代码与公开电池数据集(如NASA、CALCE等)进行动手实践,深入理解模型的输入输出结构与时序建模逻辑,同时可尝试引入温度、老化周期等多维特征,或融合物理模型构建混合预测架构,以进一步提升预测精度与泛化能力。

4,697

社区成员

发帖
与我相关
我的任务
社区描述
欢迎来到Python俱乐部,本社区以学习Python语言为主,主要围绕Python语言发布相关文章,希望大家加入共同贡献Python文章,共筑美好社区。
pythonpycharm人工智能 技术论坛(原bbs) 河南省·郑州市
社区管理员
  • 韩俊强
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

人生苦短,我要学Python!

 

试试用AI创作助手写篇文章吧