如何解决ValueError: Found input variables with inconsistent numbers of samples

weixin_39893981 2017-10-01 02:10:20

# -*- coding: UTF-8 -*-
import csv
from sklearn.model_selection import train_test_split

# Read in the csv file and put features into list of dict and list of class label
DataSet = open(r'/home/ly/Desktop/CHY/SCIENCE_DATA/Data_Set_01labelDel0Col.csv', 'rb')
reader = csv.reader(DataSet) # 这个函数可以按行读取内容
headers = reader.next() # 文件的第一行,注释掉会在featureList中把表头也打印出来
# print(headers)

# 创建空列表
featureList = []
labelList = []

for row in reader:
labelList.append(row[len(row) - 1]) # 给labelList增加一列标签值元素,将最后一列元素添加到labelList
rowDict = {}
for i in range(0, len(row) - 1): # 小循环在大循环里面,所以先循环完小循环,在继续下一个大循环
rowDict[i] = row[i] # row[i]表示某一行(row)的第i个数
featureList.append(rowDict)

FeatureList = []
for s in featureList:
ChangeStrToFloat1 = {}
for t in s:
ChangeStrToFloat1[t] = float(s[t])
FeatureList.append(ChangeStrToFloat1)
print FeatureList # <type'list'>

dummyY = [{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:0},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1},{0:1}]

X_train, X_test, y_train, y_test = train_test_split(FeatureList, dummyY, test_size=0.25, random_state=None)

错误提示:
X_train, X_test, y_train, y_test = train_test_split(FeatureList, dummyY, test_size=0.25, random_state=None)
ValueError: Found input variables with inconsistent numbers of samples: [3384, 47]

我想应该是FeatureList的问题吧,这个列表里有47个字典,每个字典里有72个元素,47*72=3384.
然而我还是不知道怎么修正.......

...全文

10222 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

Tiny-D 2020-03-02

打赏
举报

回复

FeatureList，dummyY，维数不一致

成功解决ValueError: Found input variables with inconsistent numbers of samples: [86, 891] 目录解决问题解决思路解决方法解决问题 ValueError: Found input variables with inconsistent numbers of samples...

问题描述：主要是运行中提示 ValueError: Found input variables with inconsistent numbers of samples 百度可知：参考成功解决ValueError: Found input variables with inconsistent numbers of samples: [86, 891]_一个处女座的程序猿-CSDN博客成功解决ValueError: Found input variables with inconsistent num.

在上面的例子中，我们首先检查了特征变量X和目标变量y的样本数量是否一致。这样，我们可以及早地发现样本数量不一致的问题并进行相应的处理。具体的解决方法可能因问题的具体情况而异。遇到 "ValueError: Found input variables with inconsistent numbers of samples: []" 错误通常是因为你在进行机器学习或数据处理时，输入的特征变量和目标变量的样本数量不一致。这意味着你的特征和目标变量的样本数量不匹配，导致无法执行相应的操作。

成功解决ValueError: Found input variables with inconsistent numbers of samples: [624, 1] sklearn常见错误01 最近用sklearn进行了线性分类问题，情况是用多维的一个特征x来预测一个y值。但是用sklearn中的linear_model进行fit的时候出现了如题错误：ValueError: Found ar...

这通常发生在机器学习模型中，当你尝试将具有不同样本数量的数据作为输入时。要解决这个问题，你可以采取以下几种方法之一：检查数据维度：首先要确保输入的数据的维度是一致的。可以使用shape属性来检查每个输入变量的样本数量是否相同。如果不同，需要对数据进行处理，使其具有相同的样本数量。数据对齐：如果你有多个输入变量，需要确保它们的样本按照相同的顺序排列。你可以使用pandas库中的concat函数或numpy库中的vstack函数将它们对齐。数据清洗：在某些情况下，数据可能包含缺失值或异常值，这可

其他开发语言

3,423

社区成员

15,635

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章