向大佬请教一个在Mindspore中遇到的问题，ValueError: For 'MatMul', the input dimensions must be equal, but got 'x1_co

mimimiquan 2022-12-14 09:08:04

import os
# os.environ['DEVICE_ID'] = '6'
import numpy as np
import mindspore as ms
from mindspore import nn
from mindspore import context
from mindspore import dataset
from mindspore.train.callback import LossMonitor
from mindspore.common.api import ms_function
from mindspore.ops import operations as P
from PIL import Image
#当前实验选择算力为Ascend，如果在本地体验，参数device_target设置为"CPU”

context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")

#要筛选的分辨率条件
targetWidth=426
targetHeight=640
targetChannal=3

#读取animal文件夹下所有文件的名字
rootDir='animal'
fileNameList=['cat','elephant','sheep']
label_map = {
    'cat': 0,
    'elephant': 1,
    'sheep': 2
}

X,Y=[],[]

for fileName in fileNameList:
    fileDir=rootDir+'/'+fileName
    #print(fileDir)
    imgNameList=os.listdir(fileDir)
    #print(imgNameList)
    for imgName in imgNameList:
        imgDir=fileDir+'/'+imgName
        img=Image.open(imgDir)
        img=np.array(img)
        if(len(img.shape)==3):
            width,height,channal=img.shape
            if width==targetWidth and height==targetHeight and channal==targetChannal:#符合筛选条件的样本留下放到X，其标签放到Y
                X.append(img.flatten())
                Y.append(label_map[fileName])#类别
#print(X,Y)

#划分训练集和测试集合
sampleNum=len(X)
train_idx = np.random.choice(sampleNum, int(sampleNum*0.8), replace=False)#取80%的样本作为训练集
test_idx = np.array(list(set(range(sampleNum)) - set(train_idx)))#剩下的样本作为测试集
X_train=[X[i].astype(np.float32) for i in range(len(X)) if i in train_idx]
Y_train=[Y[i] for i in range(len(Y)) if i in train_idx]
X_test=[X[i].astype(np.float32) for i in range(len(X)) if i in test_idx]
Y_test=[Y[i] for i in range(len(Y)) if i in test_idx]

XY_train = list(zip(X_train, Y_train))
ds_train = dataset.GeneratorDataset(XY_train, ['x', 'y'])
# ds_train.set_dataset_size(sampleNum)
ds_train = ds_train.shuffle(buffer_size=sampleNum).batch(32, drop_remainder=True)

XY_test = list(zip(X_test, Y_test))
ds_test = dataset.GeneratorDataset(XY_test, ['x', 'y'])
ds_test = ds_test.batch(30)#具体作用

#print(XY_test)
for e in X_train:
    print(e.shape)

net = nn.Dense(targetWidth*targetHeight, 3)
loss = nn.loss.SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean')
opt = nn.optim.Momentum(net.trainable_params(), learning_rate=0.05, momentum=0.9)

model = ms.train.Model(net, loss, opt, metrics={'acc', 'loss'})
model.train(25, ds_train, callbacks=[LossMonitor(per_print_times=ds_train.get_dataset_size())], dataset_sink_mode=False)
metrics = model.eval(ds_test)
print(metrics)复制

本小白正学习如何使用Mindspore，打算用逻辑回归对图片进行分类。

输入到回归模型的每个样本数据都是426*640的图片经过flatten后产生的数组，该数组的shape为(817920,)，X_train就是若干这样的数组组成的。

构建完模型之后，开始训练时产生了如下的错误：

[ERROR] ANALYZER(8534,ffffb5cca780,python):2022-11-30-10:59:18.593.719 [mindspore/ccsrc/pipeline/jit/static_analysis/async_eval_result.cc:66] HandleException] Exception happened, check the information as below.

The function call stack (See file '/home/ma-user/work/rank_0/om/analyze_fail.dat' for more details):
# 0 In file /home/ma-user/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/wrap/cell_wrapper.py(373)
        loss = self.network(*inputs)
               ^
# 1 In file /home/ma-user/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/wrap/cell_wrapper.py(111)
        out = self._backbone(data)
              ^
# 2 In file /home/ma-user/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/layer/basic.py(323)
        if len(x_shape) != 2:
# 3 In file /home/ma-user/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/layer/basic.py(326)
        if self.has_bias:
# 4 In file /home/ma-user/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/layer/basic.py(325)
        x = self.matmul(x, self.weight)
            ^

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
/tmp/ipykernel_8534/2891349598.py in 
      1 model = ms.train.Model(net, loss, opt, metrics={'acc', 'loss'})
----> 2 model.train(25, ds_train, callbacks=[LossMonitor(per_print_times=ds_train.get_dataset_size())], dataset_sink_mode=False)
      3 metrics = model.eval(ds_test)
      4 print(metrics)

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/train/model.py in train(self, epoch, train_dataset, callbacks, dataset_sink_mode, sink_size)
    904                     callbacks=callbacks,
    905                     dataset_sink_mode=dataset_sink_mode,
--> 906                     sink_size=sink_size)
    907 
    908     def build(self, train_dataset=None, valid_dataset=None, sink_size=-1, epoch=1, jit_config=None):

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/train/model.py in wrapper(self, *args, **kwargs)
     85                 raise e
     86         else:
---> 87             func(self, *args, **kwargs)
     88     return wrapper
     89 

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/train/model.py in _train(self, epoch, train_dataset, callbacks, dataset_sink_mode, sink_size)
    540             self._check_reuse_dataset(train_dataset)
    541             if not dataset_sink_mode:
--> 542                 self._train_process(epoch, train_dataset, list_callback, cb_params)
    543             elif context.get_context("device_target") == "CPU":
    544                 logger.info("The CPU cannot support dataset sink mode currently."

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/train/model.py in _train_process(self, epoch, train_dataset, list_callback, cb_params)
    792                 cb_params.train_dataset_element = next_element
    793                 list_callback.step_begin(run_context)
--> 794                 outputs = self._train_network(*next_element)
    795                 cb_params.net_outputs = outputs
    796                 if self._loss_scale_manager and self._loss_scale_manager.get_drop_overflow_update():

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/cell.py in __call__(self, *args, **kwargs)
    584                 logger.warning(f"For 'Cell', it's not support hook function in graph mode. If you want to use hook "
    585                                f"function, please use context.set_context to set pynative mode.")
--> 586             out = self.compile_and_run(*args)
    587             return out
    588 

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/cell.py in compile_and_run(self, *inputs)
    962         """
    963         self._auto_parallel_compile_and_run = True
--> 964         self.compile(*inputs)
    965 
    966         new_inputs = []

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/nn/cell.py in compile(self, *inputs)
    935         """
    936         if self._dynamic_shape_inputs is None or self._dynamic_shape_inputs[0] is None:
--> 937             _cell_graph_executor.compile(self, *inputs, phase=self.phase, auto_parallel_mode=self._auto_parallel_mode)
    938         else:
    939             self._check_compile_dynamic_shape(*inputs)

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/common/api.py in compile(self, obj, phase, do_convert, auto_parallel_mode, *args)
   1004         enable_ge = context.get_context("enable_ge")
   1005         self._graph_executor.set_weights_values(obj.parameters_dict())
-> 1006         result = self._graph_executor.compile(obj, args_list, phase, self._use_vm_mode())
   1007         obj.compile_cache.add(phase)
   1008         if not result:

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/ops/primitive.py in __check__(self, *args)
    465         for track in tracks:
    466             fn = getattr(self, 'check_' + track)
--> 467             fn(*(x[track] for x in args))
    468 
    469 

~/anaconda3/envs/MindSpore/lib/python3.7/site-packages/mindspore/ops/operations/math_ops.py in check_shape(self, x1, x2)
   1387         if np.all(np.array(x1) != -1) and np.all(np.array(x2) != -1):
   1388             if x1_col != x2_row:
-> 1389                 raise ValueError(f"For '{cls_name}', the input dimensions must be equal, but got 'x1_col': {x1_col} "
   1390                                  f"and 'x2_row': {x2_row}. And 'x' shape {x1}(transpose_a={self.transpose_a}), "
   1391                                  f"'y' shape {x2}(transpose_b={self.transpose_b}).")

ValueError: For 'MatMul', the input dimensions must be equal, but got 'x1_col': 817920 and 'x2_row': 272640. And 'x' shape [32, 817920](transpose_a=False), 'y' shape [3, 272640](transpose_b=True).
复制

请教各位有经验的大佬，我这个模型或者其他代码有什么问题，如何修改？

...全文

151 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

跳楼梯企鹅 2022-12-16

打赏
举报

我晚上研究一下回复你

心亘如舟 2023-10-24

@跳楼梯企鹅大哥研究出来了吗？

图模式的好处之一就是能够在编译的时候，获取到完整的图信息，以便我们根据整图结构进行更好地优化，而在动态图的时候，就无法拿到这些信息。例如，torch 需要打印数据的时候，可以直接 print 对应的数据，而 MindSpore 在这方面支持还比较有限（据可靠消息，在最新的 2.3 版本上已经支持了）。大概是这样的：静态图能够获得图的全局信息，包含节点的顺序和数据类型，可以有针对性的进行优化，这里的优化可以是算子执行顺序的调整、内存优化等，最终的目的都是为了更快的执行速度。【问题一】：首座，您好，我是小来。

本文中提到的人物对话【纯属虚构】的，如有雷同，纯属巧合，请【勿对号入座】。特邀嘉宾：首座常驻嘉宾：xxx、xxx。观众。。。

标注过程就不截图了，就是简单的直线标注得到的json文件大概是这样的格式(只展示了一部分)写了一个简单的转换代码: 最后得到数据格式:pytorch版本的m-lsd源码链接: https://github.com/lhwcv/mlsd_pytorch/ 修改.mlsd_pytorch-main/mlsd_pytorch/configs目录下的yaml文件我主要修改了几个加载数据的目录，和load_from的位置，其余的参数可以根据自己的需要自己修改。 mlsd_pytorch-main/mlsd_pyt

内容概要：本文介绍了DeepSeek在职场中的应用，从提示语技巧到多场景应用，涵盖了DeepSeek的基础模型（V3）、深度思考模型（R1）及其联网搜索功能。文中详细描述了DeepSeek的模型对比，包括操作规范、结果导向、路径灵活性、响应模式和风险特征等方面。此外，还探讨了DeepSeek在制作可视化图表、PPT、海报、视频以及批量生成新媒体文案等具体应用场景中的使用方法和技巧。最后，文章展示了DeepSeek在市场调查、AI应用开发等方面的应用实例，强调了其在人机协同和共生领域的潜力。适用人群：适用于希望提升工作效率和创新能力的职场人士，特别是从事数据分析、内容创作、市场营销、AI开发等领域的专业人士。使用场景及目标：①通过DeepSeek的基础模型（V3）和深度思考模型（R1）进行高效的任务处理和复杂推理；②利用DeepSeek制作可视化图表、PPT、海报和视频，提高内容创作的质量和效率；③通过DeepSeek进行市场调查和AI应用开发，优化业务流程并推动创新。其他说明：DeepSeek不仅提供了强大的AI工具，还强调了人机协同的重要性。用户在使用过程中应注意操作规范，结合实际需求选择合适的模型，并充分利用DeepSeek的各项功能来实现高效的职场应用。文中还提到了多个国际竞赛中的获奖情况，展示了DeepSeek团队在AI领域的卓越实力。

AI探索者

164

社区成员

107

社区内容

发帖

与我相关

我的任务

人工智能其他

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章