如何跳过或忽略coulmn的数据时expcted coulmns较高然后头

weixin_38048154 2019-09-12 03:33:24

这样 id:message:user 1:hi:admin 2:im fine :):user1 第2行我有线有两个分离器，这意味着4列，以便它抛出pandas.errors.ParserError: Error tokenizing data. C error: Expected

...全文

39 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38056601 2019-09-12

打赏
举报

首先决定你想用坏线做什么？如果你想跳过它们，使用额外的参数（S），而使用熊猫读文件： error_bad_lines=False 代码变为： >>> df = pd.read_csv("test_data_file.csv", delimiter=":", warn_bad_lines=False, error_bad_lines=False) ，如果你不想砸“异常”的数据（通常情况），基于分离器的数量每行读出的数据作为串&过程的行如下： >>> df = pd.read_csv("/home/kiran/test_data_2.csv") >>> df["id"]= df['id:message:user'].apply(lambda x: x.split(":")[0]) >>> df["message"]= df['id:message:user'].apply(lambda x: x.split(":")[1] if (len(x.split(":"))==3) else x.split(":")[1]+":"+x.split(":")[2]) >>> df["user"]= df['id:message:user'].apply(lambda x: x.split(":")[-1]) >>> df.drop('id:message:user', 1, inplace=True) >>> df.head(5) id message user 0 1 hi admin 1 2 im fine :) user1

weixin_38067871 2019-09-12

打赏
举报

在您的示例中，额外的分隔符只能出现在中间列中。所以，如果你读了输入行成一个字符串，就可以很容易地找到这两个分隔符：第一分离器是第一个“：”在字符串中第二隔板是最后的' ：”在串因此：第一隔离物S之前的字符串的任何部分HOULD转到第一列所述第一和最后一个分离器应该进入第二列（包括在该消息中的所有冒号）字符串的任何部分的最后分离器之后应该去之间的字符串的任何部分入到第三塔（请注意，如果有多于一列可以包含分离这种方法是行不通的。）

dubbo-monitor监控中心，基于alibaba dubbo.jar开发，解决Decode rpc invocation failed: expected map/object at java.lang.String (Ljava/lang/String)、com.alibaba.dubbo.common.URL' could not be instantiated等项目dubbo.jar不一致问题

报错内容：cannot parse input:expcted ，at the end of stream。一开始就想到采用导出数据到csv文件，再从csv文件导入的做法。其中参数值根据实际值填写，到这里导出是没问题的，导出的csv打开可以看到是以逗号为分割的列数据。报错内容提示的意思应该是在文件最后缺少逗号，但是csv文件打开看又没有毛病，无解。近期，在做k8s相关的项目时，涉及到了ck数据库的导入导出的问题。后来直接不用默认的逗号分割列，用|来分割试了下，有效，解决问题。

记一次生产问题-数据流被提前关闭情景(situation): 前几天，发布新版本，出现了一个问题，但是问题其实不是出现在新功能，而是旧功能，简单介绍一下我们这边的发布流程：首先发布新版本到预发灰度环境，通过域名变化来控制灰度和生产的服务，实际上灰度和生产是共库的，预发环境仅作为测试或业务人员验证新版本功能使用。然后测试介入预发环境验证新功能是否有问题，有问题定位问题处理。最后验证没有问题之后，将...

在高版本selenium下如：selenium3.4.3 1.高版本的selenium需要浏览器安装一些补丁驱动 Firefox：geckodriver 下载网址：http://download.csdn.net/detail/ztzy520/9725887 或https://github.com/mozilla/geckodriver/release 如：geckodriver...

首先可以参考看一下自己链接数据库的类中有没有queryForObject方法，如图使用这个方法，当数据库查找不到自己传入的数据时不会返回NULL，而是直接抛异常，所以在页面中会直接显示500，我这里处理比较简单，直接抓取异常，如果出异常直接让user=null;如图经过我获取异常后再输入查找不到的用户名和密码时就可以正常输出了。我这里比较随意， ......