怎么用python合并字段不一致的xls文件?求助

majiashu 2017-11-29 09:53:02
问题描述如下:
文件一:

文件二:

文件一、文件二合并后:


怎么样能处理那求助,什么方法都行,最好是python
...全文
332 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
珏丶Juer 2017-11-30
  • 打赏
  • 举报
回复
有个思路,尝试将两个表的字段集合进行合并,并去除集合中重复的字段,将这个字段集合作为新文件的字段。 接下来就是将记录一条条的导入进去,没有字段就放空或者填缺省值。
majiashu 2017-11-29
  • 打赏
  • 举报
回复
表比较多,而且数据量又很大,该怎么办构造那?
extend 2017-11-29
  • 打赏
  • 举报
回复
用pandas吧,构造完了,再写进excel 第一个表: >>> part1=pd.DataFrame({'学号':(1111,1112,1113), '姓名':('小张','小王','小李'), '四级成绩':(555,567,564), '六级成绩':(459,542,657)}) >>> part1 六级成绩 四级成绩 姓名 学号 0 459 555 小张 1111 1 542 567 小王 1112 2 657 564 小李 1113 第二个表: >>> part2=pd.DataFrame({'学号':pd.Series(('0001','0002','0003'),dtype='int32'), '姓名':('张三','李四','王五'), '语文成绩':(555,567,564), '数学成绩':(459,542,657)}) >>> part2 姓名 学号 数学成绩 语文成绩 0 张三 1 459 555 1 李四 2 542 567 2 王五 3 657 564 两表合并: >>> pd.concat([part1,part2]) 六级成绩 四级成绩 姓名 学号 数学成绩 语文成绩 0 459.0 555.0 小张 1111 NaN NaN 1 542.0 567.0 小王 1112 NaN NaN 2 657.0 564.0 小李 1113 NaN NaN 0 NaN NaN 张三 1 459.0 555.0 1 NaN NaN 李四 2 542.0 567.0 2 NaN NaN 王五 3 657.0 564.0
extend 2017-11-29
  • 打赏
  • 举报
回复
引用 2 楼 qq_38377523 的回复:
表比较多,而且数据量又很大,该怎么办构造那?
pandas支持直接读取excel,读成dataframe,最后合并成一个frame里,在写回excel。 但是我不确定pandas能不能直接写excel,不能的话,安装相应的包,不难。 从你的需求上看,pandas处理这个问题最合适,注意下数据类型即可。实际上我的例子里,对"0001"这样的编号没找到合适的数据类型,所以你也看到了,结果直接变成1,前面的0省略了,你自己需要注意下。 python+pandas处理大数据得心应手,你的数据量有多少?几百万条?完全没问题的。

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧