怎么用python合并字段不一致的xls文件？求助

majiashu 2017-11-29 09:53:02

问题描述如下：
文件一：

文件二：

文件一、文件二合并后：

怎么样能处理那求助，什么方法都行，最好是python

...全文

332 4 打赏收藏转发到动态举报

写回复

用AI写文章

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

珏丶Juer 2017-11-30

打赏
举报

有个思路，尝试将两个表的字段集合进行合并，并去除集合中重复的字段，将这个字段集合作为新文件的字段。接下来就是将记录一条条的导入进去，没有字段就放空或者填缺省值。

majiashu 2017-11-29

打赏
举报

表比较多，而且数据量又很大，该怎么办构造那？

extend 2017-11-29

打赏
举报

用pandas吧，构造完了，再写进excel 第一个表： >>> part1=pd.DataFrame({'学号':(1111,1112,1113), '姓名':('小张','小王','小李'), '四级成绩':(555,567,564), '六级成绩':(459,542,657)}) >>> part1 六级成绩四级成绩姓名学号 0 459 555 小张 1111 1 542 567 小王 1112 2 657 564 小李 1113 第二个表： >>> part2=pd.DataFrame({'学号':pd.Series(('0001','0002','0003'),dtype='int32'), '姓名':('张三','李四','王五'), '语文成绩':(555,567,564), '数学成绩':(459,542,657)}) >>> part2 姓名学号数学成绩语文成绩 0 张三 1 459 555 1 李四 2 542 567 2 王五 3 657 564 两表合并： >>> pd.concat([part1,part2]) 六级成绩四级成绩姓名学号数学成绩语文成绩 0 459.0 555.0 小张 1111 NaN NaN 1 542.0 567.0 小王 1112 NaN NaN 2 657.0 564.0 小李 1113 NaN NaN 0 NaN NaN 张三 1 459.0 555.0 1 NaN NaN 李四 2 542.0 567.0 2 NaN NaN 王五 3 657.0 564.0

extend 2017-11-29

打赏
举报

引用 2 楼 qq_38377523 的回复:

表比较多，而且数据量又很大，该怎么办构造那？

pandas支持直接读取excel，读成dataframe，最后合并成一个frame里，在写回excel。但是我不确定pandas能不能直接写excel，不能的话，安装相应的包，不难。从你的需求上看，pandas处理这个问题最合适，注意下数据类型即可。实际上我的例子里，对"0001"这样的编号没找到合适的数据类型，所以你也看到了，结果直接变成1，前面的0省略了，你自己需要注意下。 python+pandas处理大数据得心应手，你的数据量有多少？几百万条？完全没问题的。