【求助】Excel如何提取上标或下标的文字内容

本性之初 2020-10-17 10:49:12
我的需求是把下面表格中的化学方程式解析出来,因为原有的excel是含有格式的,我想通过格式直接来提取这些信息就不重新匹配了


但是目前常用的excel读取的模块直接读内容会去除原有的格式,读样式的话好像只能读取单元格的样式,不能具体到文字。
将其转化docx之后好像也不太行(python-docx也没看到查找上标的办法)

求助各位大佬要解决这个问题我可以怎么做?感谢
...全文
409 2 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
秋千Swing0_0 2020-10-18
  • 打赏
  • 举报
回复
可以尝试一下将excel转换成zip格式,解压缩后到解压后目录的xl/worksheet/下的sheet.xml中寻找
本性之初 2020-10-17
  • 打赏
  • 举报
回复
在overstack上获得的回答:利用word转Latex工具先把文件转化为`.tex`格式,这样就可以保留原有格式,再使用正则模块进行匹配即可。

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧