求助,因研究需要,需要批量截取html格式的文本转化成txt格式。谢谢!

weixin_47062216 2024-10-28 18:06:36

大家好,小弟第一次发帖求助,请各位大佬出出主意。

因研究需要,需要提取美国的公司年报10-K中的item 7. MD&A的部分内容。

因为年份问题, 我曾经尝试起止点截取标识的方法,但是他的起止点标识有Item7. 或者Item 7 这样,感觉就很难定位。如果清除了html syntax,也很难定位。我对html 不是很了解QAQ

请大佬们帮帮忙,谢谢!

...全文
29 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
秋名RG 5天前
  • 打赏
  • 举报
回复

原始数据是什么样的,HTML文件有吗?

5,980

社区成员

发帖
与我相关
我的任务
社区描述
人生苦短,我用python
社区管理员
  • Python 学习者
  • 嗨学编程
  • 松鼠爱吃饼干
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

欢迎来到Python学习者们的社区,

 

本社区分享你需要的文章、问题解答、技术互助、学习资源、面试系列等等

 

欢迎你的加入,祝你学有所成~

试试用AI创作助手写篇文章吧