大家好,小弟第一次发帖求助,请各位大佬出出主意。
因研究需要,需要提取美国的公司年报10-K中的item 7. MD&A的部分内容。
因为年份问题, 我曾经尝试起止点截取标识的方法,但是他的起止点标识有Item7. 或者Item 7 这样,感觉就很难定位。如果清除了html syntax,也很难定位。我对html 不是很了解QAQ
请大佬们帮帮忙,谢谢!
原始数据是什么样的,HTML文件有吗?
5,980
社区成员
638
社区内容
加载中
欢迎来到Python学习者们的社区,
本社区分享你需要的文章、问题解答、技术互助、学习资源、面试系列等等
欢迎你的加入,祝你学有所成~
试试用AI创作助手写篇文章吧