社区
C#
帖子详情
word文档解析[急HELP]
Allan_Happy
2008-01-09 10:31:46
有个需求,解析word文档。
我需要把word中的文字(字体、颜色、大小等格式)、图片等元素都解析出来,生成相应的html。我也知道save方法可以转换成html,但是我需要自己处理以下word中的内容在生成我需要的html,请各位达人指教,或给点方向。
...全文
353
6
打赏
收藏
word文档解析[急HELP]
有个需求,解析word文档。 我需要把word中的文字(字体、颜色、大小等格式)、图片等元素都解析出来,生成相应的html。我也知道save方法可以转换成html,但是我需要自己处理以下word中的内容在生成我需要的html,请各位达人指教,或给点方向。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
zj7089685
2008-01-09
打赏
举报
回复
Word解析?不长用啊,我是没太用过,顶下吧~
http://www.4x255.com/Article/Index.html 里到是有word解析的文章,你找下吧,也只能帮到此拉
haiwangstar
2008-01-09
打赏
举报
回复
呵呵。。先建一个空文档,保存成DOC格式,准备一个十六进制编辑器,如HexWorkshop,打开DOC文件,然后你如入一段文字在WORD中再保存,然后比较这两份文档,分析数据格式,然后设置字体,颜色,再保存,再对比,分析。再加入图片,再保存,再分析。最后你可以得到文字,图片的规范。。然后你就可以解析元素了。
xyc522
2008-01-09
打赏
举报
回复
关注,读内容是可以的吧,但是貌似字体之类的,就不懂了。。。。呵,
Allan_Happy
2008-01-09
打赏
举报
回复
顶到下班 没牛人 明天上班结
Allan_Happy
2008-01-09
打赏
举报
回复
当然了word是我自定义的模版样式的
还有是不是这个功能不太可能实现啊···
cpio
2008-01-09
打赏
举报
回复
牛人
golang转word到html,golang
解析
word文档
操作
功能很强大,这里简单给出对
word文档
的读取案例安装go get baliance.com/gooxml/go build -i baliance.com/gooxml/…
解析
word代码举个例子:下图为
word文档
的截图,总共四行,第一行有三种字体运行代码结果如下:...
docling,强大的文档
解析
转换工具,开源免费!
Docling是一款开源的多功能文档
解析
与转换工具,支持PDF、DOCX、PPTX、图片、HTML、Markdown等多种格式的导入,并能将其转换为Markdown和JSON。它具有先进的PDF理解能力,包括页面布局分析、表格结构识别等,并支持...
【AI大模型】RAG效果优化:高质量文档
解析
详解
本文关于如何将非结构化数据(如PDF和
Word文档
)转换为结构化数据,以便于RAG(Retrieval-Augmented Generation)系统使用。
RAG项目必备!文档
解析
神器MinerU:2.5万星标!支持GPU加速,轻松应对复杂文档
MinerU能够轻松应对各种PDF文档需求,包括考题、PPT、论文、教科书、图书、杂志、笔记、新闻、研报等,并支持其他类型的文档转换为PDF后提取,如图片、PPT和
Word文档
。精准识别版面元素,删除页眉/页脚/脚注,同时...
EasyDoc文档
解析
API,实测体验分享
EasyDoc优点的话相比开源工具,一个做的比较好的就是可以支持层次结构分析,之前试了一些工具基本上只能识别出一级标题,其次对图表内容基于VL去做了识别
解析
,可能其他工具也有,但是单独部署一个多模态模型成本...
C#
111,125
社区成员
642,540
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章