社区
HTML/XML
帖子详情
如何得到表格中的一段文本的分行符?
kingstar568
2007-06-11 09:13:39
<P>文本信息</P> 如果文本信息在这个表格中不止一行,我如何确定什么时候分行呢?如果自己写算法分行,也有点问题,因为表格得到的宽是像素单位,而字符如果要跟像素单位换算的话必须要去得每种字体所在的像素值,这样就比较复杂了。msHTML DOM是否提供这样的接口呢?谢谢
...全文
410
11
打赏
收藏
如何得到表格中的一段文本的分行符?
文本信息 如果文本信息在这个表格中不止一行,我如何确定什么时候分行呢?如果自己写算法分行,也有点问题,因为表格得到的宽是像素单位,而字符如果要跟像素单位换算的话必须要去得每种字体所在的像素值,这样就比较复杂了。msHTML DOM是否提供这样的接口呢?谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
kingstar568
2007-06-12
打赏
举报
回复
IE的CSS实现本来就包含了分行算法。这个只是在css的实现过程中用到了分行算法。但是我如何提取文本后却不是在这样的环境下来分行的。所以也无法用这个现有的算法
eduyu
2007-06-12
打赏
举报
回复
IE的CSS实现本来就包含了分行算法,你只要赋值CSS就可以分行了,楼主为何还要写分行算法?
一个HTML元素的大小可以用px,pt,em的单位来表示,你指定字符是多少个px,这个字符就是多少个px的长和宽。
kingstar568
2007-06-12
打赏
举报
回复
比如像这样 <P>中华大地,山川秀丽,数千年来,在这片土地上,流传着无数的神奇传说。千古以来,一直被人们津津乐道的便是那些关于长生不老,永生不死的传奇。自古以来,凡人无不有一死。但世人皆恶死爱生,更有地府阎罗之说,平添了几分苦惧,在此之下,遂有长生不死之说,令世人梦寐以求,纷纷苦寻长生之路。<SPAN
class=transparent>(来自·幻剑书盟)</SPAN></P>
里面根本没有<BR>标签。
但是在html中的表单中却是分行的。可能会出现很工整的排列。
kingstar568
2007-06-12
打赏
举报
回复
to shubing820904()
你这样得到的前提条件是需要html中有<BR>标签,但是我的情况是没有这样的标签。
eduyu(杜宇) 说的不错。这里分行似乎是ie来实现自动分行的,css只给出了是否需要自动分行这样的信息,并没有具体的分行信息。
看来我是要自己来写个分行的算法了。但是有人能告诉我px这个单位跟字符是怎样换算关系吗?
kingstar568
2007-06-12
打赏
举报
回复
你打开个英文网页对照下,明显不一样的。除非你说的是某种特定字体。
就拿http://www.google.com/ 来说吧。看到下面的Make Google Your Homepage!了吗?
Home对上去是About,看上去Home的四个字母跟About的五个字母却是对齐的,这应该说明不同字母所占的像素是不一样的吧
eduyu
2007-06-12
打赏
举报
回复
W和a的确是一样长和宽的,你选择下每个字符,可以看到蓝色的长条是一样大小,只不过它们空白不一样而已。
kingstar568
2007-06-12
打赏
举报
回复
谢谢 eduyu(杜宇)
我明白了。看来现在也只能这样做了。
kingstar568
2007-06-12
打赏
举报
回复
你指定字符是多少个px,这个字符就是多少个px的长和宽。
这句话应该有问题的。W 跟a会占同样的长和宽吗?明显不是。
网页中字母宽度不是都对齐的
eduyu
2007-06-12
打赏
举报
回复
哦,原来这样。DPI(或者PPI,pixel per inch)是系统设定的,可以通过函数得到,一般是96象素每英寸,字体的每点长大约1/72 英寸。这样就可以把字体的大小很容易换算到pixel了。
eduyu
2007-06-11
打赏
举报
回复
分行不属于内容,属于CSS的事儿,给表格赋CSS值,让它自动分行。
shubing820904
2007-06-11
打赏
举报
回复
好不容易找到你的帖子,下面是我给你的例子,你自己再好好看看:
tag=SysAllocString(L"br");
IHTMLElement *pElementBr;
pHtmlDoc2->createElement(tag,&pElementBr);
IHTMLDOMNode *pNewBrNode;
if (S_OK!=pElementBr->QueryInterface(IID_IHTMLDOMNode,(void **)&pNewBrNode))
return;
希望对你有帮助!
C++程序读取PDF
中
的
文本
C++程序读取PDF
中
的
文本
。Adobe允许你提交PDF文件,提取成
文本
或HTML后再通过邮件发送给你。但是假如你需要自己提取
文本
或在程序
中
加入这个功能的话,需要花费很多时间。也许你还需要对
文本
应用某些特殊格式(如,添加tab分隔
符
)以便它们能够导入到Execl
中
(比如,你需要将PDF文档
中
包含的
表格
数据导入到Excel
中
,这就是编写这段代码的目的)。附件
中
的程序使用VC6.0编译通过,可以成功的读取PDF文件
中
的
文本
。并且保存到一个txt文件
中
html
文本
分隔
符
,HTML快速入门8——HTML分隔
符
,一般语法,PRE标签,特殊字
符
显示...
HTML
中
的分隔
符
:空格和回车在HTML
中
回车(换行)和空格的作用是相同的,都是分隔
符
。浏览器将忽略连续的分隔
符
。也就是说连续多个分隔
符
只看做一个。例子1 2 3 45浏览器显示:1 2 3 4 5说明无论在两个字
符
之间有多少个空格、回车,显示起来都好象只有一个空格。 空格是西文空格,全角的
中
文空格不是分隔
符
。他将占用一个
中
文字
符
的宽度。HTML要换行必须另起
一段
(用P,但会有...
基于Paddle的
表格
结构化技术精讲:原理到实战
随着各类文档的爆炸性增长,文档智能领域的研究蓬勃发展。其
中
,
表格
是各类文档
中
常见的页面元素,如何高效地从文档
中
找到
表格
并获取内容与结构信息即
表格
识别,是文档智能的一个重要领域。本课程就是讲述文档智能领域的一个分支:
表格
结构化识别。这里不得不说的是目前一个非常流行的开源项目PaddleOCR(Star达到25.1k),它的一个分支PPStructure更是此开源项目的一个亮点,用于解决文档智能(版面分析、版面恢复、
表格
结构化、信息抽取等)领域的问题。本课程也是在该开源项目基础上,从背景到难点、从传统方法到深度学习、从数据到训练、从模型理论到实战,全面讲解
表格
结构化识别技术:1)算法模型:着重讲解LGPMA(海康威视)、TableMASTER(平安财险)、TableRec-RARE(PPstructurev1)、SLANet(PPstructurev2)模型;2)语料构建:提供开源数据、标注工具(PPOCRLabelv2)、自动生成工具(TableGeneration)三个维度的语料构建方法3)项目实战:讲解PPstructure
表格
识别的关键源码,并全流程实现项目环境安装、准备自己的数据集、修改配置文件、模型训练及评估、模型导出环节
复制
一段
文本
粘贴到Excel
中
(带自动换格换行)
在微软的Office以及金山的WPS
中
,Excel
表格
的操作: Tab 向右换新格子 Enter 向下换新行(且在最左端) 所以说我们复制的
文本
只要: 由可表示Enter和Tab的字
符
分隔,即可直接粘贴到Excel
中
。 打开notepad,输入以下,然后复制(注意使用Tab分隔单词,使用Enter换行)。 aaa 213 sda aadssada 3eeds sdadsasd sddadscxz aqa asdasd 如果你使用了开发工具如IDEA、VSCode等。他可能会有自动将Tab转换为空格的功能。
LATEX
中
如何进行
分行
?分段?分页?
LATEX 源代码
中
,行末的换行
符
视为一个空格。 那么如何分段呢? 1.连续两个换行
符
,也就是空行,会将文字分段。多个空行被 视为一个空行。 2.可以在行末使用 \par 命令分段。 例如:LATEX 源代码如下 \documentclass{ctexart} \begin{document} space document jdskdjs yes hjshjd./ dhsjhd.\par A \verb|\par| commend \end{document} 编译之后效果展示: ...
HTML/XML
3,055
社区成员
8,066
社区内容
发帖
与我相关
我的任务
HTML/XML
VC/MFC HTML/XML
复制链接
扫一扫
分享
社区描述
VC/MFC HTML/XML
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章