社区
Java SE
帖子详情
java处理HTML的nbsp问题
ShadowWander
2011-10-02 09:50:49
我用jsoup的.text()方法获得html的内容,里面有 空格符。.text()返回的是string。
system.out.println(XX.text()); 变成1个问号;
用replaceall(“//?”,“”)替换不了
用trim()也替换不了
是不是编码问题啊?但是我不懂怎么改编码。
头疼死了,一个段落里面好多 空格符,请问应该怎么处理啊。
...全文
303
4
打赏
收藏
java处理HTML的nbsp问题
我用jsoup的.text()方法获得html的内容,里面有空格符。.text()返回的是string。 system.out.println(XX.text());变成1个问号; 用replaceall(“//?”,“”)替换不了 用trim()也替换不了 是不是编码问题啊?但是我不懂怎么改编码。 头疼死了,一个段落里面好多空格符,请问应该怎么处理啊。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ihuanling
2011-11-18
打赏
举报
回复
我也是遇到了同样的问题,如果用html(),然后replaceAll(" "," ")就可以。
java控制台显示问号应该是编码问题。
huntor
2011-10-02
打赏
举报
回复
text.replaceAll(" "," ");
应该可以
InstallAnywhere v5.5.1--专业、强大的安装工具
摘要 用于制作应用软件的安装程序,支持任何开发平台,灵活性强,性能突出,对
JAVA
程序的支持也相当完善。 组件列表 技术特性 ♦;;;&
nbsp
;;;;通用安装、配置和客户化 ·在终端用户的系统上,将文件和文件夹安装于任何位置 ·在Read Me, License Agreement和其他的安装面板中完全支持
HTML
格式的文本。 ·使用GIF, JPEG, 和PNG文件,并借助透明和动作功能完全客户化图形、公告牌、主题和品牌。 ·内置安装步骤列表,突出安装的每一阶段 ·内置的安装器面板:介绍、要点、协议、选择安装文件、用户输入、密码、序列号、功能集、部件、安装摘要,等等。 ·内置的命令行控制台的交互以匹配图象化的面板 ·内置动作:创建快捷键、释放归档文件、使用搜索和替代功能修改文本文件,安装并控制Windows Services、设置注册表录入、设置环境变量执行命令和脚本,等等。 ·内置规则:检验平台、对比变量、验证用户输入、检验位置、确认文件/文件夹的属性 ·卸载表中可自定义动作,支持Windows的注册表的重运行。 ·用户可使用
Java
和基于
Java
Beans的开放API,扩展设计自定义的动作、面板和控制台 ·在 XML或文本格式中安装日志 ·性能优化,提升安装时间两倍之多 ·XML的支持功能---包括了重新设计项目的文件格式,通过修改或是转换XML文件的方式检索数据。 ·卸载工具可以实现部分或全部的卸载功能 ·合并模块技术可以方便地创建";;;整套";;;安装器,子安装器和模版。可以在你的开发团队甚至是整个企业内部,将安装器的可重用性由一个项目传递到另一个项目也可源自于第三方的供应商。 ·完全的鼠标拖动支持,上下文右击菜单可以快速地获取常用的功能。 ·源路径管理,开发者可以方便地将开发的项目和源文件转移到构建的系统,或者是开发者之间进行转移。 ·Apache Ant 集成工具在安装之前、之中、之后执行Ant targets功能 ·针对
Java
应用程序配置的功能 ·自动安装
Java
VM ·完全支持所有的
Java
1.3版本,甚至包括
Java
1.4 和J2EE 1.3 ·创建 LaunchAnywhere? (Zero G的
Java
应用程序发布技术) ,终端用户只需双击 Windows或Mac上的光标,或是在Solaris和Linux上输入简单的命令,就可以启动
Java
程序。 ·
Java
Classpath 和主类的自动检测。 ·完全支持所有的
Java
运行选项。 ♦;;;&
nbsp
;;;;针对服务器, Web Services, 和J2EE 配置的功能 ·针对数据库注册选项的用户自定义面板 ·使用高级的搜索和替代功能修改服务器属性文件 ·安装、启动、停止并暂停Windows services ·安装EJBs, servlets, JSPs, JAR, WAR, 和EAR archives ·自动修改起始的脚本文件和 UNIX daemons文件 ♦;;;&
nbsp
;;;;平台支持 ·几乎支持每一种平台,包括最新版本的of Windows, Mac OS, Solaris, Linux, HP-UX, AIX, Tru64, IRIX, Free BSD以及其他。 ·适用于Windows XP和Mac OS X的日志证明。 ♦;;;&
nbsp
;;;;针对平台的功能 ·Windows 注册:检索, 设置, 并检验现有的主键和数据 ·Windows 快捷键:Mac aliases (with Dock support), UNIX 链接 ·Windows 服务:安装、启动、停止、暂停任何服务 ·本地化的Windows, Mac OS, UNIX 使用效果 ·Mac OS X 鉴定 ·设置Windows和UNIX环境下的系统环境变量 ·集成 Linux RPM ·Windows 卸载工具支持注册表的重新运行以及新增/移动程序 ·Magic FoldersTM:为桌面、系统、主页、性能、字体以及其他位置提供的专用文件夹 应用场景 适用于各种环境下安装程序的制作 运用优势 安装于任何应用程序、任何平台、任何地方 InstallAnywhere 简化了软件配置于任何客户端及服务器平台的工作,自动
处理
完成所有的复杂环节。每次每一时间都可以按照你的要求精确地配置软件。 InstallAnywhere 几乎支持每一种平台,包括最新版本的of Windows, Mac OS, Sola
java
jsoup解析
html
如何替换&
nbsp
,Jsoup
处理
html
空格乱码
问题
由于在
html
中空格只能用表示,当运用Jsoup抓取
html
页面后,我们将
html
页面进行解析时,
Java
对
html
页面的代码不识别,输入到控制台时出现乱码,在网上查了很多资料都没有找到很好的解决办法,最后在一篇论坛中说到“运用字符串替换”可以进行解决,于是运用简单的字符串替换原理对此进行
处理
。对其替换
处理
后再对
html
文件进行解析。具体实现代码如下://参数说明:oldFile为所需要替换的文...
Java
处理
html
字符实体
小程序
处理
不了字符实体,所以需要
Java
把
HTML
内容
处理
好再返回给小程序,org.apache.commons.lang3包StringEscapeUtils.unescape
Html
4(str)方法可以实现转换。
HTML
中有用的字符实体注释:实体名称对大小写敏感!显示结果描述实体名称实体编号 空格&
nbsp
;&#160;<小于号&lt;&#60;>...
java
开发转义空格&
nbsp
;
&
nbsp
; 都是空格,&
nbsp
是
html
中的空格的转义。而 是XSL中的空格的转义。(XSL是可扩展样式表语言的外语缩写,是一种用于以可读格式呈现 XML(标准通用标记语言的子集)数据的语言。) “项目名称 ”,   这样的空格,用String的 trim();方法是去不掉的! 因为&
nbsp
;  这些东西 trim();不当他们是空格! ...
java
替换
html
特殊字符,
HTML
特殊字符替换
问题
html
escape相关
在
处理
网页时经常会遇到这样的
问题
,后台得到的字符串数据包含网页
HTML
中的特殊字符,例如在页面上这样一句话,“你好·世界”在后台取到的是“你好·世界”。这是由于
HTML
对特殊字符进行了编码。今天在取得前台form表单提交的数据时,就遇到了这样的
问题
。页面表单填的数据是正常的字符串“你好·世界”,传到后台以后却把·这个字符进行了编码,变成了·。之前在做爬虫时
处理
这种
问题
通常是进行简单的替换,类似这样...
Java SE
62,614
社区成员
307,326
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章