社区
Java
帖子详情
请教关于页面的这种动态生成?谢谢
zykathy
2004-10-20 07:46:35
我现在要做这么一项功能:
对web页面上显示的内容进行抽象,形成几种元素,如文本、标签等。然后可由用户自己来选择他希望在页面上显示的元素,构成一个页面。其实就是一个web页面的动态生成。现在对于元素的定义以及元素在页面上如何布局不知道该如何进行。
请教有这方面开发经验的高手给予指点,不甚感激!!要的很急啊,谢谢大家了!
有什么好的意见或建议也十分欢迎!
...全文
79
5
打赏
收藏
请教关于页面的这种动态生成?谢谢
我现在要做这么一项功能: 对web页面上显示的内容进行抽象,形成几种元素,如文本、标签等。然后可由用户自己来选择他希望在页面上显示的元素,构成一个页面。其实就是一个web页面的动态生成。现在对于元素的定义以及元素在页面上如何布局不知道该如何进行。 请教有这方面开发经验的高手给予指点,不甚感激!!要的很急啊,谢谢大家了! 有什么好的意见或建议也十分欢迎!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
GOUSHIJIE
2004-10-25
打赏
举报
回复
哪里有这种例子
jeanven
2004-10-25
打赏
举报
回复
XML 里边有界面定位的内容
zykathy
2004-10-25
打赏
举报
回复
能否给出类似的例子啊,谢谢了!!!
其他有什么好的意见吗?
GJA106
2004-10-21
打赏
举报
回复
不是一两句话就能说清楚。如果已经限制页面元素数量,是可以,也有类似例子。
draco2002
2004-10-20
打赏
举报
回复
够复杂的,用servlet??
一个简单的java爬虫产品
最近一直在研究爬虫和Lucene,虽然开始决定选用Heritrix来执行爬虫操作,但是后来发现用它来做还是存在一定的问题,比如需要程序
生成
相应的XML文件,对于同一个Job,怎样才能保证重复运行该Job时文件夹始终是同一个(Heritrix为Job创建文件夹的规则是“Job名称-时间戳”)等等,都是需要考虑的问题,最终还是将其搁浅。 后来google了一下,找到了一个简单爬虫的程序代码(http://www.blogjava.net/Jack2007/archive/2008/03/24/188138.html),随即试验了一下,发现确实能得到网页的内容,在这里还是要
谢谢
代码的提供者——Jack.Wang。 虽然试验成功,但是在随后的大数据量试验时,还是出现了问题。最初试验时,我只是让程序去抓取10个URL链接,当我将URL链接数改为100个时,问题出现了——URL中存在重复,而且非常容易的就变成死循环。举个例子来说,比如我首先爬的是A.html,在A.html中有两个链接:B.html,C.html,等爬完A.html以后,程序会爬B.html,这时如果B.html中的所有链接中有A.html这个
页面
的链接,那么程序又会去爬A.html这个
页面
,如此一来就形成了一个死循环,永远也不能停止。 跟踪程序发现,原来是在添加要抓取的网页的链接列表中,没有将已经抓取过的URL去除,所以才造成了死循环。现在虽然加上了这个判断,但是从我运行程序的效果来看,也不是很理想,总是感觉有些慢,800个
页面
要一两分钟才能爬完,这个我觉得有点说不过去。 这个产品,做到现在,我遇到了这么几个情况,有和大家分享的,也有向大家
请教
,求助的。 1.关于对应关系数据的保存方式 在创建索引的时候,需要将网页的URL和网页的内容传到相应的方法中,当然URL和内容是要对应的,也许是经验太少吧,我采取的是通过构建一个JavaBean的方式来传递的,不知道大家有没有更好的方法 2.关于要创建索引的内容的保存方式 最初的想法是不创建文件,直接将内容保存到变量中,然后创建索引,即先抓取网页的内容,然后将网页的内容和URL保存到自己构建的JavaBean对象中,接着将这个对象放到一个list列表中,等所有网页抓取完毕以后,将这个列表传到创建索引的方法中。
这种
做法看似不错,可是当URL数量很大时,会导致内存不够用,所以还是创建文件比较稳妥。 3.关于网页编码问题 遇到这个问题也是一个巧合,本来我抓取的是客户的一个网站,后来同事说如果客户看访问日志,这个月的数据会和平常的数据不一样,所以我就抓取公司的网站,结果,问题出现了。原先公司的网站是用GB2312编码做的
页面
,现在采用的是UTF-8的编码,虽然我已经判断了
页面
的编码,可是依然不能解决保存的文件中文乱码的问题,不知道大家有什么好办法没有。错误信息为:java.io.UnsupportedEncodingException 附件为爬虫代码 本文出自 “徘徊在c#,java,php之间” 博客,请务必保留此出处http://jerrysun.blog.51cto.com/745955/221879
Java后端
生成
图片工具类分享
Graphics、FreeMarker
生成
图片分享
请问你觉得生产静态
页面
一点意义都没有吗?
我知道你一直主张用MS自带的缓存功能。我想知道,你怎么看待静态
页面
和他两个。能介绍下什么情况下会选择哪个方式吗? 假如有100万个
页面
,甚至更多,每天,有5%的
页面
会浏览十次以上,有50%的
页面
只浏览一次。剩下45%根本没人看过。
这种
情况你选择这么做? 另外我有个疑问,用缓存时,如果内存不够了怎么办?是用硬盘存放,还是释放缓存? 恳请SP1234百忙中给予解答。
谢谢
。其实关于
请教
一些关于JAVA面试问题 有很多
谢谢
大家帮忙
题 目 java与C#相比,Java的优势在哪里? 1.struts运作过程,hibernate的作用 hibernate中,怎么判断是插入还是更新? 怎么使用javascript进行
页面
跳转? 怎么使用javascript将一个
页面
的一个参数传递到另外一个
页面
? 使用存储过程进行分页,
页面
使用javascript分页 什么是自定义控件?
动态
如何传数据? 正规表达式只许输入整数 xm
python
生成
排列组合_Python 排列组合
生成
zckun:老哥们,
请教
一个问题, 是关于排列组合的, 前几天和老哥们讨论了一下, 能是能解决, 但感觉不太方便看一个简单的例子应该就明白了.to目前是我这样做的, 用了一个模版template代码和上面的学校例子有点不同,因为我的完整需求是这样的代码import xml.etree.ElementTree as ETimport itertoolsfrom typing import Dict...
Java
51,397
社区成员
85,848
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章