社区
非技术区
帖子详情
请教有关搜索引擎的问题
koj5201314
2010-12-30 11:12:02
如果要做一个搜索行业情报信息的搜索引擎,需要哪些技术?有哪些难点?投入资本有多大?周期有多久?比如服务器投入,人员投入,需要哪些人员?谢谢啊!
...全文
103
9
打赏
收藏
请教有关搜索引擎的问题
如果要做一个搜索行业情报信息的搜索引擎,需要哪些技术?有哪些难点?投入资本有多大?周期有多久?比如服务器投入,人员投入,需要哪些人员?谢谢啊!
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
stoneallen
2011-01-06
打赏
举报
回复
搜索这块竞争挺激烈的
koj5201314
2010-12-31
打赏
举报
回复
爬虫主要是搜集同行业的网站信息,企业、行业情报信息
amos1989
2010-12-31
打赏
举报
回复
不懂。帮顶了。
zn85600301
2010-12-31
打赏
举报
回复
[Quote=引用 4 楼 koj5201314 的回复:]
比如电力系统,那就说说要用写什么技术,比如一个蜘蛛程序。
[/Quote]
不太了解电力系统 有什么需要爬的
不过推荐下nutch 这个东西做爬虫挺不错的 而且支持分布式
还有解析HTML的工具 jsoup 这个工具也能直接当爬虫用 可以直接去爬网站
爬虫最主要的是考虑一个网页是否爬过 是否已经更新
搜索的交流的地方不多 你加些QQ群去问问吧
koj5201314
2010-12-30
打赏
举报
回复
比如电力系统,那就说说要用写什么技术,比如一个蜘蛛程序。
zn85600301
2010-12-30
打赏
举报
回复
你的行业情报指的是什么
搜索引擎要关注的东西多了 看项目大小和成本
koj5201314
2010-12-30
打赏
举报
回复
额,,,你说的是java的?我上网查了查 好多C#的文章 晕死 不过都是同一篇
Jlins
2010-12-30
打赏
举报
回复
lucene 或者 compass要会用...
要学会分词
要会用爬虫爬相关网站然后给 lucene或者compass数据
uastation
2010-12-30
打赏
举报
回复
http://topic.csdn.net/u/20101220/12/18b0b88e-5c09-4383-b642-b52bcf780f82.html
搜索引擎
的设计与实现毕业设计中期检查表.doc
首先,
搜索引擎
设计的初期工作包括收集相关资料信息。这一阶段需要了解
搜索引擎
的基本原理,如爬虫技术、索引构建、倒排索引、关键词匹配算法等。学生需要广泛阅读学术论文、教科书和在线资源,以便深入理解这些概念...
superl-url:根据关键词,对
搜索引擎
内容检索结果的网址内容进行采集的一款轻量级软程序。 程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY的影响程度,同时也是批量采集自己获取感兴趣的网站的一个小程序~~ 可自动从
搜索引擎
采集相关网站的真实地址与标题等信息,可保存为文件,自动去除重复URL。同时,也可以自定义忽略多条域名等
如果没有技术基础,在使用者遇到
问题
,可查看下文的联系方式,自行通过QQ群
请教
他人或者官方淘宝店铺提供无偿或有偿技术调试。 鉴于使用者较多,总是有小伙伴联系我定制二次开发,但时间太少。预计今年底会统一出一...
浅析自己做网站的一点心得
搜索引擎
的算法每时每刻都在升级变化,很多昨天有效的手法放在今天就无效了。因此,作为站长我们需要不断学习新的技术和方法,不断适应
搜索引擎
的变化。 第三,作者认为讲究方法非常重要。在学习的过程中,我们不可...
应届毕业生网站运营的实习报告.doc
3.
搜索引擎
优化:
搜索引擎
优化(即 seo)是一项非常重要的基础性网站推广工作可以提高
搜索引擎
对网页的收录及一系列关键词的排名,从而提升网站访问量。在 seo 方面需要考虑关键词的选取、布局、筛选工具、用户习惯...
网络编辑部申请书.pdf
这部分内容提到的“标题关键词描述”是SEO(
搜索引擎
优化)的基础,通过精准的关键词选择和优化,可以提高网站在百度等
搜索引擎
的排名,从而增加网站流量。 网络优化则更侧重于对网站进行技术性和策略性的调整,以...
非技术区
23,406
社区成员
70,514
社区内容
发帖
与我相关
我的任务
非技术区
Java 非技术区
复制链接
扫一扫
分享
社区描述
Java 非技术区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章