怎样进行海量网页管理?

仙侣步惊云 2019-02-19 03:21:57
开发一个智慧政务系统。主要从手机端浏览网页。各村、社区支部和镇、街道党委及市直部门党委(党组)动态报道党建信息,每天大约产生500条图文混排的网页。一年大约有20万个网页,再加上一些系统政务文件,大约也有5万条网页,全部是html格式。
这些网页应当怎样管理呢?
1、简单的进行文件夹管理。
把标题、路径(含文件名)、上传单位、日期存入数据库。文档按单位下建日期文件夹管理;
2、把网页保存为单个文件网页,以二进制保存进数据库。

由于几十万网页放在文件夹下,估计存取速度会有问题。请指点下。
...全文
140 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
仙侣步惊云 2019-02-20
  • 打赏
  • 举报
回复
对分布式存储不熟悉,您讲的太复杂了。
hookee 2019-02-20
  • 打赏
  • 举报
回复
可以按照标题等算个哈希值,根据哈希值的前n位进行分布式存储,分机器、硬盘、文件夹都可以。

61,115

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧