30TB的网上图片数据库,给个建议

caomo 2002-01-30 12:09:07
老板压活
要做30TB的网上图片数据库,
要稳定可靠快速,便于检索和提取数据
一切从零开始,进行项目评估
我可没做过这么大的项目,哪能评估?
还希望有经验的大侠指点迷津
问题如下:
1。采用什么样的硬件配置,开销估算?
2。采用什么样的软件系统? (要做著录系统和发布系统)
Linux+Apache/Windows+IIS?,Oracle/SqlServer/MySQL? Java+jsp/Kylix+cgi/C#+ASP
.net?
或者其它
3.会存在哪些风险?和可能遇到哪些问题?
...全文
119 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
caomo 2002-02-02
  • 打赏
  • 举报
回复
where?
gzgangster 2002-01-30
  • 打赏
  • 举报
回复
1。采用什么样的硬件配置,开销估算?
#当然是越高档越好了,这么大数据量,数据库服务器一定要用专用的.开销多大,那样看你们老板舍得投入多大了.
2。采用什么样的软件系统? (要做著录系统和发布系统)
Linux+Apache/Windows+IIS?,Oracle/SqlServer/MySQL? Java+jsp/Kylix+cgi/C#+ASP
.net?
#具我所知MySQL的性能是不错,但在如此庞大的数据量面前,显然用它是不合适的,建议还是采用Soleris+Apache+Oracle.服务端JAVA,客户端采用JSP,WEB SERVER 采用TOMCAT.
3.会存在哪些风险?和可能遇到哪些问题?
#我个人认为这个项目最大的风险在于数据库端,如此庞大的数据量,无论是查询还是更新都会造成巨大的压力.除了数据库服务器的性能,关键要看数据库结构设计了.
1)我初步估计了一下,网络图片通常不会太大,平均一个算5K的话,那么30TB就有60亿条记录,如此大的数据放在一个库里,无论采用什么数据库(除非你用小型机和专用数据库),压力都是无法承受的,建议考虑采用分布数据库模式,也就是采用物理上独立的多个数据库存放数据.当然数据按什么标准分库,是一个值得好好斟酌的问题.
2)从用户实际需求入手,看看是否有减少数据搜索范围的可能.(我认为这极有可能,这么大的数据量不是对每个客户他都需要的,也许只是其中极少一部分).
3)数据表的关联一定要简洁,宁愿增加一定的仑余,也要保证表关系简洁.
4)尽量考虑采用后台查询的方式,通过视图和存储过程操纵数据.
Brain 2002-01-30
  • 打赏
  • 举报
回复
去买索引技术
yanchang 2002-01-30
  • 打赏
  • 举报
回复
30T?开电影院了!

还是已流的形式放到目录中吧,数据库放30T的数据?

Solaris + Oracle + weblogic + Java
100万

来套现成的IBM的
pengji 2002-01-30
  • 打赏
  • 举报
回复
别对我说你想把图片保存到数据库中哦!?
leojay 2002-01-30
  • 打赏
  • 举报
回复
据说MySQL的性能最好而且不要钱。
最大的问题我想应该是如何从30TB的数据中找你要的数据吧。
liurui80 2002-01-30
  • 打赏
  • 举报
回复
Linux+Apache/Windows+IIS?,估计30T的要用磁带机了,
我只知道做好了可以翻倍赚,你老板很有魄力啊!!
jxta 2002-01-30
  • 打赏
  • 举报
回复
好像很久以前讨论过一次????????
caomo 2002-01-30
  • 打赏
  • 举报
回复
谢谢,图片数量没有600M那么多,但是为了不失真,原图会是几十M一个。
故一算就是30TB了。
如果我们把问题规模缩小点,改为30GB缩略图加索引放在服务器中,其它数据放在光盘库或磁带库中以文件形式提供服务。
这样的话,是不是好点?
如果好点,对最初提出的三个问题又有何建议?
而且,这样的话,要让那么多光盘或磁带自动化服务也是个难题!多出一问:0
谁能提供应用实例方面的信息,我再多加分。
zlq 2002-01-30
  • 打赏
  • 举报
回复
1.估计访问量是多少?少的话一种较好的服务器都可以.
2.推荐使用LDAP(Lightweight Directory Access Protocol)模式(SINA也是用这种).
以50K每个图片算30TB就有600M的纪录数,恐怕只能选择ORACLE了才能进行快速检索.
3.带宽.
MySQL 教程MySQL 是流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。在本教程中,会让大家快速掌握 MySQL 的基本知识,并轻松使用 MySQL 数据库。什么是数据库数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。所以,现在我们使用关系型数据库管理系统(RDBMS)来存储和管理大数据量。所谓的关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。RDBMS 即关系数据库管理系统(Relational Database Management System)的特点:1.数据以表格的形式出现2.每行为各种记录名称3.每列为记录名称所对应的数据域4.许多的行和列组成一张表单5.若干的表单组成databaseRDBMS 术语 在我们开始学习MySQL 数据库前,让我们先了解下RDBMS的一些术语:数据库数据库是一些关联表的集合。数据表: 表是数据的矩阵。在一个数据库中的表看起来像一个简单的电子表格。列: 一列(数据元素) 包含了相同类型的数据, 例如邮政编码的数据。行:一行(=元组,或记录)是一组相关的数据,例如一条用户订阅的数据。冗余:存储两倍数据,冗余降低了性能,但提高了数据的安全性。主键:主键是唯一的。一个数据表中只能包含一个主键。你可以使用主键来查询数据。外键:外键用于关联两个表。复合键:复合键(组合键)将多个列作为一个索引键,一般用于复合索引。索引:使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构。类似于书籍的目录。参照完整性: 参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。MySQL 为关系型数据库(Relational Database Management System), 这种所谓的关系型可以理解为表格的概念, 一个关系型数据库由一个或数个表格组成, 如图所示的一个表格: 表头(header): 每一列的名称;列(col): 具有相同数据类型的数据的集合;行(row): 每一行用来描述某条记录的具体信息;值(value): 行的具体信息, 每个值必须与该列的数据类型相同;键(key): 键的值在当前列中具有唯一性。MySQL数据库MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL 是开源的,目前隶属于 Oracle 旗下产品。MySQL 支持大型的数据库。可以处理拥有上千万条记录的大型数据库。MySQL 使用标准的 SQL 数据语言形式。MySQL 可以运行于多个系统上,并且支持多种语言。这些编程语言包括 C、C++、Python、Java、Perl、PHP、Eiffel、Ruby 和 Tcl 等。MySQL 对PHP有很好的支持,PHP 是目前流行的 Web 开发语言。MySQL 支持大型数据库,支持 5000 万条记录的数据仓库,32 位系统表文件最大可支持 4GB,64 位系统支持最大的表文件为8TB。MySQL 是可以定制的,采用了 GPL 协议,你可以修改源码来开发自己的 MySQL 系统。Redis 教程REmote DIctionary Server(Redis) 是一个由 Salvatore Sanfilippo 写的 key-value 存储系统,是跨平台的非关系型数据库。Redis 是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库,并提供多种语言的 API。Redis 通常被称为数据结构服务器,因为值(value)可以是字符串(String)、哈希(Hash)、列表(list)、集合(sets)和有序集合(sorted sets)等类型。

23,404

社区成员

发帖
与我相关
我的任务
社区描述
Java 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧