社区
数据结构与算法
帖子详情
如何在一个压缩数据流中解压缩出指定原始数据中偏移位置的一块数据?
dxl
2001-01-06 03:10:00
比如有200M数据,压缩后得到100M的数据文件。要求在压缩后的数据中读出在原来200M
数据中偏移195M地方的100个字节数据,如何实现?可采用那一种压缩算法?请各位大虾
多多指教。
...全文
502
4
打赏
收藏
如何在一个压缩数据流中解压缩出指定原始数据中偏移位置的一块数据?
比如有200M数据,压缩后得到100M的数据文件。要求在压缩后的数据中读出在原来200M 数据中偏移195M地方的100个字节数据,如何实现?可采用那一种压缩算法?请各位大虾 多多指教。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Kevin_qing
2001-01-10
打赏
举报
回复
压缩算法一般是分块计算的,拟可以根据块的信息跳过部分数据,直到找到某块包含你所需数据的部分或者全部,在解压该块即可得到数据。
比如设有一数据流in;我们需要解压offset开始的128字节。
0.计数器Cur=0;
1.读in,查找记录该块解压后大小的记录nSize。
2.cur+=nSize;
3;if(cur>offset) goto 4;否则从in读到信息里面找到下一个块记录的地址,in=下一个块记录的地址,goto 1.
4;解压该块并计数,储存offset后128字节数据。
其实还有简单但是效率很低的方法。即从头开始解压,把不需要的数据丢弃即可。
boldragon
2001-01-10
打赏
举报
回复
dxl:
我想这跟某种具体的压缩方法有关的,因为压缩后的数据一般而言,其前后的相关性是很大的。首先你得了解用的是那种压缩方法,然后才有可能在压缩数据中正确的寻址。一般来说,压缩后的数据是块状的(当然块长可能是可变的),首先按块寻址(找到块头,得到其块长),然后就可以在块内寻址,找出具体所需的数据,再解压出这部分数据。
sundayboys
2001-01-06
打赏
举报
回复
只有看了zip算法的原程序才行。
whoo
2001-01-06
打赏
举报
回复
建议你从压缩入手,如分段压缩等.
或者找一个WinZip的原码研究研究.
如何在HDFS
中
进行
数据
压缩
以实现高效存储?
在上一节,我们介绍了在HDFS
中
组织
数据
的规则和方法。本节作为《Hadoop从入门到精通》专题的第四章第二节,将主要介绍如何在HDFS
中
进行
数据
压缩
,有哪些可选的
数据
压缩
方法等内容。
数据
压缩
是一种将
数据
简化为更紧凑形式的机制,以节省存储空间并提高
数据
传输效率。 4.2 通过
数据
压缩
实现高效存储
数据
压缩
是文件处理的重要方面,在处理Hadoop支持的
数据
大小时,这一点变得更加重要。大部分企业在使用Hadoop时,目标都是尽可能高效得进行
数据
处理,选择合适的
压缩
编解码器将使作业运行更快,并允许在集群
中
存储更多数
stream流的
解
压缩
如果你不确定你的Stream是使用什么
压缩
算法
压缩
的,你可能需要先确定这个信息。你可以通过读取Stream的前几个字节来检查这个信息,例如查看是否包含了GZip或Deflate的魔法数字。对于Stream对象,除了使用GZipStream或DeflateStream进行
解
压缩
之外,还可以使用其他的
解
压缩
库或API。需要注意的是,这段代码假设你的Stream是使用GZip
压缩
的。如果你的Stream包含的是.NET支持的
压缩
格式,例如GZip或Deflate,你可以使用。以下是
一个
简单的例子,展示如何使用。
C语言实例_
数据
压缩
与解压
数据
压缩
是通过一系列的算法和技术将
原始
数据
转换为更紧凑的表示形式,以减少
数据
占用的存储空间。
数据
解
压缩
则是将
压缩
后的
数据
恢复到原始的表示形式。
如何实现工作流引擎的任务
数据
压缩
与
解
压缩
1.背景介绍 在现代软件系统
中
,工作流引擎是一种常见的技术,用于管理和执行复杂的业务流程。随着
数据
规模的增加,如何有效地存储和处理任务
数据
成为了
一个
重要的问题。本文将讨论如何实现工作流引擎的任务
数据
压缩
与
解
压缩
,以提高系统性能和降低存储成本。 1. 背景介绍 工作流引擎是一种用于自动化业务流程的软件系统,它可以根据预定义的规则和流程描述自动执行任务。在现实生活
中
,工作流引擎广泛应用于银行、电...
Linux(程序设计):28---
数据
流
压缩
原理(Deflate
压缩
算法、gzip、zlib)
一、
压缩
原理
压缩
原理其实很简单,就是找
出
那些重复
出
现的字符串,然后用更短的符号代替, 从而达到缩短字符串的目的。比如,有一篇文章大量使用"
中
华人民共和国"这个词语, 我们用"
中
国"代替,就缩短了 5 个字符,如果用"华"代替,就缩短了6个字符。事实上, 只要保证对应关系,可以用任意字符代替那些重复
出
现的字符串 本质上,所谓"
压缩
"就是找
出
文件内容的概率分布,将那些
出
现概率高的部分代替成更短的形式。所以: 内容越是重复的文件,就可以
压缩
地越小。比如,"ABABABABABABAB"可以
压缩
成"7AB"
数据结构与算法
33,027
社区成员
35,335
社区内容
发帖
与我相关
我的任务
数据结构与算法
数据结构与算法相关内容讨论专区
复制链接
扫一扫
分享
社区描述
数据结构与算法相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章