HDFS快照

csdn特训营 2023-01-12 23:50:04

课时名称课时知识点
HDFS快照
...全文
71 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
资源下载链接为: https://pan.quark.cn/s/f989b9092fc5 HDFS快照是Hadoop分布式文件系统中一种记录特定时刻文件系统或目录状态的功能。它与数据备份不同,备份是数据的完整副本,而快照是记录数据在某一时刻的状态,不会随源目录改变而动态更新。 定义:快照记录了数据存储在特定时刻的状态,包括文件系统的结构和内容。 与备份的区别:备份是对整个文件系统或选定部分的完全拷贝,而快照创建的是一个逻辑视图,反映数据在某个时间点的状态,且不随源数据变化实时更新。 用途: 数据恢复:用户误操作导致数据丢失或损坏时,可通过快照恢复到之前状态。 数据备份:定期创建快照,用于备份整个HDFS集群或特定目录。 数据测试:用户可在快照上进行实验和测试,不影响原始数据。 HDFS快照采用“增量拷贝”技术,仅记录自上次快照以来发生变化的部分。具体表现为: 当文件或目录被修改时,对应的inode才会被快照复制,保存其原始状态。 快照不复制datanode中的数据块,而是保存块列表和文件大小,节省存储空间。 快照操作不影响常规HDFS操作,用户可直接访问当前数据,快照数据通过从当前状态减去后续修改来计算得出。 启用快照:必须先启用某个目录的快照功能,才能在此目录下创建快照。 禁用快照:不再需要快照功能时,可禁用,但需先删除所有相关快照。 命令操作: createSnapshot:创建快照,如hdfs dfsadmin -createSnapshot /testsnapshot test_snapshot。 deleteSnapshot:删除快照,如hdfs dfsadmin -deleteSnapshot /testsnapshot test_snapshot。 renameSnapshot:重命名快照,如hdfs dfsadmin -renameSnapshot /tes

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • csdn特训营
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧