• 全部
  • 互动交流
  • 文章分享

求助,大文件分割问题

kttwq 2021-02-26 11:32:00
现在我有一个大文件几百G,在这个大文件里面查找特殊的二个字符字符串,比如 a,b字符串。现在要在这个大文件找到a与b对应的位置。a与b都是成对出现的。现在想找到a与b对应的位置。把文件写出来。现在遇到的问题是大文件操作不能直接read,或者告诉a或b的对应的位置。有什么好的办法解决
...全文
36 点赞 收藏 4
写回复
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
kttwq 02-26
谢谢大家,,问题已经解决,,通过正则表达式匹配就行,,用read太慢
回复
隐身 02-26
这样可以吗?

with open('bigfile.bin') as fr:
    while True:
        dat = fr.read(1024)
        if dat is None:
            break
        a_pos = dat.find('a')
        
回复
cclxpp123 02-26
不知道你要找的字符串具体什么情况, 如果长度小于某个值, 每次读取前把指针向左移动这个长度就可以覆盖分割的情况了.
回复
cclxpp123 02-26
每次读取一部分, 除了判断读取的部分有无符合, 还要判断上一部分的结尾和夏一部分的开头是否有符合但被分割的情况.
回复
相关推荐
发帖
脚本语言
创建于2007-08-27

3.7w+

社区成员

JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
申请成为版主
帖子事件
创建了帖子
2021-02-26 11:32
社区公告

CSDN 脚本语言社区接受专栏投稿(专栏会在顶部创建专属你的栏目),投稿需满足以下要求:

  • 脚本语言技术相关;
  • 文章持续更新,保持活跃;
  • 内容清晰明了,干货为主;
  • 文章排版有序,有条有理。

本社区开通招聘专栏,发布招聘信息请联系版主,发布者需要保证招聘信息真实有效,CSDN 平台和版主不对招聘内容负责!

联系方式:私聊版主、发送邮件、QQ联系等均可: