请问:如何实现比较两个txt文件,存在的相同和不同的内容?

cixiang1999 2009-12-21 11:33:19
请问各位大虾:我现在有两个txt文本,我想对其进行比较,从而判断内容是否有差异,
例如:
aa.txt bb.txt
1 e 1
2 5
6 7 a
我的要求是对这两个txt进行判断,从而比较出不同的行次和值,相同的行次和内容,请问该怎么实现比较好呢?
...全文
1638 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
n915617214m 2009-12-22
  • 打赏
  • 举报
回复
学习
lyhoo163 2009-12-22
  • 打赏
  • 举报
回复
把两文件分别读入A、B(StringList)中:
1、两者排序;
2、由A循环逐行与B比较;(异记入C、同记入D)
3、由B循环逐行与A比较;(异记入C、同记入D)
4、显示同;
5、显示异。
bdmh 2009-12-21
  • 打赏
  • 举报
回复
如果是比较行,而且行数量不大的话,就是逐条比较,可以读到TStringlist中或者memo组件中,直接loadfromfile就可以加载文件
hjkto 2009-12-21
  • 打赏
  • 举报
回复
mark
wooden954 2009-12-21
  • 打赏
  • 举报
回复
这个比较复杂了,不知道楼主是不是在做类似版本管理系统的一个功能部分。
如果是的话,那我建议你下载一下WinMerge的软件来试用一下,看它的表现和逻辑。
体会一下它所使用的算法。
wzwcn 2009-12-21
  • 打赏
  • 举报
回复
如果文件不是很大,加载到两个TStringList里,然后一行一行比较
人鱼传说 2009-12-21
  • 打赏
  • 举报
回复
你自己根据你的需求改一改就能用.....

unit Unit1;

interface

uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, Buttons, RzButton, Mask, RzEdit, ComCtrls, RzTabs,
RzStatus, ExtCtrls, RzPanel;

type
TForm1 = class(TForm)
OpenDialog1: TOpenDialog;
RzEdit1: TRzEdit;
RzEdit2: TRzEdit;
RzBitBtn1: TRzBitBtn;
RzBitBtn2: TRzBitBtn;
RzBitBtn3: TRzBitBtn;
RzPageControl1: TRzPageControl;
TabSheet1: TRzTabSheet;
TabSheet2: TRzTabSheet;
RzRichEdit1: TRzRichEdit;
RzRichEdit2: TRzRichEdit;
RzStatusBar1: TRzStatusBar;
RzClockStatus1: TRzClockStatus;
RzStatusPane1: TRzStatusPane;
RzBitBtn4: TRzBitBtn;
procedure RzBitBtn3Click(Sender: TObject);
procedure RzBitBtn1Click(Sender: TObject);
procedure RzBitBtn2Click(Sender: TObject);
procedure RzBitBtn4Click(Sender: TObject);
private
{ Private declarations }
procedure search();
procedure uncontain;
procedure deletesame();
public
{ Public declarations }

end;

var
Form1: TForm1;
str1,str2,str3:tstringlist;
j2:integer;

implementation

{$R *.dfm}

procedure tform1.deletesame(); //删除相同的记录
var
i:integer;
tickcount:longword;
begin
tickcount:=gettickcount;
for i:=str1.Count-1 downto 0 do
begin
if (i>=1) and (str1.Strings[i]=str1.Strings[i-1]) then
str1.Delete(i);
end;
str1.SaveToFile('D:\delphi\tstringlist\test.txt');
showmessage(inttostr(gettickcount-tickcount)) //计算所用时间
end;

procedure tform1.uncontain; //列出比较文件里有,但源文件里没有的记录
var
mystr:string;
n,p:integer;
begin
p:=0;
for n:=0 to str2.Count-1 do
begin
if str1.IndexOf(str2.Strings[n])<0 then
str3.Add(str2.Strings[n]);
end;
str3.SaveToFile('D:\delphi\tstringlist\test.txt');
end;

procedure tform1.search(); //列出源文件里有,但比较文件里没有的。
var
i,j:integer;
begin
j:=0;
for i:=0 to str1.Count-1 do
begin
if (j<=str3.Count-1)and (str1.Strings[i]=str3.Strings[j]) then j:=j+1
else
begin
rzrichedit1.Lines.Add(str1.Strings[i]);
j2:=j2+1
end;
end;
end;

procedure TForm1.RzBitBtn3Click(Sender: TObject);
begin
rzrichedit1.Clear;
rzrichedit2.Clear;
try
str1:=tstringlist.Create;
str2:=tstringlist.Create;
str3:=tstringlist.Create;
str1.LoadFromFile(pchar(rzedit1.Text));
str2.LoadFromFile(pchar(rzedit2.Text));
str1.Sort;
str2.Sort;
if str1.Count<str2.Count then
application.MessageBox('The source file‘s line count couldn‘t allow more than the compare file。','Warning',mb_iconerror)
else
begin
deletesame;
uncontain;
// search;
rzstatuspane1.Caption:='count line: '+inttostr(j2)+' rows';
end;
finally
begin
str1.Free;
str2.Free;
str3.Free;
end;
end;
end;

procedure TForm1.RzBitBtn1Click(Sender: TObject);
begin
if opendialog1.Execute then
rzedit1.Text:=opendialog1.FileName;
end;

procedure TForm1.RzBitBtn2Click(Sender: TObject);
begin
if opendialog1.Execute then
rzedit2.Text:=opendialog1.FileName;
end;

procedure TForm1.RzBitBtn4Click(Sender: TObject);
begin
str1:=tstringlist.Create;
str1.LoadFromFile(pchar(rzedit1.Text));
str1.Sort;
deletesame;
end;

end.
yshuui 2009-12-21
  • 打赏
  • 举报
回复
用stringlist可以的。
可以看看文件比较的软件,看看他们怎么实现的。
实现合理的比较还是比较难。
wooden954 2009-12-21
  • 打赏
  • 举报
回复
如果多几行或少几行是不定的,那么需要考虑的就多了
wooden954 2009-12-21
  • 打赏
  • 举报
回复
楼主的要求我感觉比较复杂。
我觉得肯定不能两个文件TxtA.Line(X)和TxtB.Line(X)直接进行比较,而是有可能有如下情况:
TxtA TxtB
Line1 Line1
Line2 Line3 这里少了一行Line2
Line3 Line4
Line4

还有一种情况:
TxtA TxtB
Line1 Line1
Line2 NewLine 这里多了一行
Line3 Line2
Line4 Line3
Line4

这两种情况实际上是类似的情况,有一个是多了行,相对另外一个文件就是少了行。
但是在实际程序的比较过程中,这两种情况是不能互换的,比较需要指定一个是A一个是B
haitao 2009-12-21
  • 打赏
  • 举报
回复
这个需要专门的模块了吧

应该有开源的算法
Jekhn 2009-12-21
  • 打赏
  • 举报
回复
用文件流或者内存流加载两个文本文件,从文件头到文件尾一个字节一个字节去比较,
cixiang1999 2009-12-21
  • 打赏
  • 举报
回复
感谢,源码我下来了,可不懂C++,看源码有点困难,没找见实现算法的源码部分。
如果基于行的比较,把每行作为一个比较单位。每一个文件可以看作一个这样的整型数组。这样的话,比如10k个文件,这样就会有个10k x 10k的String数组,计算量会很大。
请问大侠们还有办法吗?
无语孩童 2009-12-21
  • 打赏
  • 举报
回复
用两个TStringList分别去读两个文件然后
开始循环 一行一行的比较
有哪行不一样,有多少行不一样,很快就得出
imho888 2009-12-21
  • 打赏
  • 举报
回复
如果你能确定每行的前几位不存在差异话,可以先排序,再比较
排序的时候记录原始行数
这样可能会比较快一点
DirectX修复工具(DirectX Repair)是一款系统级工具软件,简便易用。本程序为绿色版,无需安装,可直接运行。 本程序的主要功能是检测当前系统的DirectX状态,如果发现异常则进行修复。程序主要针对0xc000007b问题设计,可以完美修复该问题。本程序中包含了最新版的DirectX redist(Jun2010),并且全部DX文件都有Microsoft的数字签名,安全放心。 本程序为了应对一般电脑用户的使用,采用了傻瓜式一键设计,只要点击主界面上的“检测并修复”按钮,程序就会自动完成校验、检测、下载、修复以及注册的全部功能,无需用户的介入,大大降低了使用难度。 本程序适用于多个操作系统,如Windows XP(需先安装.NET 2.0,详情请参阅“致Windows XP用户.txt文件)、Windows Vista、Windows 7、Windows 8、Windows 8.1、Windows 8.1 Update、Windows 10,同时兼容32位操作系统和64位操作系统。本程序会根据系统的不同,自动调整任务模式,无需用户进行设置。 本程序的V3.3版分为标准版、增强版以及在线修复版。其中的标准版以及增强版都包含完整的DirectX组件。除此之外,增强版中还额外包含了c++ Redistributable Package,因此增强版不但能解决DirectX组件的问题,而且还能解决c++组件异常产生的问题。增强版适合无法自行解决c++相关问题的用户使用。在线修复版的功能与标准版相同,只是其所需的文件将通过Internet下载,因此大大减小了程序的体积。本程序的各个版本之间,主程序完全相同,只是配套使用的数据包不同。因此,当您使用标准版数据包时,程序将进行标准修复;当您使用增强版的数据包时,程序将进行增强修复;当数据包不全或没有数据包(即只有DirectX Repair.exe程序)时,程序将进行在线修复。在线修复、离线修复可自由灵活组合,充分满足不同用户的需要。 本程序自V2.0版起采用全新的底层程序架构,使用了异步多线程编程技术,使得检测、下载、修复单独进行,互不干扰,快速如飞。新程序更改了自我校验方式,因此使用新版本的程序时不会再出现自我校验失败的错误;但并非取消自我校验,因此程序安全性与之前版本相同,并未降低。 程序有自动更新c++功能。由于绝大多数软件运行时需要c++的支持,并且c++的异常也会导致0xc000007b错误,因此程序在检测修复的同时,也会根据需要更新系统中的c++组件。自V3.2版本开始使用了全新的c++扩展包,可以大幅提高工业软件修复成功的概率。修复c++的功能仅限于增强版,标准版及在线修复版在系统c++异常时(非丢失时)会提示用户使用增强版进行修复。 程序有两种窗口样式。正常模式即默认样式,适合绝大多数用户使用。另有一种简约模式,此时窗口将只显示最基本的内容,修复会自动进行,修复完成10秒钟后会自动退出。该窗口样式可以使修复工作变得更加简单快速,同时方便其他软件、游戏将本程序内嵌,即可进行无需人工参与的快速修复。开启简约模式的方法是:打开程序所在目录下的“Settings.ini”文件(如果没有可以自己创建),将其中的“FormStyle”一项的值改为“Simple”并保存即可。 程序有高级筛选功能,开启该功能后用户可以自主选择要修复的文件,避免了其他不必要的修复工作。同时,也支持通过文件进行辅助筛选,只要在程序目录下建立“Filter.dat”文件,其中的每一行写一个需要修复文件的序号即可。该功能仅针对高级用户使用,并且必须在正常窗口模式下才有效(简约模式时无效)。 本程序有自动记录日志功能,可以记录每一次检测修复结果,方便在出现问题时,及时分析和查找原因,以便找到解决办法。 程序的“选项”对话框中包含了4项高级功能。点击其中的“注册系统文件夹中所有dll文件”按钮可以自动注册系统文件夹下的所有dll文件。该项功能不仅能修复DirectX的问题,还可以修复系统中很多其他由于dll未注册而产生的问题,颇为实用。点击该按钮旁边的小箭头,还可以注册任意指定文件夹下的dll文件,方便用户对绿色版、硬盘版的程序组件进行注册。点击第二个按钮可以为dll文件的右键菜单添加“注册”和“卸载”项,方便对单独的dll文件进行注册。请注意,并不是所有的dll文件都可以通过这种方式注册。点击“DirectX版本”选项卡可以自行修改系统中DirectX的版本信息。点击“DirectX加速”选项卡可以控制系统中DirectX加速的开启与关闭。 新版程序集成了用户反馈程序,可以在用户允许的前提下发送检测修复结果。用户也可以在出现问题时通过反馈程序和软件作者进行交流,共同查找问题。反馈是完全自愿和匿名(如果不填写E-mail地址)的。 本程序的通用版基于Microsoft .NET Framework 2.0开发,对于Windows 2000、Windows XP、Windows 2003的用户需要首先安装.NET Framework 2.0或更高版本方可运行本程序。有关下载和安装的详细信息请参阅“致Windows XP用户.txt文件。对于Windows Vista、Windows 7及后续用户,可以直接运行本程序。 同时鉴于Windows 8(Windows 8.1、Windows 8.1 Update)、Windows 10系统中默认未包含.NET Framework 2.0,因此新版的程序文件夹内将包含一个DirectX_Repair_win8的特别版程序,该程序功能与通用版相同,基于.NET Framework 4.0开发,可以在Windows8(Windows 8.1、Windows 8.1 Update)、Windows 10系统中直接运行(其他系统如果安装了.NET Framework 4.0也可以运行这个特别版的程序)。 本程序的官方博客地址为:http://blog.csdn.net/vbcom/article/details/6962388 所有的更新以及技术支持都可以到该博客上找到。

5,935

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 开发及应用
社区管理员
  • VCL组件开发及应用社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧