请问:如何实现比较两个txt文件,存在的相同和不同的内容?

cixiang1999 2009-12-21 11:33:19
请问各位大虾:我现在有两个txt文本,我想对其进行比较,从而判断内容是否有差异,
例如:
aa.txt bb.txt
1 e 1
2 5
6 7 a
我的要求是对这两个txt进行判断,从而比较出不同的行次和值,相同的行次和内容,请问该怎么实现比较好呢?
...全文
1540 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
n915617214m 2009-12-22
  • 打赏
  • 举报
回复
学习
lyhoo163 2009-12-22
  • 打赏
  • 举报
回复
把两文件分别读入A、B(StringList)中:
1、两者排序;
2、由A循环逐行与B比较;(异记入C、同记入D)
3、由B循环逐行与A比较;(异记入C、同记入D)
4、显示同;
5、显示异。
bdmh 2009-12-21
  • 打赏
  • 举报
回复
如果是比较行,而且行数量不大的话,就是逐条比较,可以读到TStringlist中或者memo组件中,直接loadfromfile就可以加载文件
hjkto 2009-12-21
  • 打赏
  • 举报
回复
mark
wooden954 2009-12-21
  • 打赏
  • 举报
回复
这个比较复杂了,不知道楼主是不是在做类似版本管理系统的一个功能部分。
如果是的话,那我建议你下载一下WinMerge的软件来试用一下,看它的表现和逻辑。
体会一下它所使用的算法。
wzwcn 2009-12-21
  • 打赏
  • 举报
回复
如果文件不是很大,加载到两个TStringList里,然后一行一行比较
人鱼传说 2009-12-21
  • 打赏
  • 举报
回复
你自己根据你的需求改一改就能用.....

unit Unit1;

interface

uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, Buttons, RzButton, Mask, RzEdit, ComCtrls, RzTabs,
RzStatus, ExtCtrls, RzPanel;

type
TForm1 = class(TForm)
OpenDialog1: TOpenDialog;
RzEdit1: TRzEdit;
RzEdit2: TRzEdit;
RzBitBtn1: TRzBitBtn;
RzBitBtn2: TRzBitBtn;
RzBitBtn3: TRzBitBtn;
RzPageControl1: TRzPageControl;
TabSheet1: TRzTabSheet;
TabSheet2: TRzTabSheet;
RzRichEdit1: TRzRichEdit;
RzRichEdit2: TRzRichEdit;
RzStatusBar1: TRzStatusBar;
RzClockStatus1: TRzClockStatus;
RzStatusPane1: TRzStatusPane;
RzBitBtn4: TRzBitBtn;
procedure RzBitBtn3Click(Sender: TObject);
procedure RzBitBtn1Click(Sender: TObject);
procedure RzBitBtn2Click(Sender: TObject);
procedure RzBitBtn4Click(Sender: TObject);
private
{ Private declarations }
procedure search();
procedure uncontain;
procedure deletesame();
public
{ Public declarations }

end;

var
Form1: TForm1;
str1,str2,str3:tstringlist;
j2:integer;

implementation

{$R *.dfm}

procedure tform1.deletesame(); //删除相同的记录
var
i:integer;
tickcount:longword;
begin
tickcount:=gettickcount;
for i:=str1.Count-1 downto 0 do
begin
if (i>=1) and (str1.Strings[i]=str1.Strings[i-1]) then
str1.Delete(i);
end;
str1.SaveToFile('D:\delphi\tstringlist\test.txt');
showmessage(inttostr(gettickcount-tickcount)) //计算所用时间
end;

procedure tform1.uncontain; //列出比较文件里有,但源文件里没有的记录
var
mystr:string;
n,p:integer;
begin
p:=0;
for n:=0 to str2.Count-1 do
begin
if str1.IndexOf(str2.Strings[n])<0 then
str3.Add(str2.Strings[n]);
end;
str3.SaveToFile('D:\delphi\tstringlist\test.txt');
end;

procedure tform1.search(); //列出源文件里有,但比较文件里没有的。
var
i,j:integer;
begin
j:=0;
for i:=0 to str1.Count-1 do
begin
if (j<=str3.Count-1)and (str1.Strings[i]=str3.Strings[j]) then j:=j+1
else
begin
rzrichedit1.Lines.Add(str1.Strings[i]);
j2:=j2+1
end;
end;
end;

procedure TForm1.RzBitBtn3Click(Sender: TObject);
begin
rzrichedit1.Clear;
rzrichedit2.Clear;
try
str1:=tstringlist.Create;
str2:=tstringlist.Create;
str3:=tstringlist.Create;
str1.LoadFromFile(pchar(rzedit1.Text));
str2.LoadFromFile(pchar(rzedit2.Text));
str1.Sort;
str2.Sort;
if str1.Count<str2.Count then
application.MessageBox('The source file‘s line count couldn‘t allow more than the compare file。','Warning',mb_iconerror)
else
begin
deletesame;
uncontain;
// search;
rzstatuspane1.Caption:='count line: '+inttostr(j2)+' rows';
end;
finally
begin
str1.Free;
str2.Free;
str3.Free;
end;
end;
end;

procedure TForm1.RzBitBtn1Click(Sender: TObject);
begin
if opendialog1.Execute then
rzedit1.Text:=opendialog1.FileName;
end;

procedure TForm1.RzBitBtn2Click(Sender: TObject);
begin
if opendialog1.Execute then
rzedit2.Text:=opendialog1.FileName;
end;

procedure TForm1.RzBitBtn4Click(Sender: TObject);
begin
str1:=tstringlist.Create;
str1.LoadFromFile(pchar(rzedit1.Text));
str1.Sort;
deletesame;
end;

end.
yshuui 2009-12-21
  • 打赏
  • 举报
回复
用stringlist可以的。
可以看看文件比较的软件,看看他们怎么实现的。
实现合理的比较还是比较难。
wooden954 2009-12-21
  • 打赏
  • 举报
回复
如果多几行或少几行是不定的,那么需要考虑的就多了
wooden954 2009-12-21
  • 打赏
  • 举报
回复
楼主的要求我感觉比较复杂。
我觉得肯定不能两个文件TxtA.Line(X)和TxtB.Line(X)直接进行比较,而是有可能有如下情况:
TxtA TxtB
Line1 Line1
Line2 Line3 这里少了一行Line2
Line3 Line4
Line4

还有一种情况:
TxtA TxtB
Line1 Line1
Line2 NewLine 这里多了一行
Line3 Line2
Line4 Line3
Line4

这两种情况实际上是类似的情况,有一个是多了行,相对另外一个文件就是少了行。
但是在实际程序的比较过程中,这两种情况是不能互换的,比较需要指定一个是A一个是B
haitao 2009-12-21
  • 打赏
  • 举报
回复
这个需要专门的模块了吧

应该有开源的算法
Jekhn 2009-12-21
  • 打赏
  • 举报
回复
用文件流或者内存流加载两个文本文件,从文件头到文件尾一个字节一个字节去比较,
cixiang1999 2009-12-21
  • 打赏
  • 举报
回复
感谢,源码我下来了,可不懂C++,看源码有点困难,没找见实现算法的源码部分。
如果基于行的比较,把每行作为一个比较单位。每一个文件可以看作一个这样的整型数组。这样的话,比如10k个文件,这样就会有个10k x 10k的String数组,计算量会很大。
请问大侠们还有办法吗?
无语孩童 2009-12-21
  • 打赏
  • 举报
回复
用两个TStringList分别去读两个文件然后
开始循环 一行一行的比较
有哪行不一样,有多少行不一样,很快就得出
imho888 2009-12-21
  • 打赏
  • 举报
回复
如果你能确定每行的前几位不存在差异话,可以先排序,再比较
排序的时候记录原始行数
这样可能会比较快一点

5,388

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 开发及应用
社区管理员
  • VCL组件开发及应用社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧