想问一个问题,是关于鉴定文档是够被修改过的
比如我的D盘下面有一个tmp.txt,里面的内容是我从网页上面下载得到的源代码:
比如这里的:
http://outlet.lenovo.com/SEUILibrary/controller/e/outlet_us/LenovoPortal/en_US/catalog.workflow:item.detail?GroupID=445&Code=1291XF7
这样的一个商品,我每次检索的时候,都会把他的这个网页的源代码保存到d盘的tmp.txt中;
但是有这样的一个情况,这个商品可能在几天之后价格会发生改变,那么我的去修改这个txt文件。
目前经过人工测试,改变的情况不多,可是我目前处理是,无论他改不改变,我都把信息重新写到txt中,这样一来我在测试数据较多的情况,就会有点鸡肋。
问这么一个问题,我怎样和这个txt比对,发现网页中的数据改变之后,才去重新把对应webpage上面的源代码下载下来?
听过这么一个词,叫做全文hash的。但是没搜索到这方面的文档。