现如今,硬盘的容量越来越大,数据和文件也越来越多。但很多时候,公司的硬盘的各处往往充满了重复文件,手工删除十分费劲。当我们在公司或企业里对这些数据进行备份时,会占用文件服务器很多硬盘空间,也会消耗很大的带宽和更多的硬件资源。学习重复数据的删除和实时备份将是企业的信息主管们的必修课,可以真正减轻自己的工作量,提升工作效率,也能够减少企业的开销。笔者这里给出相应的技术解决方案,供大家参考。 一、实现客户机的文件排重 一个单位、企业有很多的员工,每一位员工都使用一台客户机,员工们平时生成的文件都放在客户机上,而且重复文件很多。这些重复文件属于冗余数据,如果不删除,而是直接使用文件备份软件备份到文件服务器上,对于客户机、服务器和网络负载要求很好,也浪费这些资源。因此,我们首先要实现客户机的文件排重,之后再备份到文件服务器上。 第一步:下载软件 下载得到FindDump.rar压缩包,将其中的所有文件解压到一文件夹下,如f:\finddump下。
第二步:设置排重文件夹 进入f:\finddump文件夹,双击其中的dirlist.txt,里面填写欲排重的文件夹,如:c:\Walkbox\排重文件夹(如图1),表示要对“c:\Walkbox\排重文件夹”下的文件进行排重操作。如果有多个文件夹需要排重操作,也可以隔一行写上相应的路径即可,出现在后面的文件夹中的文件被认定为重复的文件。
第三步:暂时关闭360安全卫士 由于排重操作会调用系统底层的接口,所以会被360安全卫士误认为是木马或病毒,这时可以暂时关闭360安全卫士:右击任务栏托盘处360安全卫士图标,选择“退出”命令。在打开的窗口中选择“暂时关闭1小时”(如图2)。
小提示 如果您要进行排重操作的文件很多,那请将暂时关闭时间再延长一些,如暂时关闭3小时或暂时关闭8小时,甚至可以完全关闭退出。 第四步:生成MD5码 双击f:\finddump文件夹下的makemd5.cmd文件,此时会弹出如图3所示的窗口,表明正在生成MD5码,以供后面排重操作。此时一定不能关闭这个窗口,而要等待这个窗口自行消失。
小提示 如果你在中途不小心关闭了这个窗口,请双击makemd5.cmd文件重新开始生成MD5码。 第五步:关闭回收站 右击桌面上的“回收站”图标,选择“属性”命令,选择“不将文件移到回收站中。移除文件后立即将其删除( R)。”单选按钮,再单击“确定”按钮(如图4)。
进行这样设置后,我们排重的文件将不会被送入回收站而是直接删除掉! 小提示 ★如果您对于删除的重复文件仍想找回,可以不进行上述步骤。这样删除的重复文件将会被送至回收站,您只要不清空回收站,可以随时恢复; ★重复文件删除后,不要忘记开启回收站功能,以防止误删除的文件无法找回。 第六步:开始进行数据排重 双击f:\finddump文件夹下的cleandump.cmd文件即可开始排重操作(如图5),经过此操作后,c:\Walkbox\排重文件夹下的所有重复文件将会被删除掉。
二、清除字节数为0的文件和文件夹 同时,我们排重后的文件(夹)有可能会出现0字节的情况,所以我们有必要清理这些文件(夹),这里我们要用到xxcopy这个免费的软件。首先从http://www.xxcopy.com/download/xxcopy.zip处下载xxcopy.zip,然后将其中的所有文件解压到一文件夹下,根据操作系统的类别,进入32bit或64bit文件夹,再双击install.bat文件来进行安装。当安装程序询问时,一律按下Y键可把它安装到系统文件中,以方便调用。 接下来编写一个delfiles.cmd,内容如下: xxcopy . /rmdir /sz:0 /yy /wv0 xxcopy *.* /sz:0 /s /h /yy /rs /wv0 将此文件拷贝到c:\Walkbox\排重文件夹下,然后双击delfiles.cmd则会将其下的0字节的文件(夹)全部删除掉。
|
正在阅读:和力记易:删除重复数据 省出资源与带宽和力记易:删除重复数据 省出资源与带宽
2012-04-24 13:57
出处:PConline原创
责任编辑:wuweilong
键盘也能翻页,试试“← →”键
本文导航 | ||
|