让Python在后台自动解压各种压缩文件!

一、需求描述

成都创新互联"三网合一"的企业建站思路。企业可建设拥有电脑版、微信版、手机版的企业网站。实现跨屏营销,产品发布一步更新,电脑网络+移动网络一网打尽,满足企业的营销需求!成都创新互联具备承接各种类型的成都网站设计、网站建设项目的能力。经过10多年的努力的开拓,为不同行业的企事业单位提供了优质的服务,并获得了客户的一致好评。

编写一个Python程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:

  • os 模块综合应用
  • glob 模块综合应用
  • 利用 gzip zipfile rarfile tarfile 模块解压文件

二、步骤分析和前置知识

码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:

  • 定时检测某个文件夹(如 download 文件夹)是否存在压缩文件
  • 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压缩文件

提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

  • gz: 即gzip,通常只能压缩一个文件
  • tar: 本质上不是压缩工具而是打包工具,可以跟.gz配合形成.tar.gz的打包压缩格式
  • zip: 和.tar.gz很类似但可以打包压缩多个文件
  • rar: 打包压缩文件,最初用于DOS

因此,文件是否为压缩文件的判断逻辑可以如下:

  • 建立一个含压缩包后缀的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  • 目标文件夹下的所有文件名运行filename.split(.)[-1]获取后缀名
  • 判断后缀名是否在compressed_lst中,如果存在则运行后续的解压代码
  • 如果是以gz结尾的文件,解压后需要再次判断是否是以.tar结尾,并进行相应处理

不同压缩文件的解压代码各不相同,在后续代码操作中具体展开。

三、代码实现

首先是获取 download 文件夹下所有文件的文件名

 
 
 
  1. import glob 
  2. import os 
  3.  
  4. path = r'C:\xxxx\download' 
  5. file_lst = glob.glob(path + '/*') 
  6. # 列表推导式 
  7. filename_lst = [os.path.basename(i) for i in file_lst] 
  8.  
  9. print(filename_lst) 

接下来根据文件的后缀名判断是否需要压缩,先看一下代码框架

 
 
 
  1. for i in filename_lst: 
  2.     if '.' in i: 
  3.         # 获取后缀名 
  4.         suffix = i.split('.')[-1] 
  5.         # 逐个将后缀名和各格式的压缩后缀匹配 
  6.         if suffix == 'gz': 
  7.             pass 
  8.             if ...: # 再次判断新产生的文件名是否以 .tar 结尾 
  9.                 pass 
  10.         if suffix == 'tar': 
  11.             pass 
  12.         if suffix == 'zip': 
  13.             pass 
  14.         if suffix == 'rar': 
  15.             pass 

这里有2个注意点:

  • 有些文件没有后缀名,因此可能不存在 .,这时用 filename.split('.')[-1]会报错,因此需要先判断
  • 以.gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,然后我们就可以分别将四种压缩文件的解压代码写成函数,符合时候单独调用即可

1. 处理.gz 文件

 
 
 
  1. import gzip 
  2.  
  3. def ungz(filename): 
  4.     filenamefilename = filename[:-3] # gz文件的单文件解压就是去掉 filename 后面的 .gz 
  5.     gz_file = gzip.GzipFile(filename) 
  6.     with open(filename, "w+") as file: 
  7.         file.write(gz_file.read()) 
  8.         return filename  # 这个gzip的函数需要返回值以进一步配合untar函数 

前面反复提及的gz文件有可能跟tar文件配合,因此解压gz文件后需要再判断是否有必要解开tar文件

这里就可以先把tar文件的函数写出来

2. 处理.tar文件

 
 
 
  1. import tarfile 
  2.  
  3. def untar(filename): 
  4.     tar = tarfile.open(filename) 
  5.     names = tar.getnames() 
  6.     # tar本身是将文件打包,解除打包会产生很多文件,因此需要建立文件夹存放 
  7.     if not os.path.isdir(filename + "_dir"): 
  8.         os.mkdir(filename + "_dir") 
  9.     for name in names: 
  10.         tar.extract(name, filename + "_dir/") 
  11.     tar.close() 

3. 处理.zip文件

 
 
 
  1. import zipfile 
  2.  
  3. def unzip(filename): 
  4.     zip_file = zipfile.ZipFile(filename) 
  5.     # 类似tar解除打包,建立文件夹存放解压的多个文件 
  6.     if not os.path.isdir(filename + "_dir"): 
  7.         os.mkdir(filename + "_dir") 
  8.     for names in zip_file.namelist(): 
  9.         zip_file.extract(names, filename + "_dir/") 
  10.     zip_file.close() 

4. 处理.rar文件

 
 
 
  1. import rarfile 
  2.  
  3. def unrar(filename): 
  4.     rar = rarfile.RarFile(filename) 
  5.     if not os.path.isdir(filename + "_dir"): 
  6.         os.mkdir(filename + "_dir") 
  7.     os.chdir(filename + "_dir") 
  8.     rar.extractall() 
  9.     rar.close() 

可以看到,四种解压代码略有不同,推荐大家实际演示中自己体会一下差别,解压后配合 os.remove() 就可以删除压缩包,现在看看逻辑框架补上解压函数后的内容:

 
 
 
  1. for filename in filename_lst: 
  2.     if '.' in filename: 
  3.         suffix = filename.split('.')[-1] 
  4.         if suffix == 'gz': 
  5.             new_filename = ungz(filename) 
  6.             os.remove(filename) 
  7.             if new_filename.split('.')[-1] == 'tar': 
  8.                 untar(new_filename) 
  9.                 os.remove(new_filename)   
  10.         if suffix == 'tar': 
  11.             untar(filename) 
  12.             os.remove(filename) 
  13.         if suffix == 'zip': 
  14.             unzip(filename) 
  15.             os.remove(filename) 
  16.         if suffix == 'rar': 
  17.             unrar(filename) 
  18.             os.remove(filename) 

5. 实现实时检测

比较简单的方法就是建立 while True 死循环配合 time.sleep()睡眠,框架如下:

 
 
 
  1. import time 
  2.  
  3. while True: 
  4.     func() 
  5.     time.sleep(5) # 睡眠秒数可以设置大一点避免过度占用资源 

最后将第二步的实现代码改为函数并放在循环框架中就可以完成本次需求,完整代码如下:

 
 
 
  1. import glob 
  2. import os 
  3. import gzip 
  4. import tarfile 
  5. import zipfile 
  6. import rarfile 
  7. import time 
  8.  
  9. path = r'C:\xxxx\download' 
  10. file_lst = glob.glob(path + '/*') 
  11. filename_lst = [os.path.basename(i) for i in file_lst] 
  12.  
  13. def ungz(filename): 
  14.     filenamefilename = filename[:-3] 
  15.     gz_file = gzip.GzipFile(filename) 
  16.     with open(filename, "w+") as file: 
  17.         file.write(gz_file.read()) 
  18.     return filename 
  19.  
  20. def untar(filename): 
  21.     tar = tarfile.open(filename) 
  22.     names = tar.getnames() 
  23.     if not os.path.isdir(filename + "_dir"): 
  24.         os.mkdir(filename + "_dir") 
  25.     for name in names: 
  26.         tar.extract(name, filename + "_dir/") 
  27.     tar.close() 
  28.  
  29. def unzip(filename): 
  30.     zip_file = zipfile.ZipFile(filename) 
  31.     if not os.path.isdir(filename + "_dir"): 
  32.         os.mkdir(filename + "_dir") 
  33.     for names in zip_file.namelist(): 
  34.         zip_file.extract(names, filename + "_dir/") 
  35.     zip_file.close() 
  36.  
  37. def unrar(filename): 
  38.     rar = rarfile.RarFile(filename) 
  39.     if not os.path.isdir(filename + "_dir"): 
  40.         os.mkdir(filename + "_dir") 
  41.     os.chdir(filename + "_dir") 
  42.     rar.extractall() 
  43.     rar.close() 
  44.  
  45. def unzip_files(): 
  46.     for filename in filename_lst: 
  47.         if '.' in filename: 
  48.             suffix = filename.split('.')[-1] 
  49.             if suffix == 'gz': 
  50.                 new_filename = ungz(filename) 
  51.                 os.remove(filename) 
  52.                 if new_filename.split('.')[-1] == 'tar': 
  53.                     untar(new_filename) 
  54.                     os.remove(new_filename) 
  55.             if suffix == 'tar': 
  56.                 untar(filename) 
  57.                 os.remove(filename) 
  58.             if suffix == 'zip': 
  59.                 unzip(filename) 
  60.                 os.remove(filename) 
  61.             if suffix == 'rar': 
  62.                 unrar(filename) 
  63.                 os.remove(filename) 
  64.  
  65. while True: 
  66.     unzip_files() 
  67.     time.sleep(5) 

网站栏目:让Python在后台自动解压各种压缩文件!
地址分享:http://www.mswzjz.cn/qtweb/news13/218213.html

攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能