RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Python對壓縮文件的處理

馬哥Linux運維 ? 來源:Python編程學(xué)習(xí)圈 ? 作者:Python編程學(xué)習(xí)圈 ? 2022-03-29 11:29 ? 次閱讀

在日常工作中,除了會涉及到使用Python處理文本文件,有時候還會涉及對壓縮文件的處理。

通常會涉及到的壓縮文件格式有:
  • rar:Windows 環(huán)境下用的比較多的壓縮,比較著名的GUI工具是winrar
  • tar: Linux系統(tǒng)下的打包工具,只打包,不壓縮
  • gz:即gzip,通常只能壓縮一個文件。與tar結(jié)合起來就可以實現(xiàn)先打包,再壓縮。
  • tgz:即gz。先用tar打包,然后再用gz壓縮得到的文件
  • zip:不同于gzip,雖然使用相似的算法,可以打包壓縮多個文件,不過分別壓縮文件,壓縮率低于tar
  • 7z:7zip壓縮軟件支持的格式,壓縮效率較高。
當(dāng)然除了使用Python外,你還可以選擇使用壓縮解壓縮軟件或命令手動進行處理。

zip文件

zipfile是Python里用來做zip格式編碼的壓縮和解壓縮的module,zipfile里有兩個非常重要的class:ZipFile和ZipInfo。ZipFile是主要的類,用來創(chuàng)建和讀取zip文件,而ZipInfo是存儲的zip文件的每個文件的信息。 示例代碼:
import osimport zipfile

# 壓縮def make_zip(source_dir, output_filename):    zipf = zipfile.ZipFile(output_filename, 'w')    pre_len = len(os.path.dirname(source_dir))    for parent, dirnames, filenames in os.walk(source_dir):        for filename in filenames:            print(filename)            pathfile = os.path.join(parent, filename)            arcname = pathfile[pre_len:].strip(os.path.sep)  # 相對路徑            zipf.write(pathfile, arcname)        print()    zipf.close()

# 解壓縮def un_zip(file_name):    """unzip zip file"""    zip_file = zipfile.ZipFile(file_name)    if os.path.isdir(file_name + "_files"):        pass    else:        os.mkdir(file_name + "_files")    for names in zip_file.namelist():        zip_file.extract(names, file_name + "_files/")    zip_file.close()

if __name__ == '__main__':    make_zip(r"E:python_samplelibstest_tar_fileslibs", "test.zip")    un_zip("test.zip")

tar.gz文件

tarfile 模塊可以用來讀寫 tar 歸檔,包括使用 gzip, bz2 和 lzma 壓縮的歸檔。在使用tarfile是必須了解模式: mode 必須是 ‘filemode[:compression]’ 形式的字符串,其默認(rèn)值為 ‘r’。以下是模式組合的完整列表:

模式

動作

‘r’or‘r:*’

打開和讀取使用透明壓縮(推薦)。

‘r:’

打開和讀取不使用壓縮。

‘r:gz’

打開和讀取使用gzip 壓縮。

‘r:bz2’

打開和讀取使用bzip2 壓縮。

‘r:xz’

打開和讀取使用lzma 壓縮。

‘x’或‘x:’

創(chuàng)建tarfile不進行壓縮。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。

‘x:gz’

使用gzip壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。

‘x:bz2’

使用bzip2 壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。

‘x:xz’

使用lzma 壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。

‘a(chǎn)’or‘a(chǎn):’

打開以便在沒有壓縮的情況下追加。如果文件不存在,則創(chuàng)建該文件。

‘w’or‘w:’

打開用于未壓縮的寫入。

‘w:gz’

打開用于 gzip 壓縮的寫入。

‘w:bz2’

打開用于 bzip2 壓縮的寫入。

‘w:xz’

打開用于 lzma 壓縮的寫入。

針對特殊的目的,還存在第二種 mode 格式: ‘filemode|[compression]’。tarfile.open() 將返回一個將其數(shù)據(jù)作為數(shù)據(jù)塊流來處理的 TarFile 對象:

模式

動作

‘r|*’

打開 tar 塊的流以進行透明壓縮讀取。

‘r|’

打開一個未壓縮的 tar 塊的 stream 用于讀取。

‘r|gz’

打開一個 gzip 壓縮的 stream 用于讀取。

‘r|bz2’

打開一個 bzip2 壓縮的 stream 用于讀取。

‘r|xz’

打開一個 lzma 壓縮 stream 用于讀取。

‘w|’

打開一個未壓縮的 stream 用于寫入。

‘w|gz’

打開一個 gzip 壓縮的 stream 用于寫入。

‘w|bz2’

打開一個 bzip2 壓縮的 stream 用于寫入。

‘w|xz’

打開一個 lzma 壓縮的 stream 用于寫入。

代碼示例:

import osimport tarfileimport gzip

# 一次性打包整個根目錄。空子目錄會被打包。# 如果只打包不壓縮,將"w:gz"參數(shù)改為"w:"或"w"即可。def make_targz(output_filename, source_dir):    with tarfile.open(output_filename, "w:gz") as tar:        tar.add(source_dir, arcname=os.path.basename(source_dir))

# 逐個添加文件打包,未打包空子目錄??蛇^濾文件。# 如果只打包不壓縮,將"w:gz"參數(shù)改為"w:"或"w"即可。def make_targz_one_by_one(output_filename, source_dir):    tar = tarfile.open(output_filename, "w:gz")    for root, dir, files in os.walk(source_dir):        for file in files:            pathfile = os.path.join(root, file)            tar.add(pathfile)    tar.close()

def un_gz(file_name):    """ungz zip file"""    f_name = file_name.replace(".gz", "")    # 獲取文件的名稱,去掉    g_file = gzip.GzipFile(file_name)    # 創(chuàng)建gzip對象    open(f_name, "wb+").write(g_file.read())    # gzip對象用read()打開后,寫入open()建立的文件里。    g_file.close()  # 關(guān)閉gzip對象

def un_tar(file_name):    # untar zip file    tar = tarfile.open(file_name)    names = tar.getnames()    if os.path.isdir(file_name + "_files"):        pass    else:        os.mkdir(file_name + "_files")    # 由于解壓后是許多文件,預(yù)先建立同名文件夾    for name in names:        tar.extract(name, file_name + "_files/")    tar.close()

if __name__ == '__main__':    make_targz('test.tar.gz', "E:python_samplelibs")    make_targz_one_by_one('test01.tgz', "E:python_samplelibs")    un_gz("test.tar.gz")    un_tar("test.tar")

rar文件

我們可以使用rarfile來解壓.rar的文件,但是不支持用rarfile來壓縮rar文件。rarfile以下unrar組件,但是使用pip install unrar安裝后發(fā)現(xiàn)會報如下錯誤: Couldn’t find path to unrar library… 這是因為 Python下的 unrar 還依賴了RAR官方的庫。

Windows的安裝

  • 到RARLab官方下載庫文件,https://www.rarlab.com/rar/UnRARDLL.exe,然后安裝。
  • 安裝是最好選擇默認(rèn)路徑,一般在 C:Program Files (x86)UnrarDLL 目錄下。
  • 添加環(huán)境變量,在系統(tǒng)變量中新建變量名UNRAR_LIB_PATH,如果是64位系統(tǒng),就輸入 C:Program Files (x86)UnrarDLLx64UnRAR64.dll,如果是32位系統(tǒng)就是 C:Program Files (x86)UnrarDLLUnRAR.dll。
  • 確定保存環(huán)境變量后,在進行 pip install unrar 安裝,這時代碼再運行就不會報錯了。
Linux的安裝
  • 下載rar源文件:https://www.rarlab.com/rar/rarlinux-6.0.0.tar.gz
  • 解壓安裝包,進入安裝包目錄,編譯安裝,生成so 文件
  • 配置環(huán)境變量,完成后,在進行 pip install unrar 安裝
# cd /usr/local/src/# wget https://www.rarlab.com/rar/unrarsrc-6.0.3.tar.gz# tar zxvf unrarsrc-6.0.3.tar.gz# cd unrar# make lib# make install-lib  //生成libunrar.so 文件# vim /etc/profileexport UNRAR_LIB_PATH=/usr/lib/libunrar.so# source /etc/profile

代碼示例:

import rarfile

def unrar(rar_file, dir_name):    # rarfile需要unrar支持, linux下pip install unrar, windows下在winrar文件夾找到unrar,加到path里    rarobj = rarfile.RarFile(rar_file.decode('utf-8'))    rarobj.extractall(dir_name.decode('utf-8'))

7z文件

要壓縮和解壓縮.7z文件需要用到py7zr組件。代碼示例:
import py7zr
# 壓縮with py7zr.SevenZipFile("Archive.7z", 'r') as archive:    archive.extractall(path="/tmp")
# 解壓縮with py7zr.SevenZipFile("Archive.7z", 'w') as archive:archive.writeall("target/")


原文標(biāo)題:使用Python進行壓縮與解壓縮

文章出處:【微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4296

    瀏覽量

    85798
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    940

    瀏覽量

    54814
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4792

    瀏覽量

    84627

原文標(biāo)題:使用Python進行壓縮與解壓縮

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何在Linux使用unzip命令在終端解壓縮文件

    ZIP是最廣泛使用的存檔文件格式,支持無損數(shù)據(jù)壓縮。ZIP文件是一個數(shù)據(jù)容器,其中包含一個或多個壓縮文件或目錄。
    發(fā)表于 12-08 16:52 ?4795次閱讀

    winrar壓縮文件圖標(biāo)丟失(不見了)怎么辦? 不能顯示壓縮文件

    winrar壓縮文件圖標(biāo)丟失(不見了)怎么辦? 不能顯示壓縮文件答:運行WinRAR程序,在選項里點綜合,左面的WinRAR文件關(guān)聯(lián),全選,確定!如果不行的話可以先全部取消,再全部選中,試試.1
    發(fā)表于 11-12 12:17

    WinRAR壓縮文件我們該知道的幾個點【jiasuba】

    真正做到事半功倍。1.制作自解壓文件  如果你平時使用Win7系統(tǒng)下載的WinRAR來壓縮文件,而你的朋友也不會使用WinRAR,但你的數(shù)據(jù)又確實必須壓縮后才能夠給他。這時,我們就可以把RAR
    發(fā)表于 03-14 09:47

    NI LabVIEW 2013 License Activator壓縮文件

    NI LabVIEW 2013NI License Activator壓縮文件
    發(fā)表于 04-05 03:16

    壓縮文件可以使用pdf壓縮器嗎

    `  壓縮文件可以使用pdf壓縮器嗎?現(xiàn)在很多辦公人員都會編輯各種文檔格式的文件,也都掌握了將其它可編輯格式轉(zhuǎn)換為PDF文件格式的方法,但是有時候PDF
    發(fā)表于 10-27 14:03

    樹莓派壓縮文件

    請問各位,怎么用樹莓派壓縮文件夾?
    發(fā)表于 09-13 10:03

    在 Linux 上壓縮文件的 5 種方法

    在 Linux 上壓縮文件的 5 種方法 在 Linux 系統(tǒng)上有很多可以用于壓縮文件的工具,但它們的表現(xiàn)并不都是一樣的,也不是所有的壓縮效果都是一樣的。在這篇文章中,我們比較其中的五個工具
    發(fā)表于 05-07 15:25

    在 Linux 上壓縮文件的 5 種方法

    在 Linux 上壓縮文件的 5 種方法作者:Sandra Henry-Stocker 在 Linux 上有不少用于壓縮文件的命令。最新最有效的一個方法是 xz,但是所有的方法都有節(jié)省磁盤空間和維護
    發(fā)表于 05-13 15:45

    Linux如何壓縮文件

    在Linux上壓縮文件的5種方法
    發(fā)表于 12-30 08:00

    Qboot打包器無法打包fastlz壓縮文件怎么解決呢?

    Qboot打包器無法打包fastlz壓縮文件點擊打包跳出紅框, 選擇其他壓縮方式都能打包
    發(fā)表于 02-03 11:29

    壓縮文件管理器WinRAR安裝程序下載

    壓縮文件管理器WinRAR安裝程序下載
    發(fā)表于 08-31 10:45 ?15次下載

    鈦金系列壓縮與非壓縮文件多鏡像問題

    根據(jù)客戶的反饋和需求,我們做了一個Ti60壓縮與非壓縮文件的多鏡像與加載時間的驗證。
    的頭像 發(fā)表于 12-01 10:16 ?851次閱讀
    鈦金系列<b class='flag-5'>壓縮</b>與非<b class='flag-5'>壓縮文件</b>多鏡像問題

    如何在Linux上使用Pigz來更快地壓縮文件

    Pigz是一款快速壓縮文件的工具,它能夠使用多個CPU核心進行壓縮,使得壓縮速度得到了極大的提升。在本文中,我們將介紹如何在Linux上使用Pigz來更快地壓縮文件
    的頭像 發(fā)表于 05-12 16:42 ?2196次閱讀
    如何在Linux上使用Pigz來更快地<b class='flag-5'>壓縮文件</b>

    只讀壓縮文件系統(tǒng)EROFS的設(shè)計與實現(xiàn)

    EROFS是一個針對移動設(shè)備的只讀壓縮文件系統(tǒng)。作者觀察到,當(dāng)前手機配備的存儲空間不大,而安卓系統(tǒng)的系統(tǒng)分區(qū)、各種app占用的空間越來越大。導(dǎo)致用戶的實際可支配空間越來越小。如圖所示,安卓系統(tǒng)
    的頭像 發(fā)表于 08-31 15:09 ?2625次閱讀
    只讀<b class='flag-5'>壓縮文件</b>系統(tǒng)EROFS的設(shè)計與實現(xiàn)

    java中的壓縮文件是如何解壓與壓縮

    (String name):表示壓縮文件中的一個文件或者目錄 void putNextEntry(ZipEntry e):寫入新的壓縮文件或者目錄 ZipIutputStream:是一種
    的頭像 發(fā)表于 10-10 15:49 ?938次閱讀
    RM新时代网站-首页