tar
tar(ター、tape archives)はファイルアーカイブのファイルフォーマットの一種である。このファイルフォーマットを処理する同名のUNIXコマンドtar
も指す。UNIXでは圧縮したtar形式のファイルを"tarball"(ターボール)と呼ぶこともある。POSIX.1-1988[3]やPOSIX.1-2001[4]で規格化され、UNIX系オペレーティングシステムでは標準のフォーマットである。Windows では Windows 10 Build 17063 (Version 1803) 以降からコマンドラインツールが標準搭載されていて[5]、File Explorer では Windows 11 Build 23493[6] (Version 22H2[7]) 以降は解凍に対応していて、Windows 11 Build 25992[8] (Version 24H2[9])以降は圧縮に対応している。
拡張子 | .tar |
---|---|
MIMEタイプ | application/x-tar |
タイプコード | "TARF" |
UTI | public.tar-archive |
マジック ナンバー | ustar\000 すなわち「ustar」、NUL、算用数字の零2個の計8バイト(POSIX tar)ustar\040\040 (GNU tar)(いずれも0から数えて257バイト目から) |
種別 | ファイルアーカイブ |
開発元 | GNUプロジェクト |
---|---|
最新版 |
1.35
/ 2023年7月18日[1] |
リポジトリ |
git |
プログラミング 言語 | C言語 |
ライセンス | GNU GPL v3 以降 |
公式サイト |
www |
最新版 |
3.7.3
/ 2024年4月8日[2] |
---|---|
リポジトリ |
github |
プログラミング 言語 | C言語 |
ライセンス | New BSD License |
公式サイト |
www |
機能
編集tarはファイルのアーカイブに用いられ、多数のファイルを一つのファイルにまとめることができる。ファイルのユーザ情報とグループ情報、パーミッション、最終更新日時、ディレクトリ構造などを同時にアーカイブすることができる。
圧縮・伸長
編集元来tarはアーカイブ、すなわち複数のファイルをまとめることのみで圧縮の機能はない。大半の場合アーカイブと同時にcompress、gzip、bzip2などの圧縮方法を用いて圧縮(いわゆるソリッド圧縮)を行う。これによりファイルの拡張子はそれぞれ .tar.Z
、.tar.gz
、.tar.bz2
となる。それぞれ略して .taZ
、.tgz
, .tbz2
とされることも多い。特に gzip は古くから良く使われている。
この形式はファイルが一部でも破損した場合、破損箇所に含まれていたファイル以降は取り出すことはできない。
ヘッダー
編集tarはファイルの属性などのいわゆるメタデータも一緒に含んでいる。以下のテーブルにUNIX tarフォーマットの一例を示す:
Pre-POSIX.1-1988 (i.e. v7):
オフセット | サイズ | 内容 |
---|---|---|
0 | 100 | ファイル名 |
100 | 8 | ファイルモード |
108 | 8 | 所有者 User ID |
116 | 8 | グループ User ID |
124 | 12 | ファイルサイズ(Byte) |
136 | 12 | 最終更新時刻(UNIX時間) |
148 | 8 | チェックサム |
156 | 1 | リンクインジケーター(通常ファイル、ハードリンク、シンボリックリンク) |
157 | 100 | リンクされたファイルの名前 |
コマンドオプション
編集以下は GNU Tar および bsdtar で共通で利用可能なオプションである。
- -c 新しいアーカイブを作成する
- -r アーカイブにファイルを追加する
- -t アーカイブの内容をリスト表示する
- -u アーカイブ内より新しいファイルを追加する
- -x アーカイブからファイルを取り出す
- -f file テープの代わりに指定したファイルをアーカイブする。これが指定されていない場合は環境変数 TAPE に従う。それもない場合の挙動はOSやコンパイル時の指定依存。
- -v 詳細メッセージを表示する
- -C directory directoryに移動してから操作を行う
- --newer date 指定した日付よりも新しいファイルだけをアーカイブに入れる(取り出す)
- -T file fileの中に記載されているファイル名をアーカイブに入れる(取り出す)。fileの中身は改行区切りで1行1ファイル名。
圧縮・伸長オプション
編集- -a もしくは --auto-compress アーカイブ作成時に拡張子から圧縮プログラムを自動的に決定する。解凍時は何も指定しなくても自動的に決まる。[10]
- compress は
.tar.Z
,.taZ
- gzip は
.tar.gz
,.tgz
,.taz
- bzip2 は
.tar.bz2
,.tz2
,.tbz2
,.tbz
- xz は
.tar.xz
- lzip は
.tar.lz
- lzma は
.tar.lzma
,.tlz
(ルールに一貫性がなく .tlz は lzip ではなく lzma になっている) - lzop は
.tar.lzo
- Zstandard は
.tar.zst
,.tzst
- compress は
- -Z もしくは --compress アーカイブをUNIX Compressで圧縮・伸長する
- -z もしくは --gzip アーカイブをgzipで圧縮・伸長する
- -j もしくは --bzip2 アーカイブをbzip2で圧縮・伸長する
- -J もしくは --xz アーカイブをxzで圧縮・伸長する
- --lzma アーカイブをlzmaで圧縮・伸長する
- --lzop アーカイブをlzopで圧縮・伸長する
- --zstd アーカイブをZstandardで圧縮・伸長する
2022年12月現在、GNU Tar 独自の物として --lzip があり、bsdtar 独自の物としては --lrzip や --lz4 がある。
圧縮レベルや並列圧縮を指定する方法は、
- GNU Tar の場合は tar -cf name.tar.zst -I "zstd -19 -T0" directory のように指定する。aの代わりにIで指定する。
- bsdtar の場合は tar -caf name.tar.zst --options=compression-level=19,threads=0 directory のように指定する。
コマンド例
編集以下は、圧縮・伸長のコマンド例である[11]。
圧縮。
tar -caf name.tar.gz directory
伸長。
tar -xf name.tar.gz
テープデバイス
編集テープデバイスに記録。
tar -cf /dev/nst0 directory
テープデバイスから読み出す。
tar -xf /dev/nst0
テープ上のファイルのリストを表示。リスト表示したいアーカイブファイルの先頭にテープを移動させた後、以下を実行。
tar -tf /dev/nst0
歴史
編集tarコマンドはTape ARchiveというその名の通り磁気テープの操作が念頭に置かれていた。fオプション[12]を省いた場合デフォルトで磁気テープデバイスを処理する。fオプションの指定によりファイルシステム上の任意の名前のファイルを処理できる。
tarballという言葉の由来は「リーマスじいや」の童話『タールの赤ん坊』に由来し[13]、それに油塊(タールボール)を引っ掛けたジョーク的用語である。
その歴史の長さゆえにシステム毎の方言やファイルサイズの制限など多くの非互換部分がある為、異なるシステム間のファイル交換を目的とする場合は慎重に利用する必要がある。近年は GNU Tar と bsdtar が一般的ではあるが、その他、様々な tar が存在する。Windows 10 以降や macOS に搭載されているのは bsdtar であり、Linux で一般的なのは GNU Tar である。BusyBox にも独自の tar が含まれている。
関連項目
編集脚注
編集- ^ “NEWS”. 2023年7月19日閲覧。
- ^ libarchive/NEWS at master · libarchive/libarchive - GitHub
- ^ "IEEE Std 1003.1-1988, IEEE Standard for Information Technology - Portable Operating System Interface (POSIX)"
- ^ "IEEE Std 1003.1-2001, IEEE Standard for Information Technology - Portable Operating System Interface (POSIX)"
- ^ Tar and Curl Come to Windows! | Microsoft Learn2023年9月4日閲覧。
- ^ “Announcing Windows 11 Insider Preview Build 23493”. Windows Insider Blog. 5 July 2023閲覧。
- ^ 株式会社インプレス. “TAR、RAR、7z……「エクスプローラー」で解凍できる形式が拡充、正式に提供開始/「Windows 11 バージョン 22H2」の2023年9月プレビューパッチ「KB5030310」で”. 窓の杜. 28 September 2023閲覧。
- ^ “Announcing Windows 11 Insider Preview Build 25992 (Canary Channel)”. Windows Insider Blog. 1 February 2024閲覧。
- ^ “IT 担当者向けのバージョン 24H2 Windows 11の新機能” (2024, 10/02). October 2, 2024閲覧。
- ^ “GNU tar 1.35: 8.1.1 Creating and Reading Compressed Archives”. gnu.org. 13 April 2024閲覧。
- ^ いずれも short option style での記法である。https://www.gnu.org/software/tar/manual/tar.html#Styles (2023年9月4日閲覧) によれば、記法には、long option style, short option style, old option style がある。old option style だと tar -tvf /dev/nst0 は tar tfv /dev/nst0 になる。
- ^ ファイル (file) の頭文字である。
- ^ “Jargon File - tarball”. 2010年11月27日閲覧。童話の日本語訳書はアナンシ#関連書籍を参照。