わたしのブログ

わたしのブログ

PR

サイド自由欄

カレンダー

キーワードサーチ

▼キーワード検索

フリーページ

2025.01.17
XML
カテゴリ: PCソフト
latitude 3120で保存している 楽天ブログのアクセスレポートなどWebページは、
Webページの状態で見て確認できるように「ウェブページ、完全(*htm,*.html」の形式で保存しています。


WebページをSave Asダイアログで ファイル名として 20250105 と入力して保存すると次のようなファイルが保存されています。

20250105.htm  :ファイル
20250105_files/ :フォルダ(関連ファイルが保存される)

20250105.htm ファイルをダブルクリックして表示しようとすれば、 Edgeなどで元のURLのページの内容が画像等を含めてほぼ完全に表示されます。

保存されたファイルを使って Windows上で作業をしていて、おかしなことに気づきました。

☆コピー・移動
データの処理で使うのは htmファイルだけなので、 htmファイルをコピーしようとExplorer で作業用フォルダにコピーすると、コピー先には自動的に files フォルダもついてきます。


データの確認・処理が終わったら、 files フォルダはもういらないので、 Explorerでfilesフォルダを選択して削除すると .htm ファイルまで一緒に消えてしまいます。

この仕組みのことを全く理解しておらず、はまってしまいました。
(意図せず htmファイルを消してしまいました)

調べると 20年前からこのような実装がされているようです。
(office2003をインストールすると…)

そこで、いったいどういう仕組みなのか調べてみました。


☆実験1(Windows上でExplorer以外でコピー・削除)

(1) コマンドプロンプト
WindowsマシンでExplorer 以外で簡単にファイルを操作できるのは(自分の場合は)コマンドプロンプトです

コマンドプロンプトで copyコマンドで htm ファイルをコピーすると…
XXX.htmファイルだけコピーできます


XXX.htmファイルだけ削除できます

コマンドプロンプトで rmdirコマンドで filesフォルダを削除すると…
XXX_files フォルダだけ削除できます

(2) 別OSとフォルダを共有して、別OSで削除
VirtualBoxで Ubuntuをインストールして、Ubuntuと共有したフォルダに htm/filesをコピーしてから、 Ubuntuで操作するとどうなるかの実験です


XXX.htmファイルだけコピーできます

rmコマンドで htm ファイルを削除すると…
XXX.htmファイルだけ削除できます

rm -r コマンドで filesフォルダを削除すると…
XXX_files フォルダだけ削除できます

(3) 実験結果
Windowsのファイルシステムで何か特殊なことをしているのではなく、Explorer が特殊な処理をしているということがわかります
20年以上前から実装はかわってなさそうです


☆実験2(Explorer以外で、作成)

Ubuntu で作成したファイル・フォルダが Windowsからどう見えている・操作されるかの実験です

(1) XXX.htmとXXX_filesディレクトリを作成(拡張子 htmと_files)
次のコマンドでXXX.htmとXXX_filesディレクトリを作成します
touch XXX.htm
mkdir XXX_files

生成した htmファイル、あるいは filesフォルダをExplorerで コピー・削除すると、filesフォルダ・htmファイルも一緒にコピー・削除されます

(2) XXX.htmlとXXX_filesディレクトリを作成(拡張子 htmlと_files)
次のコマンドでXXX.htmlとXXX_filesディレクトリを作成します
touch XXX.html
mkdir XXX_files

生成した htmlファイル、あるいは filesフォルダをExplorerで コピー・削除すると、filesフォルダ・htmlファイルも一緒にコピー・削除されます

(3) XXX.htmとXXX.filesディレクトリを作成(.files)
次のコマンドでXXX.htmとXXX.filesディレクトリを作成します
touch XXX.htm
mkdir XXX.files

生成した htmファイル、あるいは filesフォルダをExplorerで コピー・削除すると、filesフォルダ・htmファイルも一緒にコピー・削除されます

(4) 実験結果
Explorer は特別な管理情報を使っているのではなく、ファイル名・フォルダ名から関連付けの判断をしていることがわかります

XXX.htm ファイル、または XXX.html ファイルを操作した場合は XXX.files または XXX_filesフォルダがあれば連携したファイル群だと自動的判断して、一緒にコピー・削除するという実装のようです。
ファイルシステムは特殊なことをやってなさそうなので、 Exploreでない Explorerのような処理ができるアプリを使えば(互換動作の実装をしていなければ)、連動させずに処理ができるはずです。

ーーー

Windows 7 以前の Explorerだと上記の動作は設定で変更できたらしいのですが、Windows 10ではそのような設定はなさそうです。


普通はあまり気にならないのでしょうか?

Explorerを使わずに、スクリプトを作って作業をすれば必要な htmファイルだけコピーしたり、不要な _filesフォルダを削除できることがわかったので一安心です。

ーーー

(XXX/diary/202501170001/のような)拡張子のないURLをブラウザで保存したときにできるファイルの拡張子はFireFoxだけ異なるようです

・Edge
楽天ブログ_files
楽天ブログ.html
・Chrome
楽天ブログ_files
楽天ブログ.html
・FireFox
楽天ブログ_files
楽天ブログ.htm
・Opera
楽天ブログ_files
楽天ブログ.html

ーーー
googleで「explorer _files html」で検索
googleで「Webページとフォルダを対にして管理」で検索

ーーー
2025/1/17 13:00 公開
2025/1/18 2:39 googleで検索可能

ーーー 関連記事 ーーー
20250114 保存した XXX.htm(.html)ファイルとXXX_files(XXX.files)ディレクトリ(htmファイルを消してしまった)
20250114 Webページの自動保存が止まっていたので調べてみました(再起動履歴の確認とアプリの自動起動設定)
20250111 楽天ブログのアクセスレポートを定期的に自動保存してみました(UWSCを使ってみた)
20250110 Latitude 3120をWake On Lanできるようにしました
20250109 NVMe (2280) SSDを購入しようと思って値段を調べました(2025/1)
20250108 Lattitude 3120のSSD換装(128GB→256GB)

ーーー 広告 ーーー





お気に入りの記事を「いいね!」で応援しよう

最終更新日  2025.01.18 16:26:37
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Design a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: