インターネット・アーカイブというアメリカのサイトがあります。
インターネット・アーカイブは、電子形態のあらゆるデータを収集し、インターネット上の大図書館を構想・構築を目指している、大規模なウェブサイトです。
インターネット・アーカイブのウェイバックマシンとは
そのデータとは、本や音楽、映画、ソフトウェアなど多岐に渡るのですが、その中の一つに「ウェブサイト」があります。ウェイバックマシン (Wayback Machine)というサービスで、自動的にインターネット上にあるウェブサイトを保存(「クロール」という)し、後から保存した時点の情報を見ることができるようにしています。(手動で、ウェブページを保存する、いわゆる魚拓サービスのようなこともできます。)
ある意味便利なサービスですが、自分が発信した情報・他人が発信した自分の不利益な情報が思わぬ形で半永久的に残ってしまうという怖さもあります。
たとえば、「昔に自分の顔写真をアップロードして、それが残ってしまっていた」「誰かが自分の個人情報や誹謗中傷を載せていて、アーカイブされてしまった」「自分の著作物が、他人の物として公開されてアーカイブされていた」などなど、かなりの問題点を含むサービスではあるのです。
自分のサイトがアーカイブされないようにする方法は、robots.txtを置く方法と、インターネット・アーカイブの運営者にメールを送る方法があります。
robots.txtでアーカイブされないようにする方法
カリフォルニア大学バークレー校のアーカイブ・ポリシーのページに削除について情報が載っています。
英語なので、Google翻訳などでページ翻訳するとよいでしょう。
robots.txtの作成方法はメモ帳などで、以下記入します。
User-agent: ia_archiver
Disallow: /
これをrobots.txtという名前をつけて保存して、サイトのディレクトリ直下に保存します。
たとえば、ドメインがcuro.jpであれば、curo.jp/robots.txtとなります。
これで、ウェイバックマシンがサイトにアクセスしてきたときに、このrobots.txtを読み込み、そのサイトを除外してくれます。
ただ、この方法だとrobots.txtが取り除かれたときに、再びアーカイブが見られるようになるらしいので、永久的に削除したい場合はあまりお勧めではありません。
メールを送ってアーカイブから削除してもらう
How can I have my site’s pages excluded from the Wayback Machine?
You can send an email request for us to review to info@archive.org with the URL (web address) in the text of your message.
https://archive.org/about/faqs.php
インターネット・アーカイブのFAQ(よくある質問と回答)によると、『自分のサイトをウェイバックマシンから取り除けますか?』『info@archive.orgへURL(ウェブサイトのアドレス)をメッセージに載せて私たちへメールを送ってください』とあります。
今回、試しに、curo.jpを申請してみました。
実は、robots.txtの方法も試してみたのですが、2週間ぐらい待ってもアーカイブされ続けていたため、メールで削除してもらうことにしました。
文面は日本語で書いて、Google翻訳で英語にして送りました。
自分がそのサイトの所有者であることの証明として、curo.jpのドメインからメールを送りました。
それができなければ、削除して欲しい旨のページを作って、サーバーにアップロードして、そのページのURLをメールに記載する方法も考えられます。
すでに、ドメインやサーバーの管理権限を手放していたり、著作権の侵害など他人が自分の著作をアップしていたなどで、サイトの所有者が自分であったことが証明できない場合でも、『アーカイブとそのアドバイザーによってケースバイケースで処理されます。 』とのことなので、諦めずにメールを送ってみてください。
info@archive.orgへメールを送ってみた結果ですが、2週間ぐらい待っても返事がきませんでした。
あれ?と思いインターネット・アーカイブのフォーラムなど調べてみると、受付先がinfo@archive.orgではなくなったようでした。公式にそう書いてあるところは見つけられませんでした。
同じく、フォーラムで調べてみると、wayback@archive.orgかwayback2@archive.orgに送ればよいという情報があり、そちらに送りました。2営業日ぐらいで、担当の方の名前のメールアドレスで返事があり、無事削除してくれました。
インターネット・アーカイブは半永久的にサイト情報をガチで残してくるところなので、サイトやブログ・ホームページなどを何らかの問題があって削除する場合は、アクセス権があるうちにインターネット・アーカイブも削除しておいた方がいいですね。
(サイトの所有者であることが証明できないと面倒そうなので。)
コメント