今日、Twitterでアルク社のウェブサイトから、「翻訳・通訳のトビラ」のコーナーが全部削除されているということを知った (via @nest1989)。11月11日の抜本的なリニューアルの際、「コンテンツ」の「整理」対象となったようだ。
「翻訳・通訳のトビラ」は、翻訳や通訳という作業について、実務に携わる方々による貴重なリソース集で、常に参照可能なレファレンスとして非常に重要な存在だったのだが、私企業にとっては「整理」すべき「コンテンツ」だったようだ。驚いたのは、寄稿者にも連絡なしで削除されたということで (via @yunod)、書籍だって絶版や断裁の前には著者に連絡が入るものだが……。
ごちゃごちゃ言っていても始まらないのでともあれ、今ならまだ間に合うのでWeb Archiveを利用してキャッシュを取得している。本稿はその手順について説明することを目的とする。
まず、アルク社のウェブサイト、alc.co.jpにアクセスしてもすでに「翻訳・通訳のトビラ」はなくなっているし、個別URLも404エラーになるが、alc.co.jpというドメインではなく、数字の羅列(にしか見えないもの)である「IPアドレス」にアクセスすると、今はまだいける。
「ドメイン」と「IPアドレス」については、かごやインターネットさんの説明がわかりやすいので、そちらをご参照のほど。
ホームページを運用するwebサーバーやメールを運用するメールサーバーなどには、IPアドレスという数字の住所が割り振られています。しかし、数字では人が覚えにくいため、その数字と紐づける形で「ドメイン」を使ったわかりやすい文字列によるホスト名が採用されているのです。
たとえば「www.kagoya.com」というホスト名のIPアドレスは「203.142.205.139」ですが、パソコンなどのコンピューターは、インターネット上の住所ともいえるIPアドレスを基に目的のホームページが収容されたwebサーバーにアクセスします。
https://www.kagoya.jp/howto/webhomepage/01/
この場合、ブラウザのアドレスバーに「www.kagoya.com」と入れても、「203.142.205.139」と入れても、同じウェブページが呼び出される(同じものが表示される)。
現状、alc.co.jpというドメインとリニューアル前のサイトのIPアドレスとを結ぶ回路が断ち切られている状態で、「翻訳・通訳のトビラ」の諸記事に関しては、旧IPアドレスの方に直接アクセスすれば中身はまだ見られるようだ。なので、旧IPアドレスを直接ブラウザのアドレスバーに入れればよい。
と、ここで私の手元には「210.146.253.72」というIPアドレスがある。信頼している方がDMで伝えてくださったものだ。どうやらこれがその旧IPアドレスのようだが、一応確認はしたい。ところが、ここでこのIPアドレスをそのままGoogle Chromeに打ち込んでも、下記画面のように警告が出てしまうので先に行けない。
警告の文面:
210.146.253.72 では、悪意のあるユーザーによって、パスワード、メッセージ、クレジット カードなどの情報が盗まれる可能性があります。
NET::ERR_CERT_COMMON_NAME_INVALID
警告の下部にある「詳細設定」(なぜ「設定」なのか、意味がわからん。Chromeのローカライズ担当者さん、しっかりして)をクリックすると(なぜか「詳細設定」が「詳細情報」に早変わりするんだけど):
文面:
このサーバーが 210.146.253.72 であることを確認できませんでした。このサーバーのセキュリティ証明書は *.alc.co.jp から発行されています。原因としては、不適切な設定や、悪意のあるユーザーによる接続妨害が考えられます。
これはSSLのセキュリティ証明書が失効しているときなんかに出てくる警告で、フィッシングなどのおそれはあるが、閲覧するだけならまあ大丈夫だろうと判断し、念のためにChromeの「シークレットモード (incognito window)」や「ゲスト」を使って先に進むことにする。Incognito windowを立ち上げて、210.146.253.72 とアドレスバーに入力し、ここまでと同じ手順で進んできて、さっきのキャプチャ画像内の一番下にある「210.146.253.72 にアクセスする(安全ではありません)」をクリック。
すると下記のような画面になる。(ちなみにこのキャプチャをとったときは私はTorブラウザを使っている。)
リニューアル後のサイトの見た目(下記)とは全然違うが、なじみのあるウェブページである。まあ、アルクさんだろう。
というわけで、教えていただいたIPアドレスが変なサイトではなさそうだということは独自に確認できたし、この「IPアドレス直打ち」の技でパブリックにアクセスできるうちに、Web Archiveに投げておくことにする。パブリックなものだった情報がなるべく多くサルベージできるようにしたい。
まず、教えていただいたIPアドレスで始まるURLは、「https://210.146.253.72/translator/article/tobira/ 」である。これをWeb Archiveに投げたのがこちら:
https://web.archive.org/web/20201114072050/https://210.146.253.72/translator/article/tobira/
↑これ↑で、「翻訳・通訳のトビラ」のトップページはWeb Archiveできたことになる。次は個別の記事の中身だ。それぞれバナーなどをクリックして、表示されたURLを片っ端からWeb Archiveに投げていく。"Save to the Wayback Machine" というChromeの拡張もあるが、サイト丸ごとのアーカイヴを作ろうとしているわけで、すでにトップページ(全体の目次)だけは取得できているのだから、少なくともここにある分は、上記トップページから閲覧していって、アーカイヴがないページに遭遇したらその都度取得するようにしたほうが早いだろう。
(ここにない分については、後述する。)
実際にWeb Archiveで取得してみよう。
まず、https://web.archive.org/web/20201114072050/https://210.146.253.72/translator/article/tobira/ (トップページ)にあるバナーをクリックしてみる。ここでは下記、「『はじめての海外文学スペシャル』動画レポート」の記事でやってみよう。
このバナーをクリックしたら、下記のような画面になった。これはまだWeb Archiveに登録されていないということだから、ここで登録してやらなければならない。やり方は簡単で誰にでもできる。
1. まずはページ下部の "Save this url in the Wayback Machine" のボタンをクリックする。
2. 遷移先のページで "SAVE PAGE" をクリック。その上にある "Save error pages (HTTP Status=4xx, 5xx)" はチェックを外してもいいけど入れたままでいい(現存するページについては基本的に関係ない)。
3. Web Archiveに保存されている間、少し待つ。数秒で済むこともあれば30秒以上かかることもある。
4. 完了画面はこうなる。ここで "A snapshot was captured. Visit page: ..." のリンクをクリックすることで、アーカイヴされたページを確認することができる。
5. 取得されたアーカイヴのページを確認する。
6. このページ内にさらに次のページや別記事へのリンクがつながっていたら(記事が複数ページにわたっている場合や、連載記事の場合)、その先のページについても同じ手順でアーカイヴを取得する。
この6の手順を忘れがちなので、漏れのないように取得したいところである。
というわけで、今日の夕方、私のほうでの進捗を下記のようにツイートしておいたが、そのあとまたさらに進んでいると思うので、まだ未取得なところを見つけた方は、上記の手順で取得していただければと思う。
承前、ALCさんサイトの「翻訳・通訳のトビラ」の件、キャッシュが残っているURLをお知らせいただいたのでWebArchiveに投げています。https://t.co/9L7g22UdMT ここまで作業済というメモ(キャプチャ)をこのツイートに添付していますので、お手すきの方、続きの取得をよろしくお願い致します。 m(_ _)m pic.twitter.com/0SBYu5d6Ax
— n o f r i l l s /共訳書『アメリカ侵略全史』作品社 (@nofrills) November 14, 2020
私一人でこの作業にかかりきりになる時間的な余裕はないので、 https://web.archive.org/web/20201114072050/https://210.146.253.72/translator/article/tobira/ にアクセスして、未取得のページに気づいた方は、上で説明した方法でアーカイヴを取得していただければと思う。実質クリック2回、確認も入れてクリック3回でできる作業ゆえ、なにとぞ。
→追記@11月15日未明: ネット友達から、↑上記ツイート↑内の画像で「未取得」になってるものは全部サルベージしたとの連絡をもらいました(ありがとうありがとう)。引き続き、ディープリンク(各ページ内に記載されているリンク)の取得にご協力ください。興味があって読んでみた記事に未取得があったら取得しておく、くらいの感じでお願いします。
※上で見たトップページに記事へのリンクがない場合※
「翻訳・通訳のトビラ」は何年もずーっと続いてきた定番サイトなので、過去の連載などは今のトップページからはたどれない。その場合も、URLさえわかっていれば、上記と同じ手順でアーカイヴ取得が可能である。
このコーナーの記事URLは、
https[colon]//www[dot]alc[dot]co[dot]jp/translator/article/tobira/foobar.html
という形だったはずである。
この "www[dot]alc[dot]co[dot]jp" の部分を今回使ったIPアドレスに置き換えて、
https[colon]//210[dot]146[dot]253[dot]72/translator/article/tobira/foobar.html
という形にしてから、Web Archiveで通常通りに取得すればよい。
少なくとも、210.146.253.72がパブリックにアクセスできるうちは、それで対応できる。作業はお早めにどうぞ。
この方法で、杉本優さん @yunod の連載、「コンピューターで仕事をする人のためのRSI対策ガイド」は全13回のサルベージに成功した。RSIは "Repetitive Strain Injury" の略で、同じ動作を1日に何度も何度も繰り返し行うことで腱などに発生する炎症などのこと。いわゆる「ばね指」「テニスひじ」や「腱鞘炎」もその一つで、私はもうずいぶん前から優さんのこの連載を(個人サイトでのご説明も含めて)参考にさせてもらってきた。無事サルベージできてよかった。
https://web.archive.org/web/20201114084759/https://210.146.253.72/translator/article/tobira/RSI_01.html
優さんの連載は、高橋聡さんの仕事環境記事 https://t.co/XL4A35jGmY の中にリンクがあって https://t.co/w6AEb3pmRi そこからURLの断片が取れたので、そこから連載全13回のキャッシュを取得中です。取り終えたらお知らせします。
— n o f r i l l s /共訳書『アメリカ侵略全史』作品社 (@nofrills) November 14, 2020
取れました 😀 https://t.co/Fi85rJPCwj ←最終回。右サイドバー(全部読み込むのに少し時間かかるかも)の「バックナンバー」から全記事閲覧可です。ほかに寄稿した記事があれば、 210[dot]146[dot]253[dot]72/translator/article/tobira/***.html のアステリ部分を手打ちすれば今はまだ出てくるはず
— n o f r i l l s /共訳書『アメリカ侵略全史』作品社 (@nofrills) November 14, 2020
※この記事は
2020年11月14日
にアップロードしました。
1年も経ったころには、書いた本人の記憶から消えているかもしれません。
【雑多にの最新記事】
- Twitterを「鍵アカ」にすると、「《検索したい語句》from:アカウント名」..
- 美しかった。ひたすらに。
- はてなブックマークでわけのわからないスターがつけられている場合、相手はスパマーか..
- 虚構新聞さんの "バンクシー?の「『バンクシー?のネズミの絵』見物客の絵」に見物..
- 当ブログがはてなブックマークでどうブクマされているかを追跡しなくなった理由(正確..
- 東京では、まだ桜が咲いている。
- あれから1年(骨折記)
- Google+終了の件: 問題は「サービス終了」だけではなく「不都合な事実の隠蔽..
- 当ブログに入れている広告を少し整理しました。
- 「書籍が無料」をうたうフィッシングサイトの言ってることが、「googleメンバー..