gooブログのデータをMovableTypeに移行
gooブログのMTデータをMovableTypeに読み込む。
gooブログのデータをJekyllに移したかったのだけど、gooブログからエクスポートできるバックアップデータはMT形式のテキストファイルで、jekyll-importではインポートできない。残念ながら自分でimporterを作成する能力は持っていないので、回りくどい手順ではあるが、MovableTypeを立てて一度そこにインポートしてからJekyll-importでJekyll対応形式に変換した。ここではMovableTypeにインポートするまでの手順を示す。
gooブログから記事データをエクスポート
記事データのバックアップ・エクスポートを行うには有料サービスであるgooブログアドバンスまたはgooブログフォトへの加入が必要。
ブログ編集画面左のメニューから「バックアップ・書籍化」より、バックアップデータの作成手続きを取って、しばらくしてから同ページよりファイルをダウンロード・展開する。
ダウンロードしたテキストファイルは改行コードがCR+LFになっていて、これをLinux系OS上で動くMovableTypeにインポートしようとしても、記事が正しくインポートされない。改行コードをLFのみとして保存し直す必要がある。
画像ファイルを一括ダウンロードする
gooブログそのものには画像ファイルをバックアップする機能はなかったので、次のようにした。
ダウンロードしたテキストファイルをコピーして拡張子をhtmlにし、次のように編集してHTMLファイルにする。
<html><body>
- - テキストファイルの内容 - -
</body></html>
このHTMLファイルをFirefoxで開いて、プラグイン「DownThemAll」で埋め込み・リンク先の*.jpg, *.png
ファイルを一括ダウンロードした。
画像のリンクを書き換える
EmEditorの置換機能で正規表現を使ってimgタグのリンクを書き換えた。
- 検索文字列
src="http://blogimg\.goo\.ne\.jp/user_image/../../([^ ]*)"
- 置換文字列
src="http://newhost/img/\1"
データをMovableTypeにインポートする
特に説明するようなことはないが、先に書いたように改行コードの違いでインポートできなくなることがあるので、記事を1つもインポートできないときはこの点を確認してみる。
ここまでの作業は2時間かからなかったが、各記事間ページリンクの書き換えにとても手間が掛かった。ページ数が多ければいっそのことリンクを無効化してしまった方がいいのかも。