わたしのブログ

わたしのブログ

PR

サイド自由欄

カレンダー

キーワードサーチ

▼キーワード検索

フリーページ

2010.11.19
XML
カテゴリ: ブログ
楽天ブログのページからどのような手順で全てのページを取り込むかを考えます。

自分のブログのトップページは http://plaza.rakuten.co.jp/bonbonbonblog/ です。

トップページでは最新の記事から順に過去へ戻っていきます。
トップページではいままでのブログ記事が全部表示されているわけではありません。

過去記事をたどるには次の方法があります。

(1) バックナンバーから各月の記事一覧を参照
 ただしトップページのバックナンバーエリアには最近の6ヶ月しか表示されていません。
 バックナンバーの リンクページ

(2) 全XXX件 のリンクからたどる
 トップページの上部には楽天購入メモというタイトルの右に「全XXX件」と表示されており、そこをクリックすると最新の100件の記事へのリンクが表示されます。
 >>もっと読むリンクをクリックすると(1)のバックナンバーリンクへたどり着きます

100件以下であれば(2)からたどるのが簡単なのですが、100件を超えている場合は(1)の方法でたどるのが確実のようです。

バックナンバーのページは http://plaza.rakuten.co.jp/bonbonbonblog/backnumber/ です。
ここには 2010.11,2010.10… といったリンクがありますが、これは
http://plaza.rakuten.co.jp/bonbonbonblog/backnumber/201011/
というURLを参照しています。

つまり、(トップページのURL)/backnumber/20YYMM/のようなURLで月ごとの記事一覧を順に検索していけばよいようです。

月ごとの記事一覧からは
http://plaza.rakuten.co.jp/bonbonbonblog/diary/201011280000/
これを取得し、記事中の楽天フォトへのリンク
img src="http://image.space.rakuten.co.jp/lg01/98/0001053798/09/img6d041c6azik1zj.jpeg" width="512" height="469" alt="P1100166s.jpg" border="0">
このURLのJPEGファイルを取得して保存するというアルゴリズムでプログラムを作ればうまくいきそうです。










お気に入りの記事を「いいね!」で応援しよう

最終更新日  2010.11.29 00:53:42
コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: