わたしのブログ

わたしのブログ

PR

サイド自由欄

カレンダー

キーワードサーチ

▼キーワード検索

フリーページ

2010.11.12
XML
カテゴリ: ブログ
楽天ブログデータの吸い上げの続きです。

とりあえず新しく開設したホームページに楽天ブログのデータを置いてどう表示されるかを確認したかったので、データ吸い上げプログラムはいったんあきらめて他の方法を試すことにします。

ためしにInternet Explorerで楽天ブログを表示して、そのソースを表示してみることにしました。

!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"

から始まるHTMLファイルのソースが表示されました。

下のほうを見てみると、文章がみつかりました。
このデータをHOMEページに貼ってみることにします。


今回開設したNINJAホームページは、専用のエディタでデータを入力するのではなく、作成したHTML/JPEGファイル等を直接 FTPで置いて使うもののようです。

以前使っていた infoseek では専用エディタがあったので、HTMLタグ等を意識せずに作業をしていたのですが、そうはいきません。


楽天ブログ日付ページのソースをそのままホームページに貼ってみると





一応、表示されました。

漢字は化けています。
そして楽天ブログで上下左右に表示されていた、広告等のいろいろなものも表示されています。

今使用しているエディターでは漢字はSJISで編集してしまうので、Content-Typeを

content="text/html; charset=UTF-8"

content="text/html; charset=SJIS"

に変更します。



楽天ブログのページではどうやら

!-- rakuten_ad_target_begin --

のあたりからブログの文章がはじまります。

そして

!-- google_ad_section_end(name=rakuten1) --




まずは終わり部分を削除します。

!-- google_ad_section_end(name=rakuten1) --

の後から、最後の
[/body][/html]
の前までを削除します。

次に先頭部分を削除します。

[link rel="alternate"
から
[div id="diarydate"
の前までを削除します。

そして日付のあとの rss定義部も削除してみます。


FTPでNINJAホームページのFTPサーバーにファイルを置いて、ホームページ

http://bonbonblog.dousetsu.com/20100603.html

を表示してみます。


ブログ日記の文章が表示されます。

まだブログの更新日、コメント等のエリアが表示されています。

HTMLソースの
[br clear="all"]
から
[/DIV]
の前までを削除してみます。

そして再度 ftpでファイルを置きなおしてみると…

本文だけが表示されました。

NINJAホームページは広告ありのサイトなので、一番下になにやら広告が表示されていますが、これはどうしようもありません。

有料プランにすれば広告を消せるようですが、今回は無料で頑張るのがテーマなので、これは気にしないことにします。







お気に入りの記事を「いいね!」で応援しよう

最終更新日  2010.11.15 04:04:54
コメント(1) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: