PR
Freepage List
Calendar
Comments
WEBページのデータを取得するプリグラムって、どうやればいいかなーと思っていろいろ調べるんだけど、いいのがない・・・ やりたいことは、ある特定のサイトのWEBページのテーブルタグ内のデータを取得して、DBに保存するだけなんだけど・・・・
Excelの機能で、WEBクエリっていう機能があるんだけど(WEBページの一部を指定して、動的にシート内容を更新する機能)これでなんとかならんのかと、検討してみました。が、ダメでした・・・
だめな理由:
1.遅い。
2.サーバーにExcelが入っていないとダメ。
で、結局手作りに方針転換。
WEBページのデータを丸ごとダウンロードし、HTMLを解析するクラスを作成し、特定のテーブルを検索し、そのテーブル内のデータを取得することにしました。
なんとか、HTMLを解析するクラスのプロトタイプを作成し、現在テスト中っす・・・・
いちおうExcelのWEBクエリより10倍程度速度は早いです・・・・
単純にWEBページのテーブルのデータを拾って、CSVか何かに保存するのって、すげー簡単に思えるけど、結構大変です。
MTをVISTAにインストール 2009.07.08 コメント(32)
鹿児島市SOHO支援イベント 6月6日(土) 2009.05.30
久しぶりの書き込み 2009.04.17