■Lifenaviの幸せの法則は保証思考から

■Lifenaviの幸せの法則は保証思考から

November 1, 2003
XML
カテゴリ: カテゴリ未分類
KJマーカー図解エクセルのフリーソフト

思いついたことや、何かのテーマについて、思考や発想をまとめるのに、役立つ、エクセルのソフトです。

他にも、役立つソフトを開発されている製作者の方です。

下記サイトからダウンロードできます。

http://www.vector.co.jp/vpack/browse/person/an020755.html


検索エンジンのスパイダー

検索エンジンを理解するには、検索エンジンのスパイダーを理解することから全てが始まります!「スパイダー」以外にも「ロボット」や「クローラー」と呼ばれることもあるのですが、スパイダーとは検索エンジンがインターネット上の情報を収集するためのソフトウェアプログラムにことを指します。

何故「スパイダー」と言う呼び名がついているかと言うと、インターネットでつながれたウェブサーバーのネットワークをWWW(ワールド・ワイド・ウェブ)と呼ぶことはご存知かと思いますが、この「World Wide Web」、直訳すると「世界規模の蜘蛛の巣」を巡回するプログラムと言うことで「Spider」、すなわち「蜘蛛」と呼ばれています。

スパイダーはその名の通り、常にインターネット上を巡回し、ウェブサイトからウェブサイトを移動して、すでに登録されているウェブサイトの最新の情報を取得し、また新しいウェブサイトの情報も新たに獲得していきます。スパイダーは通常、ウェブサイトのトップページにアクセスし、その後、トップページのリンクを辿ってサイト内のページを順番に巡回していきます。そしてサイト内のページ上のリンクを辿ってさらにサイトの奥深くのページ情報も収集していきます。また途中で外部サイトへのリンクがあった場合は外部サイトの情報も後で収集しに行きます。

もちろんスパイダーの種類、性能によって1つのウェブサイト内の情報をどれだけ収集していくかには差があります。検索エンジンとは?のページでは検索エンジンのディレクトリへの優位性として、ウェブサイト内の情報をトップページだけではなく下層のページ情報も収集することを上げましたが、インターネット上に大量の情報が存在する現在、検索エンジンのスパイダーにも高度な技術が要求されます。例えば現在の主力検索エンジンであるGoogleは30億ページ以上のウェブページ情報を検索データベースに登録しています。登録するだけならともかく、キーワード検索された際に最適な結果を一瞬にして表示する仕組みも必要ですから、並大抵の技術力ではないことは想像できるでしょう。



Googleを始めとする現在の主力検索エンジンは(シェアの観点から言うとGoogleの一人勝ちの構図がありますが、Infoseek、海外ではFastやTeomaなども頑張っています)サイト内のリンク構造に支障がない場合は、ウェブサイト内のページの大半をクローリング(収集)していきます。例えばGoogleの場合「Googlebot」(グーグルボット)と言われるスパイダーが毎月最低1回は登録されているウェブサイトを巡回し、サイト上の大半のページの内容を最新の内容に更新し、またその過程で新しいウェブサイト情報も取得していきます。1サイトにおけるページの最大取得数はGoogleのサイトの評価によって変わってきますが、同一サイト内で1万ページ以上のページを取得することも珍しくありません。ちなみにこのようにスパイダーがトップページだけでなく下階層のページも多数取得していくことを「Deep Crawl」(ディープ・クロール)と呼びます。

また最近の検索エンジンは、定期的にインターネット全体を巡回するスパイダー以外に、最新の情報、例えばウェブサイトのトップページや、ニュースサイトのニュース記事の更新状況だけを毎日や数日毎に確認するスパイダーも開発しています。これはニュースサイトなどがウェブ上で普及し、最新の時事情報をインターネット上で確認することが当たり前になってきたことに検索エンジンが対応したものです。Googleで言えば「Freshbot」(フレッシュボット)と言う新着情報の検索専門のスパイダーが更新が多いウェブサイトやニュースサイトを毎日~数日毎に巡回し、いち早く検索結果に反映すると言うことも行っています。この種の新着情報専門のスパイダーが巡回に来ることは「Fresh Crawl」(フレッシュ・クロール)と呼ばれ、通常の「Deep Crawl」(ディープ・クロール)とは分けて考えられます。

上記で説明したように検索エンジンに登録されている情報は全て検索エンジンのスパイダーによって収集された情報なわけですが、ここで重要なことはスパイダーがウェブサイトをアクセスした際に、ウェブサーバーがダウンしていれば、スパイダーはそのサイトの情報は収集していかないと言うことです。例えば数分でもたまたまウェブサーバーがダウンしていた際にスパイダーがやってきた時には、スパイダーはウェブサイトが閉鎖されたと勘違いして、せっかく登録されていたサイト情報を一時的にでも削除してしまう可能性もあります。最もスパイダーに限らずサーバーダウンはウェブサイト運営上、あってはならないことの1つですが、定期的なサーバーメンテなどでサイトにアクセスできない状態が長時間発生する場合は、できるだけスパイダーの巡回時期を外して行う方が無難でしょう。最も重要な検索エンジンであるGoogleは現在の所、月の25日~10前後にディープ・クローリングにやってきますから、長期的なサーバーメンテはGoogleの更新時期を外して行うことをオススメします。




解説
図解エクセルは、付箋をエクセルに貼るように考えれば、
分かりやすいでしょう。

付箋は、ディスクトップに貼り、便利ですが、その後コピーが必要です。

図解エクセルならば、そのままエクセルで表現できます。

ワード派とエクセル派がありますが、どちらも使えると便利になります。そして、アクセス、パワーポイント、ファイルメーカープロなども理解できるようになります。

データベースの基本はテキストデータです。データ変換も解れば簡単なのです。

検索エンジンについても、その元となるものが、何か分かれば、応用するだけでよいのです。



【PCのメンテ】
PCの為に、一週間に一回は、ディスクのクリ-ンアップをしておいた方が良いと思います。

定期的に、バックアップやアップグレードも行いましょう。
デフラグもチェックする事も忘れないようにしましょう。

買ったままで、何もしていない人は、アップグレードに時間が掛かります。






■金銭は召使であり、主人である。・・・・・・ホラティウス

ホラティウスはウェルギリウスとともにラテン詩文の黄金時代を築いた
古代ローマの詩人。
金は本来使うものなのに、金を手に入れるために昼夜、身を粉にして働いている。
悔しいけれど、金に使われているようなものである。

■無用の物はびた一文でも高価である。・・・・・・セネカ

セネカは古代ローマの哲学者で皇帝ネロの師をつとめたが、最後は彼によって死に
追い込まれた。
ローマ人たちも衝動買いをしていたようである。
今の日本でも「半額!」という広告に踊らされてしまう。欲を慎む事である。

■使わぬ宝はないも同然。・・・・・・イソップ

イソップ物語の作者で古代ギリシャの奴隷から解放された人物でもある。
「宝の持ち腐れ」という諺もあるが、貯め込むばかりでは、役に立たない
ということですね。

無料ばかりを使っていると、作者のページがなくなる事があります。講演や
セミナーにはお金を払い、ソフトには払わない、これでは発展性がありません。
せめて、紹介ぐらいは役立ちたいものですね。

金の卵を産む鶏の腹を裂いてモット金の卵がないかと探しても、死んでしまえば、
元も子もありません。

つづく





お気に入りの記事を「いいね!」で応援しよう

Last updated  November 1, 2003 09:09:36 PM
コメント(5) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

PR

Keyword Search

▼キーワード検索

Profile

lifenavi

lifenavi

Favorite Blog

さあくる笑夢が1999… New! えむ5678さん

過剰な欲望に振り回… New! よびりん♪   さん

一緒に咲くかなぁ New! 釈円融さん

人生のポートフォリ… ミドル英二@「ホンカコ」「ホンダソ」発行人さん
感動経営挑戦中ブロ… リゲイン京都さん

Comments

越後屋大吉 @ Re:今日から三連休(07/19) 今日から、新しいことにチャレンジ。 …
シャルドネ。 @ Re:国旗、国歌を何故嫌うのだろうか?(12/26) まあ、これまで国旗、国歌には一度も抵抗…
えむ5678 @ Re:基本を学んで、繰り返しで、習得。これが、奥儀!(10/31) はじめまして! この度は突然のご案内、失…

© Rakuten Group, Inc.
X

Design a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: