全79件 (79件中 1-50件目)
明日は月末だからあれこれ済ませなければならない。なんか慌ただしいなぁと、ちょっと苛つく。テレビを止めて部屋を静かにして抹茶を点てる。少し抹茶の量を多くして濃くしてみる。このところ、気分によって多くしたり少なくしたりしている。抹茶を点ててぐいぐいと飲む。気分が落ち着いてくる。ん、眠くなってきてしまった。仮眠をとることにする。利休セット無上
2006.11.29
コメント(0)
![]()
やたらニュースに疎い私。NHKに取り上げられた 女子大生のブログ炎上 のことを知らなかった。しかし、 単なる個人のブログだと思って見ていたのが、実は企業のヒモ付きだった事を知った人達は、この放送を見て裏切られた気持ちになったのだろう。ネット上にはカキコミが氾濫し、坊農さんのブログや、「口コミマーケティング」をしていた企業のサイトは大炎上した。まあ、皆分かっているはずなので、単なる祭りでしょう。現実を知らない人っているんだろうか。それはナイーブ過ぎると思う。「Ameba by CyberAgent」はブログを中心としたクチコミ情報メディアです。 NTTPCが考える「クチコミネットマーケティングとは?SNS機能のクチコミメディア利用 ~マーケティングSNS~バズマーケティングとブログを様々なビジネスに活用する方法, クチコミを波及させるバズマーケティング, 実例から読み解くバズマーケティング手法WOMCOM、インフルエンサーを活用したクチコミマーケティングを開始10,000人のブロガーが、一斉に貴社の商品・サービスをブログに取り上げます。 なんて会社もいくらでも今はあるだろう。でも、アフィリエイトの場合は明示的にリンクがあるから、見る側も褒め言葉を差し引いて見ることができるが、リンクで明示的に分からないようなクチコミを装ったものは、質が悪いといえば悪いのは確かだが。そういう意味では、IT関連の記事なんかもそういうの結構あるしなぁ。インフォマーシャルの区切りをきっちりつけるか否か。フィルタリング不可能なところもある。一つあれなのは、金をつかったクチコミ装いブログやアフィリエイトの類で、誇張な表現があった場合、JARO はどういう見解をとるだろうか。アフィリエイトのリンクから購入したもので何か害があった場合、そのリンクを張った人の責任はどうなるのだろうか。製造物責任の他に、紹介責任というのはどういう扱いになるのだろう。おそらく、よほどひどいウソをつかない限りはブログ等でリンクを張った人を訴えるのは難しいだろう。結局、誰が信頼できそうかという感覚を発達させて不条理な買い物を防ぐのが利口なのだろう。でも、これが難しいのも現実。なるべくたくさんのデータが集積されているところで見るのがいいのだろう(そのデータ蓄積者がウソのデータを出さない限りは)。数が多ければ、特定の利害関係者による操作がしにくくなる。
2006.11.29
コメント(1)
Unified type meta search なる検索サイト seek.jp の 検索統計 っておもしろい。2003年からのデータがある。こういうの好きだな。Google Newsに対抗する大学生 ~CEEK.JP 開発者 吉田 光男氏にお聞きするnews.ceek.jpにしても、過去のニュースが時系列で参照できるから、けっこう貴重なデータかもしれない。ここ30分間でどれくらい書き込みがあったのさ? 盛り上がってるスレッド(上位100)等々 にしても。加えて、Hatena Bookmark News こういう link cloud のリンクがついていたりして。メタのメタなメタメタ情報はおもしろいと思う。updatenews は seek.jp の RSS feedを使わせてもらってるからです って。メタ検索エンジンとかいう視点だと何で今さらおもしろいとか言われそうだが、このデータをマイニング対象にしたらおもしろいじゃんて、改めて思ったので。
2006.11.29
コメント(0)
![]()
なんだかよく分からないだが、あの大人気商品レディースプエラリア99%の姉妹品です。人気テレビ通販で1日2万個完れた大ヒット商品です!とかいう商品。腰痛対策にエバーライフの高いサプリを買った自分ではあるが、あんまり腰痛・神経痛が酷くて辛かったからだけど、女性は美容のためにこんなに高いものをばんばん買うわけ?なんなのだろうこの物質はと思って検索してみる。プエラリアミリフィカについてを読む。なるほどねぇ、もっともらしいあれがついているわけね。寺院の中から古い書物が発見され、そこにはプエラリアミリフィカが女性の美容と健康に役立つと記されておりました。プエラリア (プエラリア・ミリフィカ)とはまた過去、イギリスの学術雑誌『Nature』において“プエラリア・ミリフィカは(大豆イソフラボンにはほとんどない)美乳効果をもつ成分「プエラリン」が多く含まれる”との趣旨が発表されたことも、女性に注目される理由の1つとされる。豆食えよ。豆。 などと女性に言うと殴られそうだが。。。。。やっぱり女性はこわい。もっとも男性用にも変なモノはある。 陸上自衛隊中央音楽隊/筋肉音楽でも聴きながら、こんなもの飲んでいる男性もいるかもしれない。野球プロテイン打者用ってやり過ぎじゃなかろうか。。。一瞬のチャンスを逃さない打者になりたい…。glico(グリコ)野球プロテイン打者用 45G-16 でもって、こんな本読むの?やっぱ男性の方が。。。。最近、楽天で変なものを探すの楽しい。当然買わないけど。
2006.11.28
コメント(0)
![]()
宇治茶 伊藤久右衛門で抹茶を注文した。2本+増量サービス1本で6300円1本あたり2100円なので、抹茶の質からいってかなりコストパフォーマンスが高いので買った。30g 2100円の抹茶を買うなら、これの方が絶対よい。リンク先に行くと、4300円で2本のものもある。さらに茶筅もボロボロになってきたので新しいものを買ってしまった。これでは敵の思うつぼではないか。さらには、愚かにも苺抹茶だいふくまで買ってしまった。ますます敵の思うつぼではないか。。。。茶筅 80本立て 1,050円いちご抹茶だいふく 6個 1,512円いちご抹茶だいふくは、賞味期限が 3日間(出荷日含む)しかない。着いたらばばばと6個だ食べないといけない。そして、今度はダイエット食品ですか?頭悪すぎます。マッチ・ポンプ市場とこれを言う。わかっちゃいるけど止められない。エステ仕様の「ダイエットクッキー」チアシードクッキーいや、今回は、さんきん楽天支店 で、野菜類を大量購入してある(ここは届くのは遅いが安いと思うのと、何せ腰が悪いので重いモノはまとめて注文しちゃう)。リンゴはラカントSをいっぱい入れて甘く煮るだよ。リンゴ1個 81Kcal だからいっぺんに 4個分だべても 324 Kcal。カロリーメイトよりカロリー少ない(ふつう、4個もいっぺんに食えないし)。生ものの野菜を大量購入すると、腐らせないように必死に食うwたまねぎはくさいノンカロリー炭酸飲料わけありリンゴ 5Kgノンカロリー甘味料
2006.11.28
コメント(0)

これは何でしょう。八卦のようにも見えますが、そうではありません。塩基配列を単純に図式化したものでもありません。これは何でしょう。囲碁のように見えますが、そうではありません。ライフゲーム でもありません。相撲の取組表です。どれも占いがその歴史上伴っているという共通点はありますが。白と黒、陰と陽という表現を使って、そこに何かをパターンを見つけ出して、何かを投影していくというやり方が、とても興味深く思える。将来、囲碁のプロをスパコンが破る日が来るとしたら、ゲノム解析とかやっているような筋の人が作るんじゃないかなという気がする。1ペタフロップスのコンピュータ を使ったデモンストレーションとしては、やっぱり囲碁の名人を破るコンピュータだろう。
2006.11.28
コメント(0)
Blog オーナー専用の FAQ 開設サービス を読む。これとは関係ないのだが、Q&Aでポイントを付けているようなところは、Q&A にリコメンデーションを使えばよいのに。答える側に、この質問に答えてみませんかというリコメンデーション。これがうまく機能するようであれば、社内システムに使えるでしょ。たとえば、社内ブログを知識情報の源にしようとするのであれば、そういう上記のような仕組みとリコメンデーションを合わせ技にして、管理画面かログイン後の画面にくっつければいい。能動的にこの人に聞きたいという場合(KnowWho)が大変なんでしょ。だから、KnowWho の代わりにリコメンデーションを応用して、「その領域について答えてくれる人」の知識をデータ化すればいい。よく知っているけれど滅多に答えてくれない人もいれば、多少知識は劣っていてもよく答えてくれる人もいる。答えてくれる人は答えてくれるけれど、答えてくれない人は答えてくれない。レベルの低い問いには答えてくれないけれど、レベルの高い質問なら答えてくれる人もいる。レベルの高い質問には答えられないけれど、レベルの低い質問であれば親切に答えてくれる人もいる。親切に答えてくれる人もいれば、ポイントだけ答える人もいる。そうすると、質問者側のレベルとのマッチングも必要。一件複雑そうに感じるものの、意外と単純につくっても、ないのに比べたらはるかに有効なものが作れると思う。
2006.11.28
コメント(0)
知識探索サイト「ジャパンナレッジ」、なぞって調べる新機能ベータ版を公開の記事に釣られて ジャパンナレッジサイトを見に行ってみた。JapanKnowledge 1,575円(税込み)字通 840円(税込み)日本歴史地名大系 21,000円(税込みちょっと料金高い。日本歴史地名大系の 21,000円って。。。。JapanKnowledge も微妙だな。もう少し安くして欲しい。1,000円切った方が獲得ユーザー数を考えた場合、売上げが高くなると思うんだが。。。日本歴史地名体系も機能から見てとっても魅力的なものなのだが、やっぱり高杉。個人で使うなら良いところ 2,980円。ピンポイントで1ヶ月使う程度だろうな。もっとも現段階だとこわごわ様子見の価格付けなんだろうけど。どっちかといえば、法人向けにやっているサービスをこわごわ個人用に高めの価格で出してきたというところなんだろうか。高いところから上澄みのユーザーをまず獲得したいというような感じで。これ、せめて1ヶ月だけ1回限りのお試しで安い料金を別途設定すべきだろう。とぶつぶつ言いながら、試しに登録してみようかなと思ったのだが、入会手続きを見ると、2.会員の本サービス月間利用日数が1ヶ月に満たない場合でも、当社は利用料金の日割り計算は行いません。禁止事項にも次のようにある。本サービスのコンテンツを、個人的使用のために直接参照する目的以外の目的(たとえば後日の参照、第三者への配信、データベースの作成など)で利用する行為これだと、正統な引用も禁止ということになるし、ローカルに一切保存してはいけないということになる。たとえば、何かを検証して、その知見を使って何かを公開するという用途にも使えないということになるから、厳密に言えば、研究者などはこれを使ってはいけないとならないんだろうか。マーケティング活動をしている人も、これを使ってはいけないということになるだろう。著述業の人などもこれを使えば規約に反したことをすることになる。学生が論文を書くときにも参照しちゃいかんととれる。なんらかのプロはこのサイトを利用してはいけないということになる。なんか、殿様商売だな。価値があるのは理解できるけれど、個人の趣味でしか使えないんだとすると、少年ジャンプを買う程度の料金しか払う気になれないな。。。。もうちょっと利用規約を考えた方がよいと思う。大量にデータを盗んで使われるのを防ぐところに専念して、ごくまっとうな使い方については緩くしないと。もっとも、原典を引用元としてしまえば、このサイトを参照しなかったことにできるだろうけど。たとえば、一定の基準以下の引用は OK で、ウェブサイト上で引用を使う場合は、サイトへのリンクを必ず付ける等の規約とか欲しいかな。まあ、「本で知る」の検索対象には、約700冊分の叢書を PDF で全文閲覧可能な『東洋文庫』(平凡社・刊)が含まれる。ということを考えると、読みまくれば元は取れるんだろうけど、個人利用のみの検索サイトとしてみたときには、やっぱり高いだね。会社四季報、週刊エコノミストの前年分とかも参照できるとかもあるけど、あまりに強気なやり方なので、月極で1,575円はやっぱり高いと感じる。利用規約が変われば考えてもよい価格だが。あるいは、チェックが不可能なことを前提に利用規約を無視するか。破られることを前提に、破られた者に対してペナルティを与えることができないような規約って虚しい。上澄みすくったあと購読者ののびが止まったら値下げするだろうから、そうしたら使うかな。こういうサービスはまだまだこれから、競合が出てこないとダメだな。ちなみに関連サイトになっている NipponStyle(日本を変えたプロダクト図典)は暇つぶしに眺めてみると楽しいかもしれない(無料)。これはとても良い企画だと思う。モノマニアはかなり喜ぶサイト。これはかなりお勧め。
2006.11.28
コメント(0)
「解雇された才能ある人たち」を救え! ノーツとGrooveの開発者,レイ・オジー氏大いに語る を読む。「マイクロソフトによるユーザー環境の支配の背景には他者を不利な立場に置いてしまうという従来型のコンセプトがあると言われるが,私はそうは思わない。マイクロソフトの最も大きな利点は,運用環境におけるテクノロジーの支配ではなく,テクノロジーの配布能力にある」「運用環境におけるテクノロジーの支配ではなく,テクノロジーの配布能力にある」という視点はなるほどと思わせるものがある。【どう変わる?Office 2007(7)】Groove編---「Notesの父」が作ったP2P型グループウエア
2006.11.28
コメント(0)
![]()
経済産業省 の「情報システムの信頼性向上に関するガイドライン」公表について、そのうち、ちゃんと読もうと思って読まないうちに忘れそうなのでメモ。IPA は、産業構造審議会「情報システムの信頼性向上に関するガイドライン」の草案作成に協力したのね。その他記事「システム障害の防止指針に関する調査を利用してベンダーを格付けする意図はない」と経産省「システムの信頼性向上には可視化が重要」,経産省が新ガイドラインを解説
2006.11.28
コメント(0)
![]()
産業レポート 日本の出版産業の動向 (2006年10月) をなんとなく眺める。「電子書籍ビジネス調査報告書 2006」によると、2005年度の電子書籍の市場規模は約94億円、前年度比で約2倍に成長したと推定される。まだまだ電子書籍の市場規模って小さいんだなぁ。全体で 94億円か。別の見方をすれば、まだまだ成長の余地が大きいということでもある。2004年の書籍・雑誌小売業(紙・文房具含む)の事業所数は3万4,233店で、前回調査時の2002年から4,417店減少した。11.5% 約1割が淘汰されてしまったということか。10人未満の小型店が淘汰されて、売り場面積が500坪を超えるような大型店への集約化が進み、また、オンラインショップの類の裾野が広がっているということだ。出版物の販売額は 1996年がピークで、2004年には8年ぶりに増加。2005年は減少。とはいえ、ピーク時の 8割に程度の売上げで、推定、2兆1964億円。1億人の読者と仮定すると1人あたり 2万1964円の出費。書籍と雑誌の比率は、58% が雑誌。雑誌が売上げ減少しているのに対して漫画の単行本がヒット続出で売上げアップ。2600億円台。「NANAナナ」「鋼の錬金術師」「花より男子」「ハチミツとクローバー」「のだめカンタービレ」などメディアミックスによる相乗効果。海外で日本のコミック本の人気が高まっており、世界的に市場を形成しつつある。このあたりは、1990年代あたりから、力を入れてがんばっているところだろうが、まだまだいけるだろうな。アメリカは、コカコーラ、マクドナルド、ハリウッドで世界を文化侵略してきたが、日本はトヨタとソニーとマンガ・アニメで文化侵略する。日常の価値観の侵略というのはけっこう重要。トヨタが世界中の工場で現地の従業員を使って操業しているが、これも日本式の価値観を流通させるという意味でも、長期的に見て、相当な影響を与えることになると思う。コンテンツ産業は、政府等が直接支援するのは無駄なので(博打に直接支援を入れることはない)、著作権や紛争時の支援、輸出に関する優遇措置等にとどめるべきだろう。コンテンツ産業に直接口出ししてもろくな事にならん。地味な書籍とかは、コンテンツ販売というよりも、電子書籍の購読管理サービスあるいは情報提供サービス的な方向にいくのが健全なのかもしれない。学術書の類は、出版部数が少ないから高くなりがち。でも、そのうちの多くの部分が流通に載せるための費用。数がでないものは、積極的に電子化の方向にいってくれた方がありがたい。電子版で出して売れる見込みがあれば、紙にするとかいう方向でいいじゃない。で、この場合、流通コストが低いわけだから、著者に対しては印税の率を高くする。これまでは紙メディアということで、異なるジャンルのものがごった煮状態だったが、出版業の中身をもっと分けて、コンテンツにあった流通形態が模索されるべきだろう。ま、一消費者の身としては、基本的に良い物を安く手に入れたいだけなのだが、出版業界はまだまだ買われる業界だと、なんとなく思った。あとあれだね、大学教授が自分の懐を肥やすために授業に自分の書籍を売りつけるのとか、あれよくないね。授業料と教授料の二重取り。サービス業のあり方として、入学時点で卒業までにかかるコストが明確にならないことにもなるので、インチキ商売的なところがある。何とか省庁の官僚が、業者からの見返りとして、自分の書籍を買わせたとか、厚生労働省と社会保険庁の職員が監修科名目でお金を稼いでいたりとか、これって総会屋が情報誌を売りつけるのと同じだな。書籍の再販制度は早くなくなってほしい。読者の皆さんへ 本の再販制度についてご理解とご協力を! なんて理解できない。バーチャルネット法律娘 (ログまとめ) 真紀奈17歳 再販制度って何?新聞なんかも1日遅れ新聞で安いのがあってもいいじゃないかと思う。産経NetView のように電子化されたものは閲覧可能期間を長くするなどして高い料金とかいうのもありだろうし。もうちょっと、コンテンツに対して多用な課金方法があってもいいと思う。
2006.11.28
コメント(0)
![]()
1ペタフロップスの処理能力を持つ高速コンピュータの開発に成功 を読む。理研横浜研究所ゲノム科学総合研究センターが、日本SGI株式会社およびインテル株式会社と、理論ピーク性能 1ペタフロップスの演算性能を持つコンピュータを開発したらしい。1ペタフロップスは、1秒間に1,000兆回の演算を行う能力、といっても、あまりにすごすぎて想像もつかない。超伝導回路を利用して量子物理学を検証する:高い計算能力をもつ量子コンピューターの要素技術になる可能性を秘めた回路が考案された とかいうことだが、将来量子コンピュータが実用化されるとどういうことになるんだろう。よく分からん世界だ。何にせよ演算速度が上がれば、すでに理論上はこう計算すればこういう結果が出せるようになるだろうけど、コストが高すぎて計算できないといったことが可能になるということか。本質的な変化はなくても速度があがるだけで、実用上実用的でなかった計算方法であっても現実的な時間で解を求められるようになる。そうすると、新たな大発見がなくても、革新的なことが結果としておきる。話は変わるが、調達情報等一応ウェブ上にページがあるが、認証基盤システムIDC環境構築・運用業務 みたいなものは、仕様書を公開すればいいのに。こういう機関が出す要求仕様ってレベルが高いはずだから模範的な例になるだろうし。こういうのも、どのレベルのものを買っているのか知りたい。情報公開請求 すれば、落札後には分かるんだろうが、開示請求料もかかることだし、こういう時代なんだから最初から公開できるものは公開すべき。理研は比較的、開示度が低い類の独立行政法人に入ると思う。ちなみに、独立行政法人 理化学研究所 決算公告 を見ると黒字。えぇ? これだけ金食い虫のように見える機関がどうして黒字なんだろうと思ったら、交付金もらっていてそれがあるから黒字ということか。びっくりした。交付金をもらって、初めてなりたつ機関なのだから開示度を高くしないといかんと思う。重要で大金が必要な機関ほど、そうしなければいけない。やっぱり独立行政法人の開示コストを下げて、いいわけができないようにするシステムが必要。
2006.11.27
コメント(3)
![]()
Pyblosxom の lucene プラグインを使って投稿したブログのエントリを全文検索できるようにしたいと思ったが、エラーが出てインデックスを作成するための index.sh を動かすことができない。Exception in thread "main" java.lang.NoClassDefFoundError: org.apache.lucene.util.Arrays at BlosxomIndexer.indexDocs(BlosxomIndexer.java:163) at BlosxomIndexer.indexDocs(BlosxomIndexer.java:157) at BlosxomIndexer.main(BlosxomIndexer.java:111)このプラグインが作られたのは 2004年で lucene 1.2 の時代なので、そのままだと使えないのか、それとも環境がちゃんとしていないからなのか。そもそも、Lucene も分かっていなし(汗)。全文検索エンジン「Lucene」関口宏司のLuceneブログ Java全文検索APIのLuceneについてLucene (TECHSCORE)Lucene (Yuna Wiki)Sen Projectとりあえず、面倒なので挫折しておく。しかし、テキスト検索エンジンライブラリ - Apache Lucene 2.0 登場 を見ると、* 1MBのヒープを要求する程度の少量なメモリサイズ* テキストインデックスのだいたい20%から30%で済むインデックスサイズ* バッチインデックス機能と同等に高速に動作するインクリメンタルインデックス機能* フレーズクエリ、ワイルドカードクエリ、プロクシミテクエリ、レンジクエリなど多種多投なクエリ* フィールドに特化した検索、データレンジでおこなう検索* 複数のフィールで整理できるソート機能* 検索結果をマージする複数インデックス検索機能* 同時検索や更新のサポートと魅力的なので、なんとかがんばって使えるようになっておこうかなぁ。PyLucene project とかもあるようだし。でも、やっぱりいったん放置。
2006.11.27
コメント(0)
Wiki にしても、YAML にしても、stikkit にしても、プレーンテキストを使って簡易なマークアップを使う方式なのだな。プレーンテキストの復権ってやつか。最終的にそれがどんな形式に変換されるかは別として。というわけで、Pyblosxom の記事を書くときには、reStructuredText(reST) を使うことにした。はやわかり reStructuredTextReStructuredText 入門reStructuredTextXMLの論考: reStructuredText: 軽量で強力な文書マークアップ改造版reStructuredTextQuick reStructuredTextdocutilsPyblosxom Plugin: rst を使うと reStructuredText が使えるようになる。これは contrib に含まれているので、プラグインディレクトリにコピーして、load_plugins を使っていればそこに追加するだけ。記事は、拡張子 .rst を付けたファイル名にする。もし、すべて reST を使って書くし、拡張子は .txt がいいというのであれば、config.py に次の行を追加する。py['parser'] = 'reST'もうひとつの方法としては、.txt ファイルのタイトル行(1行目) に続いて「#parser reST」という行を入れておけばよい。reStructuredText で記事を書く#parser reST記事の本文が続く。<H1>からレベルを付けていきたい場合は、次の行を config.py に追加する。「1」となっているところを変更すれば、好きなレベルから開始できる。py['reST_initial_header_level'] = 1ドキュメントのタイトルは標準でレベル 1 に変換されるが、これも config.py に追加すれば変更できる。py['reST_transform_doctitle'] = 1とソースには書いてあるようなのだが、ヘッダレベルはここを変更しても変わらない。このあたりは、またの機会に時間を作ってみることにする。とりあえず、py['parser'] = 'reST' にするか、#parser reST のどちらにするかについては、全部、reST にしてしまうので config.py で parser を指定することにした。これで .txt のファイルはすべて reST として解釈される。正しく reST が扱えているかどうかはまた別途チェックする( reStructuredText の問題になるし)。
2006.11.26
コメント(0)
フラフラとしていたら、stikkit を見つけて使ってみた。便利。面白い。こんなにおもしろいものなら日本語情報もすでに出ているだろうと探してみると、やはりあれこれ記事が出ている。Web 2.0付>箋紙 - "stikkit"華麗にデビューstikkit (自動分類ポストイット)将来のPC業界パワーバランス: stikkitを試す使ってみた印象として、日時を自動的にちゃんと解釈してくれるところがおもしろいとおもった。このアイデア自体は、OSA Foundation の Chandler などでも初期のころ実装したいとかいう話が出ていた(実際にどうなったかは最近見ていないので知らない。国際化対応が案外面倒なはず。たとえばタイムゾーンの話とか、サマータイムの話とかあるから)。on 11/30/06 とかすると 2006年11月30日の予定として解釈してくれるようなもの。by とか at とか、ちゃんと解釈する。このあたりおもしろい。日付の記入の仕方は、11/30/06 のようなアメリカ方式だけでなく、2006-11-30 のような記述にも対応している。日本語はダメだけど。単なるメモなのか、ToDo なのかも勝手に書かれた記述から判断してくれる。メモをとりあえず開いて書き付ける。その内容で勝手に分類してくれる。というのは非常に便利。@hoge とすれば、hoge というタグを付けたことになるし、これはいいなぁ。もちろん、ブックマークの機能も十分使える。JavaScript をブックマークしておいて、ブックマークをしたいページを開いた状態で、そのブックマークを選択すれば stkkit が開いてくれてブックマークを付けると同時にメモを残せる。当然そこにはタグも記入できる(これも英語に限るが自動的に適当なものをピックアップしてくれたりする)。これはなかなか使えそうなので継続使用してみよう。自分の場合、この手のオンラインブックマークとかメモ、スケジューラとか余計に新鮮に感じるのかもしれないが。これは好きなタイプのオンラインアプリ。シンプルでいい。Wiki とか使ったことがある人の方がこういうものに素直に馴染めるかもしれない。iCal や Outlook 用にスケジュールをインポート、エクスポートできたり等、他との連携も考えているところも好印象なのかな。あるいはアドレス帳とか。このあたりは試していないが。
2006.11.26
コメント(0)
PyBlosxom Manual: 8.6. Installing trackback を見る。インストールは次の手順。contrib/plugins/comments/plugins/trackback.py をプラグインディレクトリにコピー(必要なら config.py の load_plugins に追加)trackback ping link リンクを config-story.html に記述する($base_url/trackback.cgi/$file_path)。RDFの記述を HTML 内に埋め込むなら上記ページを参考に story.html や comment-story.html に記述を追加する。pingback のインストールはrssfinder と rssparser、xmlrpc をインストール。contrib/plugins/comments/plugins/xmlrpc_pingback.py をプラグインディレクトリにコピー(必要なら config.py の load_plugins に追加) は、Mark Pilgrim さんがオリジナルの作者で、現在は Aaron Swartz さんがメンテナンスしているようだ。rssparser はどこにあるんだろう。。。このあたりのマニュアル、FIXME - this text probably needs fixing. と書いてあるだけあって。。。xmlrpc_pingback.py を見ると、rssfinder と rssparser が必要だが、trackback.py では使われていない。ゆえに trackback.py を使うだけであれば、rssfinder と rssparser は必要ない。from rssfinder import getFeedsfrom rssparser import parsepingback.py を見ると、 次のようになっている。trackback.cgi ではなく trackback。これを変更したければ、config.py に py['trackback_urltrigger'] = '/path_for_trackback' を入れればよいのだろう。urltrigger = config.get('trackback_urltrigger','/trackback')trackback.cgi ではなく trackback に変えてみると doesn't exist だったのが、次のようにエラーがでなくなったが、依然として書き込みができていない。<?xml version="1.0" encoding="utf-8"?><response><error>0</error></response>おかしいなぁと思って調べてみると、トラックバックされたものは comments.writeComment を使ってコメントと同様に書き込まれている。コメントのスパム対策に入れている magicword.py、nospam.py、 wbgcomment_blacklist.py のどれかが悪さをしているかと思って、すべていったん外してみるとめでたくトラックバックが打てた。ちなみに、次のようにスクリプトから試した。#!/usr/bin/env pythonimport urllibcdict={'title':"TB Test",'blog_name':"Kugutsushi Labs", 'author':"Kugutsushi", 'url':'http://localhost/cgi-bin/pyblosxom.cgi', 'excerpt':'Trackback Test Send'}blogpage='http://localhost/cgi-bin/pyblosxom.cgi/trackback/python/Memo'data = urllib.urlencode(cdict)ret = urllib.urlopen(blogpage,data)print ret.read()ちなみに、マニュアルのとおりにトラックバックの URL をリンクで入れると紛らわしいのでこれは、トラックバック用の URL を表示するだけにしてリンクはつけないことにする。で、問題は MagicWord を入れると、そのままだとトラックバックが使えないので、MagicWord をトラックバックのときはスキップするように改造するか、あるいはインストールしないかということになる。これはとりあえず後回しにしてはずしたままにしておく。教訓: 予期した通りに動かないときはよけいなプラグインをすべてはずすこと。その他、pyblosxomへのTBテスト やtrackbackプラグイン導入あたりを参考。次に PyBlosxom Manual: Chapter 9. Syndication を読む。9.1. Feed formats that come with PyBlosxom を見ると、Pyblosxom のフィードが対応しているのは、RSS 0.91、RSS 2.0、Atom 1.0 となっている。RSS (Wikipedia)。http://localhost/cgi-bin/pyblosxom.cgi/?flav=rss20 あるいは /index.rss20 とかすると、rss20.flav が使われるので、これで RSS 2.0 形式で出力してくれる。修正する必要があればテンプレート(flavor)をいじるだけなので特に問題はないだろう。rss2renderer プラグインがインストールされていれば、フレーバーがなくても http://localhost/cgi-bin/pyblosxom.cgi/index.rss2 で RSS 2.0 形式でフィードが出力できる。フレーバーで出力されたものとこのプラグインで出力されたものを比べてみると微妙に違ったりする。。。プラグインの方は dc:creator や、admin:generatorAgent、admin:errorReportTo が入っているが、フレーバーの方は入っていない。flavor の方は copyright が入っているがプラグインの方は入っていない、等々。ここはちゃんと見直して規格を確認してなるべく一般的に正しいところに合わせることにしようかな。FeedValidatorで最終的にチェックして。さしあたっては、そのままにしておく。プラグインには atom1renderer、pyrss2 plugin、rss2renderer がある。レンダラのプラグインをインストールしておけば、フレーバーが必要ないが、どちらがいいんだろう。判断保留。とりあえず大枠は見終ったので、Chapter 10. PyBlosxom Architecture をざっと眺めてから有用なプラグインがないか眺めていくことにする。
2006.11.26
コメント(4)

Google も Yahoo もデスクトップウィジェットの類を公開しているが、Opera もあるのね。で、Opera の水槽: SimAquariumはとっても気に入って無駄に CPU を消費させている。そういや Opera って PC だと最近あまり使われていないのね。会社も PDA とかの類を主軸に稼いでいる状態なんだろうか。適当に魚や照明を購入して(最初にいくらかあるのでそれを使う)、放置しておくと魚が増えたり、お金が増えたりするので、今いる魚を売って別の魚を買って放置しておく。まあ、単にそれだけなのだけど、妙に気に入ってしまった。スクリーンセーバーとかのと違って、小さなウィンドウなので、デスクトップの片隅に置いておくことができるので、たまに手を休めた時に眺めたりして。でも、CPU やグラフィックが遅いマシンで使うとどうなるか知らない。CPU やグラフィックがどんどん速くなってくると、こういう無用なパワーを使うような小物が増えてくるかもしれないなと思う。もっと画面が大きくなって解像度も上がって、デスクトップがほんとうの机の上のように広くなると嬉しい。だけど新しいマシンを買う金もない。最近の恐怖。冷蔵庫、テレビ、洗濯機、エアコンなどの家電がどれも10年以上前のものなので、これがまとめて壊れたらどうなるんだろうという恐怖(というか、やけに物持ちがよいという話もあるが)。新しいパソコンなんてとても買えない。あぁ、そういえば宝くじ買わなきゃ。
2006.11.25
コメント(0)
![]()
Python 調査報告 サイボウズ株式会社 を読む。単に調べただけなのか、それとも Python を使おうとしているのか、Web API とかの関係で Python も対象に含めるためなのか、Python が流行る可能性を感じてレポートを出したのか、どこからかの依頼が発端となっているのか、背景はよく分からないが、とりあえず、こういうまとまった文書が公開されるのはよいことだと思う。公開後、若干、アップデートが入ったようだ。もっとも、この報告書、一定のレベルのプログラミング経験がある人でないと読んでもピンとこないかもしれないが。この報告を書いた山本泰宇さんをはじめとして、サイボウズ・ラボって奥 一穂さん、須之内 元洋さんと、3/8 が未踏ソフトウェア創造事業で採択された人なのね。それにしてもサイボウズって、昔、最初にグルーウェアを出した頃、ここまでお金持ちの会社になるとは思わなかった。とはいえ価格帯の置き方がうまかったし、最初からけっこう宣伝費を使って、雑誌の CD-ROM に同梱させる等、マーケティングセンスのある会社だなとは思っていたが、うまく資本を入れて荒波乗り切ってきた会社だなぁと思う。伸びるソフト会社っていうのは、やっぱり広義のマーケティングにそれなりの費用をかけるもんだよなぁと思う。プログラミング言語にしても、普及という点では、やっぱりマーケティング的な視点が必要で、Python があまり日本で普及してこなかったのは、Python を使っている人たちが自分が便利に使えればいいやというタイプの人が多かったからとかあるだろうか。もちろん、それ以外の要因もあるが、やっぱり、隅っこでお上品に生きてきたのねという感じもある。最近、徐々に Python の市民権が確保されつつあるようなので、もう少し利用が広がってくれると、そこから受けられるメリットも大きくなるんだがなぁと思うのであった。そのうち pygame とかの本が出ると、普及に弾みがつくんじゃないかと予想。しかし、誰かが書いているという話は聞かない。新しい Python の本が出版されるとか聞いたが、まだ楽天のアフィリエイトには登録されていない。
2006.11.25
コメント(0)
![]()
perl, python & ruby - chr() vs. Unicode に対して、Kuwata Chikara さんの日記に次のように書かれている。いや、それ単に Python が narrow Py_UNICODE でビルドされてるだけじゃん。詳しいことは PEP 261 へ。あと print で utf-8 の文字が出力できないのは、デフォルトではそういう設定になってないから。これはどうでもいいのだが、何となくこの日記を読んだ。これ系の人の日記っておもしろい。2ヶ月分ぐらい読んでしまった。この中で見つけたおもしろいもの。2006/10/15 の日記にそういや Fucks per programing language and license なんてのもあったね (via PHP のコメントには fuck が多く出現する )。この調査によるとお上品な言語は Python と C# で、お下品な言語はぶっちぎりで PHP らしい。とあった。このページを見に行く。Google Code search で検索したのね。それをグラフ化したもの。ライセンスで見るとぶっちぎりで LGPL が fuck が多い (画像) というのも興味深い。このように、Python は上品な言語だからかどうかは知らないが MIT の C1 コースのプログラミング言語が Scheme から Python へ となっているらしい。C1 コースは MIT の Electrical Engineering and Computer Science department のクラスで "introductory electrical engineering and computer science in an integrated fashion using mobile robots as a case study." らしい。Institute for Personal Robots in Education Blog あたりにもこの話題がある。Exploring Programming through Robot Behaviors。Open Robot Controller Architechture (ORCA) みたいのも Python も使ってるのね。There's more than one language to cook your problemsには、Perlは料理そのものがおいしいことに、Pythonは台所がきれいであることに、そしてRubyでは楽しく料理することにそれぞれ主眼がおかれているという印象だ。とあるが、上品な子供を育てたかったらやっぱり子供には Python ということかもしれない。なぜ几帳面な日本人に Python はうけないのか、不思議。それにしても日本における Python は、質疑では「Pythonどうですか」という質問に対して、「いい言語だと思いますよ。私は使わないけど」というのが、一番笑いをとっていたようだ。 な存在ということか。。。。ちなみに Perl とかのソースって記号が多くて、クロノグラフの時計を見ている感じなのだな。目が疲れる。コンパクトに詰め込みすぎ。それに対して、Python のソースは、視覚的にきれいなのだな。視覚的に Perl 的視覚的に Python 的
2006.11.25
コメント(0)
![]()
特集1:Vistaの新文字セットが引き起こすトラブル 関連のページを読む。現時点でこうした話題を特集として組める日経BP の底力を感じる。分かっている人からすると、この手の問題がやがてクローズアップされざるを得ないことは当然の話なのだけれど、発売より前にあえて特集を組んだところが偉い。当然、企業は Vista の早急な導入を躊躇することにつながるだろうが、それは新しい Windows のバージョンが出る度に起きることで、いつものこと。だから、できるだけ早めにこうした問題を特集として出して盛り上げて対処・健闘ができるような期間を前倒しにするというのは、マイクロソフトだけでなく、産業全体にとっても好ましい話。文字セットや文字コードの話はけっこうやっかいなので、対処や検討に時間がかかったりする(積極的にそれをやったからといって、短期的に目に見えるメリットを得ることが難しいから予算をとるのも難しいとかもあるし、アプリケーションやデータの全体的な見直しも必要になるとかもあるし)。だから、今の時点でこうした問題を出すのは良い感じのタイミングかなと。ここで出せば、企業によっては来年度の予算にそうした対策費用を組み込むこともできるだろう。あるいはクライアントとして Windows はやめて GNU/Linux にしてしまおうとかいう選択肢だってあり得るわけだし。もっとも GNU/Linux を使っている場合にも、外部からこうしたデータが流れてきた場合にどういう影響を受けるかの検討はしなければならないわけだけれど。Web アプリケーションなどもそう。OCR だって影響を受けることがあるだろうし。この問題、複数の問題が複雑に絡んでくるので、これからもいろんな人のインタビュー記事のようなものを載せたり(古川亨氏等読んで歴史を含めて語ってもらうとか、XKP(拡張漢字処理)関連の人とか、あるはオープンソースの鬼車(正規表現ライブラリ)、Samba あるいは、Miracle Linux の人に語ってもらうとか、各スクリプト言語の人とか)、古いネタを整理し直すとか、この手の話題を整理し直して特集記事サイトを継続的に充実させて欲しいなと思う。特集1:Vistaの新文字セットが引き起こすトラブルニュース:日本語文字セットがVista最大の問題として急浮上ニュース:Vistaで追加された文字の利用には注意基礎講座1:文字コード規格の基礎基礎講座2:文字コードの発展経緯から役割と仕組みを学ぶマスメディアとしての底力を見せて欲しいなという期待を込めて。最近、日経BP のサイトは、徐々に充実度増していると思う。もっとウェブのメディアとして充実して欲しいこともあり、期待を込めて褒めておく。出版社の人って、最近特に人の声を積極的にきく姿勢が強いから、こういうブログであっても書いておくと、勝手に検索エンジン経由で見に来て読む確率が高い。褒めるのとけなすのを両方どんどんブログに書いておくと、それがある程度、つもっていくと具現化される可能性がある。ちなみに、こういう問題はテキストマイニングにも影響あるんだよなぁ。
2006.11.24
コメント(2)
プロジェクト管理可能な日本語対応オンラインワープロ「solodox」 を見る。Solodox の クイックガイド も見る。この手のものって、これからどんどん出てくるんだろうな。プロジェクト管理が可能というところがおもしろいので (プロジェクト管理の画面)、ちょっと使ってみることにする。利用規約を見てみると、第七条 開示権 法令に従って要請されたとき、または法律手続上必要な場合、本規約を遵守していただくために必要な場合、第三者の権利を侵害しているコンテンツに対するクレームに対応 するために必要な場合、Solodoxまたは利用者の財産、権利、生命身体・業務等の安全や公益を守るために必要な場合など、Solodoxが必要であると判断したときは、Sol- odoxはコンテンツおよびコンテンツに係る情報を保存し、または開示することができるものとします。とあるので、犯罪者が情報共有するのには適していないだろう。第十一条 準拠法、裁判管轄には、 本規約の準拠法は日本法とします。また、サービスまたは本規約に関連して、Solodoxと利用者の間で生じた紛争について、東京地方裁判所を第一審専属管轄裁判所とすることに合意します。とあるので警察・検察等から要求があればコンテンツ等引き渡す可能性があるということ。なので、犯罪者およびその予備軍はこうしたサービスを仕事?に使わない方がいい。で、とりあえず、実際にアカウントを取って使ってみる。プロジェクト管理は間違って公開してもよいようなものであれば使えそう。ちょっとスケジュールをまとめるときなど便利かも。印刷用の表示や Excel ファイルとしてもダウンロードできるし。作成した文書にタグを付けられるところもいい。サークルの類などグループで何かするときには便利かも。ただし、IE 7 から使うとよいけれど、FireFox だと設定のせいかちゃんと動かないところがある。この手のものって、コンセプトと存在自体は特別ユニークなものじゃないから、どれだけ使いやすくて、パフォーマンスがよいかっていう勝負だなと思う。あとは有料サービスと無料サービスがあればその差別化の仕方。加えてセキュリティの確保の仕方。こうしたものはオープンソースでも出てくるから、サービスとしてどういうものにしていくかといったビジョンも明確でわかりやすいものがほしい。たとえば無料サービスだけれど、コンテンツ連動型広告 が入るならば、その文書は解析されているということになるわけだし。だんだんと、コンテンツ連動型広告=ユーザー全般的なトラッキングからプライバシーをもっと確保したいという方向になって有料型のサービスのニーズが徐々に高まっていくような気がする。オンラインストレージ等を含め、個別のパーツがバラバラとある状態だが、いずれさまざまなサービスが集約されていくことになるのだろう。そのときには、当然 solodox のようなものも組み合わされていく。今は戦国時代なのだな。でも、やっぱりそういう目で見たときにインフラ企業たる Google の存在が一番大きい。あほなお国は Google に勝てるような検索を目指して大金を注ぎ込んでいるようだが、すでにそういう次元からインフラを抑えるという方向に行っている Google に対抗するには、サービス全体を見渡さなければならないと思う。効率的・安価に維持できる分散ストレージとかも含めて。表面だけの検索では勝てない。検索には検索されるものが何なのか、何を検索する必要が生じるのか、そのインフラをどうやって維持するのか、ということも同時に進めなければならないだろう。単に高度な検索というのでは駄目な気がする。例えば Google が YouTube を買った理由の一つにネットワーク接続料金のディスカウントなどもあると思う(ボリュームディスカウントの類で単価が下がる)。ファイルをネットに保存する! オンラインストレージ オンラインストレージを使ってみよう価格.com オンラインストレージ 比較表cocoa ギガストレージJUSTSYSTEM InternetDisk
2006.11.24
コメント(0)
このところ Python で書かれたブログの Pyblosxom をローカルマシンにインストールしてためし始めている。Pyblosxom を使い始めるPyblosxom のフレーバーPyblosxom のプラグインPyblosxom の記事の書き方Pyblosxom の静的ファイルの設定Pyblosxom のコメントプラグインPyblosxom のコメントスパム対策 (1)Pyblosxom のコメントスパム対策 (2)まだマニュアルを見ながら試している途中だが、ちょっと寄り道をして、sh1.2 pyblosxom に pyentrynavi というプラグインがあったので試してみる。個別エントリを表示している時の次のエントリ、前のエントリへのリンクを追加するプラグインを作ってみた。ということで、プラグインを plugins に保存して、(必要なら config.py の load_plugins に追加して)、1) エントリの上に表示させたいなら date_head.html 2) エントリの下に表示させたいならcomment-story.htmlに下記を追加すればよいということなのでやってみる。<div class="entrynavi">$entry_navi</div>前後の記事のタイトルが表示されるようになった。これはいい。使わせていただくことにしよう。しかし、このペースでやっていると、Pyblosxom で実際にサイトを作って公開するのはいつになることやら。まあ、いいか。
2006.11.22
コメント(0)
新興検索エンジンとしては初!国産ブラウザLunascape4最新版にMooter Web検索を導入のリリースを見て、ちょっと Motter検索 を使ってみる。Motter検索で「抹茶」を検索してみると あまりに楽天に侵食されすぎていて役に立たない。ブログフィルタだけでなくて、商売のページをフィルタしてくれるような検索エンジンが欲しい。こうしたキーワードでは、知識を検索しづらい状況になっている。既存の検索サービスは、情報を漏れなく探し出すことができるものの、無駄な情報、余計な情報が排除できないため適切な情報にたどり着くのが困難ですが、Mooter検索は必要な情報だけに絞り込んで分類分けします。上記、プレスリリースより引用とか書かれているが、抹茶で検索してみると、無駄ばかり。※世界最速の根拠:言語処理学会でWeb検索結果のクラスタリングにおいて最速とされているアルゴリズムに、ムーターの技術陣が独自の改善を加えてより高速化しましたので、世界最速級のクラスタリングサーチエンジンであると自負しています。どうなんだろうな、こういう根拠で世界最速というのは。ムーターは、日本語文章の文法情報を詳細に解析し、不必要な情報を排除して、必要な情報だけに絞り込んで分類分け (クラスタリング)できる独自の日本語処理(構文解析)技術を開発し、世界最速級の処理スピードを誇るクラスタリングサーチエンジンを実現し、検索サービスを提供しています。ということでちょっと見に行ってみたのだが、ちょっとがっかりしたよん。結局、クラスタリングサーチエンジンとかいう言葉はあっても、自分の探したい情報が見つかりにくいなら使う気になれない。新興の検索エンジンのおもしろさからすると SAGOOL とかの方がおもしろいような気がする。BON SAGOOLみたいのもおもしろいかな。
2006.11.22
コメント(0)
![]()
さすがに甘い物食い過ぎでリバウンドした。まあ、3歩進んで2歩下がるを繰り返して、毎月 1Kg 痩せていくからいいんだけど。余裕、とか言いながらも増えるとやっぱり、ちょっとうろたえるかもしれないw。これからしばらく、また、まじめにダイエットする。最近のレビューを見ても食べ物ばかりじゃないか。実はレビューを書いていないだけで、もっと大量の食料品を買っているんだけど。最近食べた肉・魚に一部あるが。大量に買うとスーパーより安いようなものは楽天で買ってしまっている。こういうものにダイエット食も組み合わせたりしている。それにしても、ここのは本当にうまい。賞味期限に余裕があるものは、少しずつ食べようかと思っていたが、結局、ほとんど全部食べてしまった(葛湯はまだ残ってる)。とりあえず、プリンと大福を食べた。うまい。大福は栗が入っているやつの方が好きだが、これはこれでうまい。一緒に頼んでおいて、あんみつ、葛湯、葛餅も食べる。幸せになる。むちゃくちゃうまい。あんみつの白玉も捨てがたいが、やっぱり葛餅が好きだな。葛餅は大好物。あと冬はやっぱり葛湯。締めはやっぱり抹茶です。『無上』はそこそこよいランクの抹茶だと思う。
2006.11.22
コメント(0)
![]()
高木浩光@自宅の日記 を久々に見る。やっぱりおもしろい。啓蒙活動は、いかにしつこく、細やかに長期に腰を据えて渡ってつづけなければいけないかということか。こういうしつこいタイプの人は貴重な存在だと思う。理解して実践に結びつけるまでに凡人は時間がかかるから、それに付き合う人が必要。駄目な技術文書の見分け方 その1駄目な技術文書の見分け方 その1の2やはりストレートでおもしろい。マスコミの記事でよく見かける表現に、「完全に○○ないわけではない」というものがあるが、これは断定できないことを言うときの逃げ口上だってことを知っておいたほうがよい。駄目な技術文書の見分け方 その1の2とあるが、分かった上で逃げているんでしょう。「と思うのは私だけではあるまい」等とも共通点があるかもしれない。発言に対して責任をとりたくないとき、あるいは、あたかもそこに支持があるかのような思わせぶりの表現。技術書の類は安易な逃げ口上を封じて、現時点では自分はこう思う、と言い切ってしまって、間違えていたり不完全であったら、補足修正するといういやり方の方が健全だと思う。特に Web 上の記事なんてあとで、追記しやすいわけだし。うやむやよりも、間違いや不足はその至らなかった点をあとで認めて修正したら評価しましょうという姿勢も必要だと思う。ただし、ダメなものはダメと叩く。欠陥商品が叩かれるのに欠陥文書が叩かれないのはおかしい。むしろ、欠陥文書は欠陥商品の発生源にもなる可能性があるのだから(技術書はそれを参考にして何かする人がいるわけだから)、源から叩かなければダメ。翻訳の世界には、別宮貞徳先生という 誤訳、悪訳、欠陥翻訳、特選誤訳迷訳欠陥翻訳、やっぱり、誤訳だったのか!、トリヴィア・トリヴィオールム など出版されている人がいるが、技術書の世界にもこういう分野があってもよいのではないかと思う。高木氏の書かれている読んでいると、そういう分野の本があったら受けそうな気がする。間違いを明示的に指摘する文書を読むと、とてもよい頭の訓練になる。高木氏は はてブを使うことにした らしい。はてなブックマーク の一行(100字以内)批評は見る側からすると、不明な点があってもそれが考えるという作業を引き起こすから、新たな啓蒙方法としておもしろい。みなまで言うなってやつ。ただ、高木氏をもうっちょっと大衆化したような感じのものも欲しい気がする。この分野で大衆化っていうのは難しいところもあるけれど、頭が良すぎる人の話は頭が悪い人は分からないから、かみ砕くタイプの人によるもの(でも、かみ砕きすぎて変な方向に行かない人)。高木氏の弟子が登場するとおもしろい(そんな人がいるんだか知らないが)。師弟の対話は軸が固定されるから扱う範囲は狭まっても理解が深まる。など書きつつも、自分もまともな文章はなかなか書けない。知識不足、調べるの手抜き、文章力がない、頭が悪い、反省が少ない、等々だったりするが。。。
2006.11.21
コメント(0)
なんとなく 高知工科大学 のサイトを見てみる。高知工科大学付属情報図書館のページを見ると、学位論文 や 高知工科大学紀要 が見やすいところにある。とってもいいなと思った。教育・研究の優れた大学として読売新聞に紹介されました とあるが、地方にある、この手の大学ってけっこうがんばっているのね。大学ランキング もかなり健闘している。日本にない大学 らしいので、高知は日本じゃないのねと思ったら「今までの日本にはなかった大学」ということらしい。
2006.11.21
コメント(0)
このところ普段のアクセスが1日平均でだいたい 200-300 程度なのだが、Plagger は妄想を煽る を書いたせいか、昨日は 1500を超えた。Plagger って書くと、アクセス数が上がる(笑)。ちょうど @ITに 一足早く「Plagger」の便利さを実感してみよう という記事が掲載されて(この記事分かりやすい) Plagger の関心がまた高くなって検索する人が増えているんだろうか。ブログ検索の類から、ここにもたどり着いたんだろうか。楽天ブログはどこからアクセスしてきたんだかリファラが見えないから、こういうときに分からなくてイヤ。ちなみに、上記の@ITの記事の最後の方に、次のように書かれているが、自宅サーバがブームになるかっていえば、ちょっと疑問。自宅サーバは不要なんじゃないかと思う。自宅のPCで Plagger を使ってデータ収集、加工をして、サーバにアップロードするようなものを作ればいいわけで。そうすると CGI 等動的にページを生成できない無料サーバでも、頻繁にアップデートできるようになったりして。情報収集と処理はサーバでなくてもいいでしょ。別に更新かけないときは PC を落としておいてもいいわけだし。一部のレンタルサーバ上でPlaggerを動かす方法もありますが、やはり自宅サーバでの運用の方がお金も掛かりませんし、手軽にできます。Plagger普及で自宅サーバのブームがやって来るかもしれません。基本的にリソースはインフラ的なサーバにどんどん乗っていくという流れなわけだし。ブログなんかでも手で書くページに加えて、自動的に収集したデータを適当に加工して自動更新するページなんかも出てくる。そうすると、いちだんとゴミみたいなページがたくさんできる可能性もあって検索エンジン泣かせになる可能性もあるか。簡単になるとやる人増えるから。加えてスパムの類もさらに増える可能性がある。これまでやらなかった人もこういうツールで簡単にできるとやれるようになるから、新たな問題につながりそうな気もする。ガートナーのハイプ・サイクル からすると、Technology Trigger でこれから妄想をかき立てながら急上昇していくところか。ある程度のところまでいったら妄想ピークに達して、いったん失望に代わり下げ、でも、またしばらくすると再浮上って感じになるんだろう。たぶん、一過性で消えていってしまうようなものではないと思う。こういうプラグイン(あるいはコンポーネント)をつないで使えるようにしたいという流れは、ごくノーマルな方向だと思うし。ある意味、新規性という意味では、あまり新しさを感じさせないんだけれど、奇異でないだけにうまい方向で作ってあるから根付くかなと。インテリジェントパッド とかの方が先進的だったといえば先進的だったわけだし。既存のデータやプログラムを紙(パッド)を切り貼りするように簡単に合成・編集し、アプリケーションやWebサービス、ブラウザ機能などをプログラムを書き換えることなく簡単に合成できるシステムです(図1)。ただ、Plagger の方が身近なニーズから発生していて、だいそれたツールでないだけに、身近な次元で能動的な可能性を感じさせるのかな。JavaBeans とかはどうなんだとか。ある意味、妄想を感じさせる部分はインテリジェントパッドやらなんやらの大衆化とかもいえるのかな。大衆化されているからこそ広がる可能性も高くなる。あと、ちょっと気になるのは、あんまり安易にあれこれ集めてきたものを HTML ページにしてクリックしてなんてことをやると、それが新たなセキュリティ上の問題になったりして。リンクの中からやばいものを削除するようなセキュリティを確保するためのプラグインとかも欲しくなるのかな。さらに生でパスワードを設定ファイルに書き込んだりするのも、ちと何だよねというのもあるが。
2006.11.21
コメント(0)
先日 組み込み型全文検索エンジン Senna を使ってみるを書いたら、Sennaによる部分一致検索の挙動について で解説していただいていたので動きは納得。ありがとうございます。ということで、さらにつっこんで使ってみることにした。ということで、とりあえずマッチしなかったら、検索語を自分でばらして検索しなおせばいいやと割り切ることにする。しかし、やっぱりこういうのを見ていると MeCab に戻ってしまって、さらには見ていくと辞書に戻ってしまうのだなぁ。。。2003/04 あたりに試したものと、今のバージョンの結果を改めて比べてみたりしようかな。Back to the Future でちょっと過去に戻ることにするかな。カタカナの未知語の扱いは実感としてかなり良くなっているけど、辞書に由来する問題ってのは、やっぱりあると思う。下記で取り上げたものはかなりよくなっている。外来語のカタカナ表記(あ行)外来語のカタカナ表記(か行)外来語のカタカナ表記(さ行)外来語のカタカナ表記(た行)外来語のカタカナ表記(な行)外来語のカタカナ表記(は行)外来語のカタカナ表記(残りは省略)MeCab はカタカナの未知語の扱いは格段によくなっているのだが、次の類のはまだ気に入らない。マイコンピュータマイ 名詞,固有名詞,人名,名,*,*,マイ,マイ,マイコンピュータ 名詞,一般,*,*,*,*,コンピュータ,コンピュータ,コンピュータロリエロ 名詞,固有名詞,組織,*,*,*,ロ,ロ,ロリエ 名詞,固有名詞,人名,名,*,*,リエ,リエ,リエバッファローバッファ 名詞,一般,*,*,*,*,バッファ,バッファ,バッファロー 名詞,一般,*,*,*,*,ロー,ロー,ローシューマイシュー 名詞,固有名詞,人名,姓,*,*,シュー,シュー,シューマイ 名詞,固有名詞,人名,名,*,*,マイ,マイ,マイこの手の単語を含む例文が登録された場合、Senna ではどうなるか。マイコンピュータをさわる。ロリエを一枚料理に入れる。バッファローを観に行く。シューマイを食べる。マイコンピュータ、ロリエ、バッファロー、シューマイで検索してみると、すべて検索できるので、形態素解析としては正しくないが結果オーライで OK。でも、「マイコン」で検索すると、マイコンピュータの文はヒットしない。これは予期通り。「マイ コン」で検索するとマッチする。スペース入れる戦略は、マッチしなかったら先頭からひとつずつずらしながらスペースを入れて再検索してを続けるという強引なやり方をしなければならない。けれども場合によっては正解にたどり着く前に変なところで引っかかってしまうかもしれないか。。。ま、いいや。次のようなパターンはどうか。ウルトラマンを観る。ウルトラセブンを観る。ウルトラマンエースを観る。形態素解析すると、ウルトラマンウルトラマン 名詞,固有名詞,一般,*,*,*,ウルトラマン,ウルトラマン,ウルトラマンウルトラセブンウルトラ 名詞,一般,*,*,*,*,ウルトラ,ウルトラ,ウルトラセブン 名詞,固有名詞,一般,*,*,*,セブン,セブン,セブンウルトラマンエースウルトラマン 名詞,固有名詞,一般,*,*,*,ウルトラマン,ウルトラマン,ウルトラマンエース 名詞,一般,*,*,*,*,エース,エース,エース「ウルトラマン」で検索すると、「ウルトラマン」と「ウルトラマンエース」がヒットする。「ウルトラセブン」は仲間外れなので「ウルトラ」で検索しようとやってみる。ところが「ウルトラセブン」が「ウルトラ」でヒットしてしまうために、部分一致検索に行ってくれない。「ウルトラセブン」はやっぱり邪魔者なので、殺してしまう。そうすると、「ウルトラ」で検索しても「ウルトラマン」も「ウルトラマンエース」もヒットするようになる。仕様・意図通りの動きだと思うが、やっぱり使い勝手として微妙なところがある。辞書をチューニングすればよいのだけど。漏れについてはやっぱり n-gram 方式の方が安全か。その一方、やっぱり形態素解析してあると、用語の頻度とか出してどうこうするには絶対的なメリットなわけで、そのメリットは捨て難い。部分一致でがんばってくれる分、単に形態素解析した結果を探すだけよりはるかによいので、他のものと比較しながら使ってみようと思う。やっぱりベンチマークがほしいなぁ。辞書のチューニングが必要だなぁ。それにしても、ロ 名詞,固有名詞,組織,*,*,*,ロ,ロ,ロって、どんな例文から発生しているんだろう。ロシアのロなのかな。いや、国だったら、日本 名詞,固有名詞,地域,国,*,*,日本,ニッポン,ニッポンのように地域、国になるはず。分からん。このエントリがなければ、未知語にたおれてロリエになるかな。削除!
2006.11.20
コメント(0)
![]()
Plagger で外からとってくる情報をまとめ上げるのに疲れたとき、アンプラグドな安らぎを。いたずらはここまで。マッシュアップもいいけれど、シンプルで生な感じもいいじゃないかなと。
2006.11.20
コメント(0)
![]()
Plagger は妄想を煽る のためだろうか、なぜか今日はアクセスが多い。Python 好きの自分としてはある意味屈辱に涙する。なことはどうでもいいが、ほれ Plada なんてある。楽天って何でもあるね。これは単なるスペリングをミスした恥ずかしくて可哀想なあれなのか、それともほんとうに PLADA なのか。PLADA って、このページ書いてあるPRADAウェブページでスペリングを間違えると、それが本物であろうがなかろうが、まがい物に見えてしまうという罠。ショップの人は気をつけないといけないでしょうね。
2006.11.20
コメント(0)
![]()
独立行政法人評価委員会 総会(第24回)配付資料 を見る。パッと見た目、これ自体評価できそうな感じだが、じっくり見ないと分からんよね。役人て、こっちで削って、こっちでちゃんと補填してってやりがちだし。何せ天下り先だからなぁ。ただ、刈り取るところを刈り取ろうとしているところは評価できそう。というか、じっくり見たら、いかにこれまでいいかげんなことをやってきたかってことが分かるような気がする。それでも、こういう方向に動くだけましだとも言える。法人全体の利益が年度計画予算を上回ること、経営努力による収入の増加や費用の減少であることを法人が合理的に説明できることというのを明言しているところはよいと思う。逆に言えば、これまではやっぱりルーズだったってことなんだろうな。国立大学財務・経営センターの見直しについて なんか見ると、9000億円の債務抱えているっていうし。えぇ、それ冗談じゃないの??? 9000億円???1団体で9000億円とか出しているようだと、独立行政法人の負債総額って、いったい幾らなんだろう。数兆円? 無能というか能なしというか、常識の範囲外で動いていた人たちがすさまじい数いるってことだなぁ。それにしても酷い。
2006.11.20
コメント(0)
Plagger をちょっと調べてみて、そのものの興味もさることながら YAML に興味がいったのでちょっと調べてみる。YAML とは、構造化されたデータを表現するためのフォーマットです。目的は XML と似ていますが、XML と比べて「読みやすい」「書きやすい」「わかりやすい」という利点があります。プログラマーのための YAML 入門 (初級編)よりPyblosxom がまともに使えるようになったら、次のチャレンジとして YAML を使ってみようかなということで、とりあえず覚書。PyYAML (YAML parser and emitter for Python)PySyckPyYaml Mini ReviewYaml Cookbookガントチャートによるスケジュール表YAMLをPythonで使う(続)YAMLをPythonで使う1分でわかるYAML前史プログラマーのための YAML 入門 (初級編)プログラマーのための YAML 入門 (中級編)ガントチャートによるスケジュール表 など、YAML 形式で予定を書いて、テキスト形式で ガントチャートを表示 (画像) してくれるもので、おもしろい。YAML って、結構、温故知新の領域かもしれないけれど、便利でいいかも。
2006.11.19
コメント(0)
Plagger の例などを見る。Plagger は Perl で書かれた RSS/Atom feed aggregator ということで、RSS/Atom を取得して、そこから何かを取り出して適当に処理して、その結果を使ってまた何かするようなことが簡単にできる。Googleで「はらへった」と検索するとピザが届くようにするまでや、Plaggerでエロサイト作ってみた なんていうのはデモンストレーションとしておもしろい。Plaggerとは? からメジャーな情報をたどれる。Plagger は、2006年2月に plagger.org が公開されていることを考えると、かなり早い普及かな。日本人の方(Tatsuhiko Miyagawa さん等)が開発の中心にいるということも、日本で普及する一つのメリットにもなっているのかな。そのものの魅力+日本人の開発者という意味では Ruby などもそうだが。やはり日本語で書かれたドキュメントは普及に大きくはずみをつけると思う。Python で同じような分類のものとしては、Newspipeや Planet があって、それに比べると機能的にもより Plagger の方が広がりを感じさせる。Newspipe は RSS/Atom のフィードをメールで送信するという機能に特化している。Plannet の方は Planet Gnome や Planet Debian のために作られたもので、ニュースの feed をダウンロードして Web 上にアレンジして公開し、こうかいされたものの feed を1つにまとめて新たに公開するといったことに使われるので、やはり用途が限定されている。Plagger はもうちょっと能動的な感じがする。たとえば上記の例のように。Publish や Notify のバリエーションがいろいろできると、それこそ出口は何でもありの状態になる。Publish::MSAgent を使った例とか にしてもそうだが。Publish 先を RDBMS にしてしまうなんていうのもありだろうし、Plagger::Util::strip_html($html) や Plagger::Util::summarize($entry->body) のようなものをさらにあれこれ拡張すると、body を形態素解析して指定の品詞を取りだしたりとか、テキストをあれこれ書き換えたりするのもありだろうし。RSS/Atom の aggregator という枠組みを取っ払ってしまってテキスト処理のフレームワークとして使うといったことが可能に見える。Atom/RSS のフィードから初期情報を取得するのでなくて、RDBMS からとってきちゃってもいいじゃないという気もする(とってきたものを RSS/Atom の形式にするようなプラグインとか)。そういう意味では Newspipe にしても OPML 形式のファイルにしてしまえば何でも食えるだろうけど、出口のところや途中処理のバリエーションが Plagger の勝ちか。Plagger vs. newspipe に Plagger の作者 Tatsuhiko Miyagawa さんの見解がある。Plagger competitive services には、Planet, newspipe だけでなく、FeedRinse, Touchstone, Dapper, xFruits が挙げられている。この手のものは、これまであまり興味なかったが、そのうち、ちょっとずつ見てみようかな。結局、ネットからとってきたものを処理するための道具立てが Plagger Plugin listにあるように、現時点でもかなり揃っていて、あとはこれを使う設定だけ書けばいいという状態というのが現実的な魅力で、加えて、自分でプラグインを作ればまた拡張もできるし、最初にあげたように何でもできちゃうよ的なところを見せてくれる点で、フレームワークとしての可能性を妄想させてくれるようなところも受ける原因かな。妄想させてくれるフレームワークかどうかって、結構重要だと思う。その一方で、こなれた技術を使っていて突飛な感じもしないと。Palagger 自体の便利さもさることながら、YAML を使ったところがおもしろいなと思った。YAML 形式でやりたいことを設定するからこそ、簡単!と感じることができる。同じことを実現するという意味では XML 形式でもよかったはずだが、YAML を使うことによってテキストエディタで楽に見やすく設定ができる。よけいなタグを書かなくてよいから短時間で書けるし、とっつきやすい。テキストをきれいにするフィルタを考えているとき、Unix のパイプでつないで部品をつなげていくようなことも考えたが、Plagger のように個々の独立したプラグインを作って、そのプラグインの設定ファイルを YAML で書いてつなげていくというアイデアはいいなと思った。個々の部品の再利用が楽でいい。プラグインと設定が明確に分かれて、プラグインがすでにあるならば、最低限必要な情報のみ含む設定ファイルを書くだけで利用可能になるというところが、やはりスマートで便利に感じるのだと思う。Pyblosxom の方が一段落したら、次は YAML 関連であれこれ調べてみよう。とりあえずは Plagger 関連のページをあれこれみてみた。やっぱり日本語情報が多い。なんとなく、どんどんユーザを増やしていきそうな感じがする。ぶひ、Python でもこういうのがあると最高なんだけどなぁ。LL RING Plagger is a LL: 竹迫 良範さんの資料 plagger.pptLL Gong - Plagger is a LL (YouTube)PlaggerPresentations: Plagger-Kansaipm.pdfPlagger wikiPlagger wiki (日本語)Plagger BlogShibuya.Plaggers :: Publish::Kwikiplaggerドキュメント和訳hatena, タグ「plagger」を含む注目エントリーいまさら聞けない? 初心者向けPlagger設定覚え書き その1 ~Software Design 2006年10月号 (Plagger3分Hacking 俺流Plagger活用術)lagger って何ですか? (Hatena::Question)それPlaShibuya Perl MongersPlaggerとHyperEstraierでWeb履歴を検索Plagger で、はてなミュージックを Windows 以外でも使えるようにするCustomFeedプラグインの書き方YappoLogs: 日本語文章のサマリ抽出plaggerPlagger をインストールしてみた on さくらインターネットWindowsで簡単にPlaggerをインストールする方法ActivePerl+Plaggerが全角文字を含むディレクトリにアクセスするとこける件PlaggerをWindowsにインストールするときの注意点PlaggerにインチキGUIをつけてみる(Windows)Plagger Server のデモンストレーション
2006.11.19
コメント(0)
![]()
前歯が折れてめげている最中。ダイエットの一次目標を達成したところで、自分へのご褒美に買った甘いものを食べて気を紛らす(正確には、昨日届いて食べ始めていたんだけど)。やっぱり、宇治茶伊藤久右衛門のものはうまい。これはほんとうにお勧め。抹茶風味もピンからキリまであるだろうが、使っている抹茶の質が比較的よいので、よい味になっている。今回注文したのは、次のようなもの。ダイエットしているにも関わらず、そんなに甘いものを食べてもいいのか?いいのいいの。我慢するときは我慢して、食べるときは食べると。その方がダイエットが長続きする。今回買ったのは、これ。詰め合わせになっているから、あれこれ食べられる。とりあえず、プリンと大福を食べた。うまい。大福は栗が入っているやつの方が好きだが、これはこれでうまい。一緒に頼んでおいて、あんみつ、葛湯、葛餅も食べる。幸せになる。むちゃくちゃうまい。あんみつの白玉も捨てがたいが、やっぱり葛餅が好きだな。葛餅は大好物。あと冬はやっぱり葛湯。締めはやっぱり抹茶です。『無上』はそこそこよいランクの抹茶だと思う。満足、満足。大満足あぁ、ちなみに、これだけ甘いものを食べる日は米などの炭水化物は一切取らない。さすがに、これに米1合食べて、おかずも食べたら速効で太ると思う。加えて、ぜったいコンビニ弁当なんか食べちゃいけない。こういう日は、いくらおなかがすいてもダイエット系の食糧を食べるだけ。さらに、翌日も控えめにするが。虫歯になろうが、何しようが、とにかく甘いものなしでは人生がつまらなくなるので、どんな努力でもするのであった。そこまでして食べたいんだよー。食事代わりに甘いものを食べる1日であった。そういえば一昨日、恵比寿にいったときに、東口からちょっとのところにあるたい焼き屋さんにいった。評判がいいとかいうのを聞いたので打ち合わせの帰りに寄ってみた。たいやき ひいらぎ(恵比寿) だな。これはこれでうまいこととは思ったが、形を整えるのにはさみでちょきちょきやらんでいいよぉ。パリパリしてるのがはみ出ていたら、それはそれでうまいはずじゃん。切らなくていいよぉ。正直、たい焼きは、的屋の兄ちゃんが焼いたいいかげんぽい、ジャンクでちょっと、これ生焼けっぽいよぉ、しっぽになんかあんこ入っているはずないじゃん、というのが好きだったりする。たい焼きは自分の中では、ジャンクな分類なので、ジャンクはジャンクがいいの。やっぱり、ひいらぎのたい焼きを食うなら、宇治茶伊藤久右衛門のものの方が満足度が高い。あぁ、そりゃ、その分、高いものね。
2006.11.19
コメント(0)
治療中の前歯が折れた夢を見た。起きてみたら、本当に前歯半分が折れていた。折れた歯はどこへいったんだろう。枕もとを探してもない。飲んでしまったんだろうか。。。。ということで、前歯が欠けた情けない状態になってしまっている。めげる。
2006.11.19
コメント(0)

私は耳が悪い。よく人の言っていることがきこえないことがある。そもそも聞く耳持たないとかいう話もある。どこまで高い音が聞こえるかをテストできるソフト「可聴周波数域チェッカ」。年齢とともに徐々に聞こえなくなっていく高周波音をどこまで聞き取れるかチェック なるものを気が向いたので試してみる。やってみると、17000 Hz あたりで誤答率がやたらと上がる。17100を超えるともう駄目。このソフトを作った方の実験だと、平均年齢: 23.8 歳で 平均値は18072 Hz とかだったらしい。やっぱり、自分の耳もかなり年老いてきたようだ。やばい。。。。というか集中力もかけているんだろうな。4つなったところ3つしかきこえないとか、1つ少ない数しかきこえなかったりする。よけいにやばい。若者に人気の「蚊の着信音」 って悔しい。大人には聞こえない着信音 とかにある mp3 のファイルを聴いてもノイズがうるさくは感じても、高周波の不快な音は聞こえない。やっぱり年寄りなんだ。。。。。でも、昔に比べてノイズ音で疲れなくなったと思ったら、やっぱり聞こえなくなっていたんだな。歳をとるのは素敵なことです、そうじゃないですかぁ。
2006.11.18
コメント(1)
その名はNext-L を読む。ACADEMIC RESOURCE GUIDE (ARG) から思い出して見に行く。図書館退屈男と OPAC検索プラグイン で、このブログは興味を持ったのだが存在を忘れていた。図書館て、とってもじみーーーーな存在だと思うが、新しく魅力的な存在になれる可能性も秘めていると思う。情報探しのプロとして、情報整理のプロとして、情報保管のプロとして、陳列のプロとして、おもしろい存在だと思う。国立国会図書館が広報強化方針 らしい。こういう傍から見ると、じみーな組織があえて外向きに動き出すとおもしろい。だいたい図書館って、もっと活用されないともったいない。あっ、そういえば、もう何年も図書館て行ったことないや
2006.11.17
コメント(0)
![]()
なんとなく Google で楽天ブログにある Python を探してみる。プログラミング言語として Python を使っている人って楽天ブログにはほとんどいないみたい。ちょっとがっかり。Mew で溜めたメイルを Gmail へインポート というのを見つけた。たまたま GMail Loader が Python/Tk で組まれていてということでひっかかっただけで、この方自体は Python ユーザということはないようだ。Python を使ってみましたというのだと、 Python+Tkinter(プログラム入門)、Python+Tkinter(プログラミング)の続き ぐらいしかない。やっぱり、プログラミングをするような人って、あんまり楽天ブログなんて使わないのかなと、Ruby で調べてみる。Python より多いが、たいした量はない。Perl もあまりない。Java もそれほどたいした量はない。PHP はちょっと多い。それにしても、Python は楽天ブログではまったく人気がない。C# とかも少ないが。そもそもプログラミングするような人はあまり楽天ブログにそういう話を書かないよねというあれもあるか。なんて調べているうちに、たまたま たくさんある重複するテーマ のページを見つける。楽天ブログの「テーマ」について調べた人の記事。他を見てみると、おもしろい。楽天ブログに存在するテーマはいくつ? (2006/2/23)たくさんある重複するテーマ (2006/2/24)記事ゼロのテーマが多すぎる (2006/2/26)重複テーマベスト30(その1) (2006/2/27)重複テーマベスト30(その2) (2006/2/27)グループとテーマと記事数の関係 (2006/2/28)楽天ブログのテーマ検索機能を作りました (2006/3/2)楽天テーマ検索機能のプログラムについて (2006/3/3)2006/3/4 0時18分現在、225086個のテーマがあります。前回調査時(2006/2/23 19:30で222890個)から2196テーマ増えたことになります。つまり1時間あたり11.2テーマ増えている(5分21秒に1テーマ増える)計算になります。ということのようだ。実をいうと、自分では楽天部ログのテーマって全然使っていなかったので、こんなにあるのかとびっくり。なぜに使わないかというと、なんだかたくさんありすぎてよく分からないから、見つけるのがめんどくさいし、過去にあるテーマと同じようなものを新たに作るのもなんだしなぁと思っていたから。そうかぁ、そんなにあるんだったら新しく作っちゃおう。題して「プログラミング言語 Python を使う」なんとなく、自分しかこのテーマは使いそうもないが、試しに作ってみる。作っておきながら忘れそうな気もするが。記事ゼロのテーマが多すぎる って、記事数をベースにすると、ジップの法則 のようにならないのかな。参加の仕方は一様ではない:もっと大勢のユーザに書き込んでもらうには に Zipf曲線とウェブサイト人気度 があるが、テーマも語句少ない少数のものにたくさんの投稿があって、あとは少ない。つまり、このページによると、わずかな要素が極度に高い値を示す(図の左端) 中くらいの数の要素が、中間的な値を示す(図の真中部分) 大多数の要素が、きわめて低い値を示す(図の右端) のような感じ。話がずれちゃいましたが、Python を使う人が増えればなぁと、テーマを作って、そこに投稿することにしたので第一弾として投稿。
2006.11.17
コメント(0)
![]()
Open Shakespeare、狙いは大詩人のフリー化 を読む。Open Shakspear というプロジェクトという、おもしろそう。時間がないのでとりあえず興味があるところだけブックマークしておく。このプロジェクト Python で開発されているわけね。Open Shakespeare WikiOpen Shakespear codeOpen Shakespear Web interface DemoAPI を使ったコードの例 (Python) Printing press. Python Gutenberg E-text ProjectGenshi: Python toolkit for stream-based generation of output for the webkidなんとなくシェークスピアの顔と織田信長のこの顔 が似ている。織田信長生誕 天文3年5月12日(1534年6月23日)死没 天正10年6月2日(1582年6月21日)シェークスピア洗礼日1564年4月26日 - 1616年4月23日この年代。時代がかぶっている。宣教師とか西洋画家が持ち込んだ作風の影響ってあるのかな。シェークスピアが安土桃山時代の人と考えるとおもしろい。そういえば、黒澤明監督の『乱』は『リア王』を元にしているのね。時代がかぶっているから、そういう時代・時の空気の真実味ってあるのかもね。
2006.11.17
コメント(0)
![]()
コンピュータばかり眺めているのも目が疲れるので、碁盤が欲しくなってきた。高いものは50万円以上もする。。。。で、とてもそういうものは買えないし、買う気にもならないので、もっと安いものを探す。買うとすると、あまりいいものもいらないけれど、パチンと板に向かってうちたいので、1万円前後かな。そういう値段のものだと 囲碁ラボJAPAN あたりのものになるかな。あと2キロ痩せられたら買うかな。やっぱり人手で1つ1つ作り、かつ少量生産の物って高くなるのね。ソフト開発にしても、この碁盤の板の厚みに相当する部分があると思うのだが、ぱっと目に見えないがために、板の厚みを評価されないこともある。ソフトをほしがる人が、紙に線が引いてあって紙の碁石でいいのか、分厚い木の碁盤で碁石も蛤とかのものがいいのかっていう判断もしづらいのだろう。目に見えるものは分かりやすい。目に見えないものはわかりにくい。もっとも古美術品など、目に見えるにもかかわらず鑑定は難しかったりもするが。ものの良し悪しを見分けるのはむずかしい。
2006.11.17
コメント(0)
![]()
ダイエット、ダイエットと言いながらかなり食べているので、体重が減る速度は遅いのだが、地道に体重を落としている。2006-09-30 あと 8キロダイエット宣言2006-10-07 あと 7.5キロダイエット宣言2006-11-17 あと 6キロダイエット宣言去年の最大体重に比べるとすでに 9キロぐらいは落ちているのだが、まだまだ重い。とはいえ、BMI指数 (体重kg ÷(身長m×身長m))で 25 を切ったので、一応、数字上の肥満の領域は脱した。けど、まだまだ実際のところ太い。でも、とりあえず自分へのご褒美にまた、甘くておいしいものを食べることにした。届くのを待っているところ。あと、小豆を自分で煮て食べた。甘みは控え目にして(普通、小豆を煮るとき小豆と同量の砂糖を入れるだろうが、砂糖はほんの少しだけしか入れない)、甘みを追加したければあとはラカント S を使うとカロリーの低い小豆が食べられる。まあ、全部、ラカント S にしてもいいのだけど、やっぱりラカントSでは脳みそを完全に欺すことができないので砂糖も入れた。これは気持ち悪くなる程度食べても、太るのを気にせずに食べられる。けど、ちょっと作りすぎてしまった。いじになって食べたら、ちょっと気持ち悪くなった。気持ち悪くなるまで食べても、砂糖がほとんど入っていないので太らない。時折死ぬほど食べているのが、案外ダイエットによいのかもしれない。ときおりバカ食いするとひもじい感じがなくなる。食べるときには罪悪感を感じずに満足感をひたすら味わう。もちろん、食べ過ぎたあとの数日は控えめにするとかしてるけど。1ヶ月に 1kg 程度でゆっくりすぎるペースだけど、来年の夏までには動きやすい体重になっていることを目標にする。時間軸では、どんどん要求水準が下がっているような気もするが、まあ、痩せらればなんでもいいかなと。あずきは、あずき屋 で買った。
2006.11.16
コメント(2)
まともにテキストマイニングをしようとすると、最初の関門はテキストをきれいにすること。ウェブ上のデータをとってくると、スクレイピング(必要な部分の取り出し)をしなければならない。テキストの改行を整えたり、よけいなスペースや記号を取り除いたり等、案外手間がかかる。テキストマイニングに使いやすいデータを整えるようなツールが欲しくなってきた。sh1.2 pyblosxom: pythonでスクレイピングsh1.2 pyblosxom: BeautifulSoup使ってみたスクレイピングに関しては、このあたり参考にさせてもらうとして、テキストをきれいにするツールはないかな。加えて、「年間500万台」と「年間五百万台」と「年間500万台」はいっしょに扱いたいし、「一九六三年」「昭和三十八年」「1963年」も一緒に扱いたい。「五十パーセント」「50%」等も一緒にしたい、どこまでやるかはあれだが。んー、結局コーディングルールってことなのかな。ちなみに、直近の内閣総理大臣の資料を探していたら、表記がめちゃくちゃなのね。とりあえず最近は、「第165回」のような表記なで統一されているようだけれど。日本の資料を探るときには、こうした表記の揺れ(というか、時代による表記方法の変移)が、とっても邪魔くさいものになる。日付などもそうだが。過去の資料を日付をベースに何かを探そうとしたときに、表記がバラバラなのでとても効率が悪い。第165回国会における安倍内閣総理大臣所信表明演説第136回国会における橋本内閣総理大臣施政方針演説(抜粋)第百五十一回国会における森内閣総理大臣施政方針演説表記の遷移を追っていくと、それはそれで一つのあれかもしれないが、内容をベースに何かする場合には、ひとまとめに扱えた方がうれしい。住所や名称など、いわゆる名寄せ処理を行ったりするが、それに類似したような処理を作る必要があるなと改めて感じる。長く、そうしたことをやっている人にとってはある意味当然のことだろうが、誰でもぶつかるところに安いソリューションがないというのが、あれなんだな。日本の仕組みってすべからく面倒なところを秘して、そこで関所を作って専門家の地位を安泰化するところがある。この関所を取り払って、もっと上の層でやる方が実り多いと思うんだがなぁ。かなり先に行っている人は、下の方を公開してしまうことによって、下の方にいる競争相手を競争の世界から追い落とすってやり方もあろうが。たとえば IBM なんかがやっているオープンソース的な流れは、そういうことだと思う。底上げをすると上がさらに上に行きやすくなる。
2006.11.16
コメント(0)
![]()
歴代の内閣総理大臣所信表明演説をテキストマイニングの練習材料に使おうと探してみた。しかし、まとめて入手することができない。とてもがっかりした。この手の資料が簡単に入手できるようになってほしいと思う。過去からの資料の蓄積を分かりやすく、いつでも取り出せる仕組みは大切だと思う。なにげなく会計検査院を見てみると、会計検査院決算検査報告データベースがあった。目次を見ると、昭和22年から決算検査報告が公開されている。こうした姿勢は評価すべきことだと思う。しかし、標準共済システム設計・開発業務委託 一式 4億6,788万円ってなんざんしょ。まず、「一式」ってなんなんでしょ。こういう資料も合わせて公開することによってよくなることがたくさんあるということに会計検査院の方は気づいていないんでしょう。そしてまた、NTTデータと官庁の随意契約云々の話が頭をよぎる。入札者の総合評価点数は公表されてるが、評価内容は公表されていない。こうしたことをオープンにする姿勢を会計検査院が率先してやって欲しいと思う。だいたい官庁なんて、受注前に業者に調査協力させて、そこに受注させるなんてよくやっていることだろう。会計検査院は自らの活動についても、生データや資料をできるだけ明らかにし模範となるべきだろう。なんてことはおいておき、官公庁がどのような形で生に近いデータをできるだけ、リアルタイム、さらに継続的に100年後でも利用可能な形で出していくには、かなり頭を絞らなければならないだろう。とりあえず 電子政府のように手続きの電子化という方向があるのだろうが、資料はあとから電子化して公開形式にもっていくのは、とても手間がかかる。不完全な形であってもとにかく電子化したものを公開して後の世の資料として残すことも考えてほしい。後の世のことを考えて作られたものは、今の人にも使いやすいものになる。話がずいぶんそれてしまった。
2006.11.16
コメント(0)
PyBlosxom Manual: 8.5. Dealing with comment spam を読む。contrib にあるものを含めて標準的な Pyblosxom のコメントスパム対策としては、次の方法があるようだ。wbgcomment_blacklistnospam plugincb_comment_reject 関数を使って独自に実装wbgcomment_blacklist は、コメント中に特定の単語が表れたらコメントの追加を拒否するもの。wbgcomment_blacklist プラグインをプラグインのディレクトリにコピーして、config.py に次の行を追加する。load_plugins を指定しているなら、wbgcomment_blacklist をリストに追加する。ログに残したいときは、comment_rejected_words_log を 1 に設定する。不要なら 0(デフォルトは 0)。py['load_plugins'] = ["plugin1", "plugin2", "wbgcomment_blacklist"]py["comment_rejected_words"] = ["poker", "casino", "gambling"]py["comment_rejected_words_log"] = 1上記の設定で、"poker", "casino", "gambling" がコメントに含まれる場合は拒否できるようになる。プリミティブだが、ないよりもよいだろうと、試そうとしたのだが contributed plugins pack 1.2 には入っているが、1.3 には入っていない。なぜかな。wbgcomment_blacklist plugin のページにwbgcomment_blacklist.py ダウンロードのリンクがあるので、そこからたどってwbgcomment_blacklist.py Original Format をダウンロードしてみる。ついでにソースも眺めてみる。ドキュメントの類を除くと、verify_installation と、cb_comment_reject の2つの関数が定義されているだけの簡単なもの。verify_installation の方は、このプラグインがインストールされているにもかかわらず comment_rejected_words が config.py で設定されていなかったり、設定されていてもリストやタプルになっていなければ(例えば文字列が py["comment_rejected_words"] = "casino" のように指定されていたら)、エラーを出すためのもの。実際のコメントスパムをはじくことには関係がない。cb_comment_reject が、スパムをはじくための関数。この関数を見てみると、単純にコメントを小文字に変換して、登録されたブラックリストの各単語があるかを find を使ってチェックして、もし、ブラックリストに含まれる単語があれば、1 と、コメントが拒否されたときのメッセージを返す。ブラックリストにかからなければ 0 を返す。ただそれだけの単純なもの。ここは、いろいろ改造しやすそうなところなので、いずれ手を入れてみよう。とりあえず、"casino" を入れてみると、コメントの本文だけでなく名前や E-mail、URL に含んでいる場合でも、次のように拒否してくれるのを確認できた。Comment rejected: contains blacklisted words.しかし、py["comment_rejected_words"] = ["poker", "casino", "gambling", "ギャンブル"]上記のような設定でコメントを投稿すると、次のエラーが出る。A problem occurred in a Python script. Here is the sequence of function calls leading up to the error, in the order they occurred.UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 0: ordinal not in range(128) args = ('ascii', '\xe3\x82\xae\xe3\x83\xa3\xe3\x83\xb3\xe3\x83\x96\xe3\x83\xab', 0, 1, 'ordinal not in range(128)') encoding = 'ascii' end = 1 object = '\xe3\x82\xae\xe3\x83\xa3\xe3\x83\xb3\xe3\x83\x96\xe3\x83\xab' reason = 'ordinal not in range(128)' start = 0そういえば、この環境はこの間、Fedora Core 6 を再インストールして新しく作りなおした環境で sitecustomize.py を設定してなかった。Python はデフォルトのエンコーディング(sys.defaultencoding) が "ascii" だから普通の落ち方。ということで、/usr/lib/python2.4/sitecustomize.py を作って、次の行を入れておく。import syssys.setdefaultencoding("utf-8")そうすると日本語でもちゃんとエラーを出さずに動くようになった。とりあえず使える。「cb_comment_reject 関数を使って独自に実装」というのは、これを真似して、作ればいいわけね。「8.5.3. rolling your own」は、ほんとうの雛型になる部分だけが書かれているので、これをベースにしてもいいが、wbgcomment_blacklist を雛型にした方が楽かも。nospam plugin を次に見てみる。これは、5桁の数字を含む画像を PIL (Python Imaging Library) で生成して表示し、コメントを入力する人は、その数字を入力しなければいけないという、いわゆる CAPTCHA の仕組み。wget http://www.c-area.ch/code/pyblosxom/plugins/nospam.pyでダウンロードした。インストールは、次のようにする。PIL がインストールされているのを確認。インストールされていなければ(Python を起動して "import Image" でエラーがでなければ OK)、"sudo yum install python-imaging" または "easy_install PIL" とかでインストールしておく。nospam.py をプラグインディレクトリに置く。config.py の py['load_plugins']に追加(load_plugins を使っていれば)config.py に nospam_font、nospam_extension、nospam_allow_trackback を追加。comment-form.html を編集。# 表示に使う TrueType フォントを設定(必須)# 適当に好きなフォントを指定すればいい。py['nospam_font'] = '/usr/share/fonts/bitstream-vera/VeraIt.ttf'# キャプチャ画像のファイル名を設定(オプション)# PATH_INFO がこ nospam_extentsion で終わっているときには、# cb_handle が 1 を返して、プラグインが出力に責任をもってやりましたよと# 教えてやるために使っているものようで、これはデフォルトのままでよい。# オプションなので別のものにすれば、キャプチャの画像のファイル名を変えられる。# 指定しなければ、'/nospam.png' になる。# py['nospam_extension'] = '/nospam.png'# Ted Leungさんの trackback プラグインを使っているとき、# nospam プラグインを通らないようにするために 1 指定する(オプション)。py['nospam_allow_trackback'] = 1上記の設定が終わったら、comment-form.html テンプレートに次のようなコードを追加する。<label for="nospam">Secret Number:</label><img src="$base_url/nospam.png" alt="Secret Number Image" title="Type this number into the field on the right" /><input name="nospam" id="nospam" type="text" value="" maxlength="5" style="width:5em" />これで試してみると画像が表示されない。んー。調べてみると、 197 session = request.getSession() 198 session["nospam"] = number 199 session.save()session undefined, request = Request, request.getSession = NoneTypeError: 'NoneType' object is not callable args = ("'NoneType' object is not callable",)で落ちている。getSession でこけているのが原因か。sessionプラグインも必要なんじゃないのかなと、session.py もプラグインディレクトリに追加すると動作した。ちなみに、さざなみゴシック等の日本語フォントを使うとちゃんと表示できないので英文のものを使った。ところが一難去ってまた一難。ちゃんと画像の数字を入力しても Comment rejected になってしまう。むぅ、そういえば、magicword.py とかプラグインのディレクトリに先に置いてしまっていたのに設定もしていない。これが原因かといったん削除してみると、ちゃんと動くようになった。ついでに Magic Word もチェックしておく。Magic Word プラグインは、"What is the opposite of hot?" という質問を出して、コメントを入力する人は "cold" と答えればコメントがつけられるといったしくみ。CAPTCHA は目が不自由な人には対応できないが、この仕組みであれば、スクリーンリーダーを使っているような人でもコメントが投稿できる。ちょっとバリエーションで一定の知識がある人以外はコメントをして欲しくなければ、知識のない人には答えられない問題を入れてしまうとかもありか(笑)。少なくとも日本語のブログに対しては、日本語が読めなければ投稿する必要もないでしょということで、日本語の問題を入れておくだけでいいので、海外からのスパムに対してはかなり有効だったりするかもしれない。あるいは、問題自体がジョークになっていてコメントを入力するのが、それだけで楽しくなるようなものとか。設定は、config.py に次のように質問と答えを書いておく。py['mw_question'] = "What is the first word in this sentence?"py['mw_answer'] = "what"次に comment-form.py に次のようなコードを追加する。The Magic Word:<br />lt;i>$mw_questionlt;/i>lt;br />lt;input maxlenth="32" name="magicword" size="50" type="text" />lt;br />設定はこれだけ。ちゃんと設定を済ませておけば、nospam プラグインと両立する(まぁ、2つもこんなものがあったらさすがに投稿する気も失せるだろうが、動くか動かないかといえば動くということで試してみた。両方共正しいものが入力されないとコメントが拒否される)。wbgcomment_blacklist がインストールしてあれば、3つとも並立して動かすことも可能。しかし、MagicWord は毎回同じ質問しか出ないので、多少は質問が変化するように改造してもいいかなという気がする。バリエーションとして漢字をランダムに表示してひらがなで読みを入力させるとかいうようなのもありかな。こんなに簡単な漢字が読めない人は、このブログを読んでも分からないだろうからコメントもできないでしょうって。難読漢字の読みのテストを入れるのはさすがに悪趣味だろうな。もっとも日本語入力を求めるような場合、日本語は読めるけれど環境的に日本語の入力ができない人のコメントを拒否することになってしまうから、問題といえば問題だが。何はともあれ、これで最低限のコメントスパム対策はできるようになった。
2006.11.16
コメント(1)
MS、システム管理者向けの新コマンドシェル「Windows PowerShell」v1.0を公開 (窓の杜) を見て Windows Server 2003 Service Pack 1 および Windows XP Service Pack 2 用の Windows PowerShell 1.0 ローカライズ版インストール パッケージ どうしようかなと思う。Microsoft Windows(R) PowerShell は新しいコマンド ライン シェルであり、システム管理や自動化に役立つように設計されたスクリプト言語です。Microsoft .NET Framework を基に設計された Windows PowerShell を使用すると、IT プロフェッショナルおよび開発者は Windows およびアプリケーションの管理を制御したり自動化したりできます。 マイクロソフトのスクリプト センター は、これから一段と力が入っていくんだろうな。GUI での管理からスクリプトを使って管理するスタイルへ。スクリプトが自由に使えれば、自動化がしやすくなる。ここが充実して、必要なことはスクリプトセンターで検索してコピペしてというのがやりやすくなるといいかもね。Linux は逆にスクリプトが中心だったところから GUI 化がどんどん進んだりして、結局、同じような感じで、GUI による管理も、スクリプトによる管理も、どちらでも好きに選べるような時代になっていくということかな。理想的には GUI からでもコマンドラインからでも、同じことができて、GUI からコマンドが自動生成されるようなものだったりするが。と考えると Visual Studio も Windows PowerShell に対応してなんていう方向かな。とりあえず試すのも面倒なので使わないけど、記録だけしておく。
2006.11.15
コメント(0)
![]()
SEC Enhances Online Search Capabilities for Investors検索はここからEDGAR Full-Text Search日本でもやってほしいものだ。話は違うが、証券取引に関しては、日本はアメリカに比べてかなり遅れている。アメリカの証券取引調査業務と証券営業の変容 なんて資料もおもしろい。
2006.11.15
コメント(0)
「スパムはファイアウォールの手前で廃棄せよ」---セキュアコンピューティング社長 を読む。この流れは明確にあると思う。ISP がどのような形で、どこまで何をやるかが興味深い。できないメリット なんてこの間書いたが、たとえば、迷惑メール対策の「Outbound Port 25 Blocking」にしても、一般向けのサービスではどんどん取り入れられている。IIJ、個人向けサービスIIJ4U・IIJmioの迷惑メール対策を大幅に強化 - Outbound Port 25 Blockingの規制を拡大 -。IIJ も始めたようだ。こうやって、発生源をつぶしていく方向が一つあるが、目的地の手前でも早めにつぶしていくというのは一つの方向。問題は、こうしたサービスがあちこちで動くことになってくると、うまく接続できないときに、どこで、どういう理由ではじかれているのかの判断が難しくなること。パーソナルファイアーウォールの類も接続のレベルでは問題の発生源によくなるし。1つのパケットが、こちら側からあちら側に届くまでにはいくつもの関所を通り抜けていかなければならない。関所の数は日々増える。さらには、List of the 13 Internet enemies in 2006 published のような国では、当局による検閲も行われている。某国の彼から私に送られてきたメールのパケットは、いったいいくつの関所を通り越してきたのだろうか。なんて考えると感慨深いものがある。
2006.11.15
コメント(0)
PyBlosxom and Comment Spam を見る。表に公開するブログにコメントスパム対策は必須だから、ちょっと、このあたり力を入れて見ることにしようかな。とりあえず、Pyblosxom にも CAPTCHA は入れることができるようなので、そのあたりも試そう。コメントを付けられるようにする comments.py ではコメントが投稿されたときにメールを送信するようにできるが、そのあたりも問題がある ようで パッチ が公開されている。メールを飛ばすのはまだ試していないが日本語のメールがちゃんと扱えるようになるかも試してみないといけないな。PyBlosxom Hacks and Plugins Benjamin Mako Hill を起点として copyrighteous のブログの方を見直せば、Benjamin Mako Hill さんのコメントスパム対策が理解できそう。PyBlosxom and Comment Spam についているコメントとか も参考になるかな。日本語の情報としては、SH1.2 Pyblosxom: コメントスパム を後で参考にする。Magic Wordプラグインを試しているようだ。とりあえず、Pyblsxom のマニュアルの方をベースにまず見て、そっちが分かったら、あれこれ試して見ることにする。仕組みでコメントスパムをはじく方法だけでなく、中身ではじくというのも興味あるところだな。手動でこまめにコメントにしてもトラックバックにしてもつける人もいるようだし。微妙なやつは人手で削除するより、このブログへのコメントやトラックバックは、こういう基準で自動的にはじいたり削除したりしてますよと自動削除を動かすというのも気分的に楽だし。
2006.11.15
コメント(0)
![]()
「首都圏 請負・派遣適正化キャンペーン」(平成18年10月1日~11月30日)いま一度 その請負を 自主点検!~なくそう「偽装請負」 守ろう「労働条件」~「情報サービス業における請負・派遣適正化セミナー」のご案内 は盛況なようで、追加開催のご案内 が出たが、これも締め切りなっている。大盛況。あらたに、「派遣先事業主・責任者研修会」のご案内が出ている。以前に偽装請負 に偽装請負は IT 業界で普通にやっていることだろう。「製造業の次は IT 業界かな。」と書いたが、ちょうどこのときセミナーの直後だったのね。ちょっと書くのが遅かったか。コンピュータシステムの開発・運用業務等に関する契約の中には、数次にわたる会社間の請負契約(業務委託契約を含む)を経て受託者側の労働者が、就業先であるエンドユーザーの指示のもと就労しているケース(中には労働者を別の会社に紹介するだけの会社も存在している)や個人事業主と称して請負契約を結びながら、就業先である相手方から労働時間の管理・業務の指示等を受け就労しており、実態として個人事業主ではなく労働者と判断せざるを得ないケースの存在も見受けられます。これらのことは、労働関係法令遵守の面からも、また個人情報の管理の面からも問題です。これ業者は違法だって知っていて確信犯的にやっているわけだから、懲罰を厳しくしないとダメだと思う。ここを是正すると IT 業界もよい方向に変わる。五重派遣とか滅茶苦茶な例も多々あるしねぇ。これは冗談ではないのだ。人材派遣やっている人は、良心ない人が多い。まともにやる、人知れずつぶれる業者も出てくるだろうが、その方が業界が健全化される。
2006.11.14
コメント(0)
Pyblosxom Manual Chapter 8. Comments を読む。この章には、コメント、トラックバック、ピングバック、CommentAPI といった機能を持つプラグインのインストールについてまとめられている。Pyblosxom にはそうした機能が本体に組み込まれていないから、プラグインの設定が必要。ちょっと面倒。もっとも、文章でだらだら書いていると長いけれども、実作業はテンプレートを自分で編集しないのであればあっという間に終わる。あっという間に終わるような設定でも、手作業がいくつもあると、やっぱり全体としては面倒。インストールしてコチコチコチとクリックしながら変更すれば設定終わりという世界ではない。分かってしまえば融通も効きそうでよいのだけど、最初に使うときは、やっぱり躊躇してしまうところ。やってみるとあっけないのだが。Pyblosxom の contrib を sourceforge からダウンロード して使う。はじめて Pyblosxom は使う人は、本体をダウンロードするのといっしょに contrib-1.3.0.tar.gz をダウンロードしてしまうのがよいと思う。あるいは Pyblosxom のプラグイン にも書いたが svn で最新のものを落としてくるか。でも、やっぱり設定は必要なのでこれから見ていく。コメントプラグインを有効にするためには PyXMLモジュールがインストールされている必要がある。これは、Pyblosxom とはまったく別のモジュールなので、sourceforge からダウンロードしてくるか、Linux ディストリビューションのパッケージをインストールすればよいだろう。Fedora Core なら "$sudo yum install PyXML" でインストールできる。または、easy_install にも対応してる("$sudo easy_install PyXML")。まずはファイルのコピーと config.py の設定contrib/plugins/comments/plugins/comments.py をプラグインディレクトリにコピーする(config.py の py['plugin_dirs'] = で指定したディレクトリ)。config.py を編集して、load_plugins に "commments" を追加する (py["load_plugins"]=["hoge", "comments"] 等。load_plugins を使っていなければプラグインディレクトリにコピーするだけで動く)データディレクトリ内にコメント用のディレクトリを作成し、comment_dir を設定する。コメントが保存されるときの拡張子名(suffix)を comment_ext に設定する。デフォルトは .cmt。コメントを書き込むディレクトリは pyblosxom.cgi が書き込みが可能であるようにしておく(コメントはデフォルトで datadir 内に comments というディレクトリが作成されて、記事と同様のディレクトリ構成で XMLファイルとして保存される。ファイル名は entryname-datetime.suffix。コメントが書き込まれたり、トラックバックがあったときにメールが飛ぶように設定する(メールが不要なら設定の必要なし)。# SMPT サーバを設定py['comment_smtp_server'] = "smtp.example.com"# メールの 送信者を設定py['comment_smtp_from'] = "kugutsushi@example.com"# メールの 宛先を設定py['comment_smtp_to'] = "kugutsushi@example.com"次は、フレーバーの設定。"comment-story"、"comment"、"comment-form" の3つのテンプレートがあるので、それぞれ適宜編集する(編集しなくてもコピーするだけで使える)。フレーバーファイルを contrib/plugins/comments/flavours からプラグインディレクトリにコピーする(html.flav と rss.flav へ)。なお、すべてのファイルをデータディレクトリにコピーする必要がある。テンプレートの役割は次のとおり。"comment-story" は、コメントが書き込まれる記事のテンプレート。"comment" は、comment/trackback/pingback の個々の書き込みのテンプレート。"comment-form" は、新規コメントを入力するためのテンプレート。"story" テンプレートと "comment-story" テンプレートでは、変数 $num_comments を使うことができる。この変数の値は、当該記事に関連づけられるコメントの数が設定されるので、コメント(3) のようにコメント数を表示したいときに使える。"commment" プラグイン使えるのは、$cmt_title (コメントのタイトル)、$cmt_description (コメントの内容または tracback/pingback の excerpt)、$cmt_lin (この記事に言及している pingback link)、 $cmt_author (コメントまたはトラックバックを書き込んだ人)、$cmt_pubDate (comment/trackback/pingback の日時)、 $cmt_source (トラックバック元)。なお、comment*.html のテンプレートは $変数 をのぞいて通常の HTML ファイルの部分が書き込まれているだけなので、HTML やスタイルシートが分かれば編集に苦労することはないだろう。で、薄いグレーの文字にしてあるところはとりあえず省くこともできるので、実際のところ、ほんの少しの手作業でコメントプラグインは一応動かすことができた。次は、コメントスパムをはじくための対応をしてみる。(つづく)
2006.11.13
コメント(0)
全79件 (79件中 1-50件目)
![]()
