全37件 (37件中 1-37件目)
1
タ"アタ"ルト・サイトは相互リンクが多い,トレンドと東大が研究成果を発表 を読む。「アタ"ルト・サイトは相互リンクが多い」なんていうのは誰でも分かることで、それ自体は単に数値として証明したところであまり意味はない。それが題名にされているのは、まあ、目立ちやすいようにということなんだろう。で、中身。この記事には明記されていないがクローリングはたぶんトレンドマイクロ にやってもらったのだろう。トレンドマイクロはこれ以前に膨大な量のクローリングを常時行っているから。それに東大から膨大なアタ"ルトサイトへのアクセスが下手にばれると体裁が悪いからw まあ、各種リソースはトレンドマイクロ側が提供したと推測。いわゆる産学連携ってやつね。そこを協調すると トレンドマイクロ、東大の知力でセキュリティ機能向上を狙う みたいな記事なるか。到達ホストのカテゴリ比率を見ると見にくいけど、おもしろいかもしれない。「芸術/エンターテインメント」分野のあるウェブサイトを選び、ページ内リンクに飛ぶとする。1ページ先のリンクが有害サイトの確率は0.27%。以降、2ページ先のリンクで0.68%、3ページ先のリンクで2.69%と、有害なサイトにたどり着く可能性が上昇していく。と記事にある。芸術・エンターテイメントを安全なカテゴリとしてとらえて、そこからの確率なのだな。ゆえに、実際のところスタートするカテゴリによっては、安全なサイトからでも、1クリックごとの危険性が高い分野もあるということか。今回の「Webリンクの構造解析」について、「グローバルで共有できる優れた研究成果が上がってきたので、半年で区切らずにこれからも続けていく」と大三川氏は述べている。地道に継続的にやっていくとおもしろい分野だろうな。比較的安全なリンクしか表れない検索エンジンとかだってありえるわけだし。アタ"ルトサイトどうしのつながりは強い「周りを見ればそのサイトが分かる」、東大とトレンドマイクロが共同研究 も、とりあえず釣りとして東大とアタ"ルトサイトをキーワードに使っている。こうやって、東大とアタ"ルトサイトとの共起度が高まっていくのが笑える。東大がアタ"ルトサイト研究の権威となる。アタ"ルトサイトで検索すると、東大の記事がトップに来る日wこういう視覚化は無条件に好き。黒系統の背景に蛍光色っぽい感じのがきれい。同じ図でも、白地に単一色だと地味になる。色に意味があれば情報量も多くなるなんていうのは二の次で美的な問題としてきれいなのは好き(次の絵は上記記事より)例えば、ジャンプ先のURLを解析したところ、「どこから出発するかによって、到達するところはかなり異なる」(東京大学大学院情報理工学系研究科講師の増田直紀氏)という。アタ"ルトサイトはアタ"ルトサイトにリンクすることが多い。一方、不動産サイトはリンク先がきれいに階層化し、分散して枝分かれしていたり、ストリーミングサイトは逆にいくつかのサイトに集中し、相互にリンクしていたりといった具合だ。とかあるから、アタ"ルトサイトだけ研究対象にしたんじゃなかろうな。まあ、アタ"ルトサイトがというときには、他のものとも比較しなきゃ何ともいえないところがあるから健全。どの程度、広範囲な分野でやっているかが興味あるところ。リンク関連からカテゴライズというのは、古くて新しいところがあるのかもしれない。言語やテキスト情報に頼らず類推したり、分類の精度を高めていくことができるのではないかというところがトレンドマイクロの製品開発に直結するところだな。「安全サイトから3クリックでアタ"ルトサイト」の確率は2.69% 東大が解析 は、 安全なカテゴリのサイトでも、リンクをたどるにつれて有害サイトに到達する可能性が高くなることも判明した。安全なサイトの3リンク先がアタ"ルトサイトである確率は2.69%になった。と、おもしろいところを拾ってきた。It's a mall world after all.安全なカテゴリからアタ"ルトサイトに到達する可能性は1ジャンプで10倍【東京大学とトレンドマイクロ共同研究】 も、その点について説明している記事。すべてのカテゴリについて、コンピュータ/インターネット関連や検索エンジン/ポータルサイトへの結びつきが強いことが認められたという。だが、18以上ならサイトを見る、18未満なら見ない Exit という類のリンクで見ない方を選択するとポータルサイトに飛ぶことが多いことや、ポータルサイトのブログを使ったアタ"ルト系ブログものとかも沢山あるから、そういうことになるのだろう。安全なサイトもリンクたどれば危険なサイトへ - トレンドマイクロと東大が共同研究 も、同系統。セキュリティ系ほど危険性を煽るところが使われる。トレンドマイクロにより38カテゴリに分類された1200万件のURLデータベースを解析。危険サイトや有害サイトのリンクに関する実態の把握や、ウェブ閲覧時の危険度予測技術への応用可能性を検討した。この記事を見て、やっと 38カテゴリの分類が使われていることが分かった。東大とトレンドマイクロ、情報セキュリティ分野の共同研究で連携 東京大学とトレンドマイクロが情報セキュリティ分野の共同研究で連携 1200万以上38カテゴリに渡る大規模Webページデータの「Webリンク構造の解析」成果を発表~ は、プレスリリースなので、網羅性が高い。というか発信源からの情報だものね。トレンドマイクロのサイト 東京大学とトレンドマイクロが情報セキュリティ分野の共同研究で連携 ~1200万以上38カテゴリに渡る大規模Webページデータの「Webリンク構造の解析」成果を発表~ が大元。3.巨大クリークの存在 性的カテゴリ内で930ドメインが全て相互リンクする集合が確認された。ネットワーク上のアタ"ルト業界地図。コンテンツ製作系、配布・販売系、情報配信・掲示板系、出会い・チャット系、風俗系、リンクアフィリエイト系でコアなところがあって、それらの相互リンクと、どわーっと広がるゴミ系のような感じになっているかな。イメージ的には。コアの資本を調べるとおもしろかもしれない。資本的には暴力団系がフロント・舎弟系も含めてかなり入っているのだろう。有害サイトのネットワークを可視化する研究--東大とトレンドマイクロを見ると、4人の人間が4人とも友人同士という親しい関係が存在することはあるが、10や20を超える関係はほとんど存在しないと前置きした上で、542個のクリークを検出し、中でも最大のものは930のホストノードを有するものだったと語る。930のノードそれぞれが、他の929ノード全てとリンクを結び合っているという巨大なクリークだ。やっぱり派閥はあるわけだな。山口組系とか、稲川会系とか、蛇頭系とか、マフィア系とか、そういう分類から考えても、コアの部分では距離が出るものがあるのかもしれない。クリークの中にそうしたフロント系のものを見つけると、色分けがある程度できたりして。まあ、このあたりは警察や公安の情報がないとなかなかできないだろう。何にせよ、競合があるからこそ、アフィリエイト系やリンク系が生じるわけだしな。そういえば、日本の株式市場が冷えている一つの原因に、マネーロンタ"リング対策があると思う。これは仕方ないと思うのだけど、意外に影響が大きいんじゃないかと。顧客の本人確認、3月義務化=犯罪収益移転防止法を全面施行 でさらに厳しくなるから、全体的にそうしたアングラマネーの動きが慎重になる傾向にあり、これが仕手筋の動きにも繋がっている可能性を感じる。つまりアングラマネーの金の巡りが悪くなっている。新興市場なんかも、実はアングラマネーがけっこう動かしていた銘柄も多いから打撃が大きいのだろう。なんていうのはさておき、mixiに「関連が強いコミュニティ」表示機能 とかも、関係性のお話だけど、村社会の日本では関係性の話題っていうのは、向いている方向なのかもしれない。評判系とかもだけど。この話題とはちょっと違うけど 悪質なアフィリエイト参加者がつくる「ワードサラタ"」に注意 - ワークスタイル - nikkei BPnetとか、それ系って本当に多い。そういえば 経済産業省: 情報大航海プロジェクト ってどうなっているんだろう。金使っている割に情報開示度低い。最近、どこの官庁も調達関連でこまめに開示してんのに、情報古代航海プロジェクトって、どういう風に金が使われているか、まったく分からない。国民はステークホルタ"ーだ。ステークホルタ"ーに予算とプロジェクト進行の報告を怠るプロジェクトは、タ"メじゃ。ましては期待を煽ったプロジェクトなんだから。景気が悪いんだから楽しいネタを振りまいて干し芋のだ。
2008.01.29
コメント(0)
とりあえず、使わない Python 3000 ではあるが、もっと知りたいPython3000:第3回 言語仕様,組み込み関数,クラスへの変更|gihyo.jp … 技術評論社 を読む。nonlocal文は 2.x ではなかったから、2.x → 3.x への移植では問題なし。その逆のバックポートのときだけ問題になるか。例外(except)の変更は、んー、これはめんどくさいけど地道に直すしかないだろう。けっこう痛い。print()関数,exec()関数、メタクラスのあたりも、観念して地道に直すしかないか。xrange は、Python 3.0では組み込み関数のrange()はイテレータ風のrangeオブジェクトを返すようになります。で xrange() は不要になったので廃止。やっと、range(10000000000) とかでも気にしなくて済むようになった。こういうとき、Python 2.x だと xrange を使わないととっても遅かった。xrange → range は一括文字置換で変えても問題ないから嬉しいけど直さないといけない。map(),filter(),zip() がイテレータを返すようになったのはすでに経験済み。人が書いたものを 3.x用に移植するときには、いちいちその箇所を見て、書き換えが必要になることが多いだろうな。けっこう多いだろうな。関数への注釈(Function Annotations)は、引数にドキュメントストリングが入れられるようになったのね。これは追加だから、バックポートするとき以外問題なし。その他の変更は、数的には大きいなぁ。でも、全体的に機械的に移植できないことはないこともないという感じなのかな。やっぱりコンバータに変換させて、何か問題あれば手で直すってやつか。次回は,Python 2.xから3.0への移行方法や,2.xと3.0間で互換性を保つための方法について解説します。らしいので、期待しておこう。Pure Python のプログラムとかは移植できても、問題は C とかで書かれた拡張モジュールとかなのだな。仮に、コンパイルし直すだけで動く可能性があったとしても、コンパイルし直さなければならないし、書き直さなければいけないのであれば作者が対応してくれるの待ちって感じになるだろうし。そういう話もそのうち出てくるのかな。大いに期待しておこう。あと ctypes とか Python 3000 でも 2.x と同じように使えるのかなとか気になる。この連載の著者の柴田淳さんが、Webエンジニア武勇伝 14回 に登場している。ついでに、TRIVIAL TECHNOLOGIES 2.0 を見ると もっと知りたいPython3000 - 言語仕様,組み込み関数,クラスへの変更 の記事があった。このような関数と,以下のように定義したargcheckをデコレータとして組み合わせると,引数の型チェックが行えます。関数定義の直前に「@argcheck」と書いておくわけですね。ふーん、なるほど、そういう使い方も可能性の一つとしてはあると。PEP: 3107: Function Annotation の下の方に の類とか Type-checking module for Python とかリンクがある。typecheck 0.3.5。作られる過程でそういう人たちのニーズが組み入れられているから、単なるドキュメントストリングを入れたというだけでなくて、そういう用途も意図してるわけね。
2008.01.29
コメント(0)
日本語係り受け解析器 Cabocha 0.60 pre2 ちょっと使う してみたが、京都大学の 日本語構文解析システム KNP も公開されている。KNPを試してみるにデモがある。ソースコードや Windows 版のバイナリも公開されている。JUMAN/KNPのチュートリアルのスライド (ppt)(京都大学学術情報メディアセンター, メディア情報処理専修コース「自然言語処理技術」, 2005/08/30) を見ると、インストールの仕方から使い方まで分かる(KNP に加えて、日本語形態素解析システム JUMAN と ActivePerl を使ったチュートリアル)。ちなみに、JUMAN も 5.1 のあとに 6.0 が控えているのね。リリース準備版のソースが公開されていた。そのうち試してみることにしよう。Cabocha と KNP の比較とか。とりあえず、くだらない比較。Google で 「Cabocha 係り受け」 の検索結果 約 5,350 件 Google で 「KNP 係り受け」 の検索結果 約 442 件Google で 「ac.jp での KNP 係り受け」 の検索結果 約 141 件中Google で 「ac.jp での cabocha 係り受け」 の検索結果 約 209 件数的には、Cabocha が勝っている。速度も Cabocha の方が速い。というか、JUMAN vs MeCab の時点で差が出てしまうので、MeCab + JUMAN 辞書とかで試すか。純粋に係り受け解析だけの速さを比べないと不公平だな。そのうちやってみよう。そもそも、正確さを見ないと意味がない。ということで、そのうち結果を比べてみる。どうもそのうちといいつつ溜まっていて、やりたいことが 10個ぐらいになってきたかもしれない。。。。。3歩で忘れる鳥頭。そういえば、「クチコミ好感度計算サイト BuzzTunes?」が2008年1月11日をもって一旦閉鎖になっているのね。なおブログ記事クロールと構文解析インデクシングについては引き続き質量とも強化しつつ、今後は外部へのAPI及び解析データの有料提供に特化する形で「BuzzTunes?データベース運営事業」を継続してまいりますので、何卒宜しくお願い申し上げます。 らしい。とりあえず、一旦閉鎖は残念。再開の日を待つことにしよう。
2008.01.28
コメント(0)
紹介 - 「勝手にブログ評論」評論 から 勝手にブログ評論 を知る。で、使ってみた。自分のブログを試してみると、有価証券報告書、マンダレイ、インフルエンザが抽出されて、いろいろ作られた。とりあえず、自分のブログでも使ってやってみるといいだろう。でも、アクセス数が多いから生成される文が短くなっているとかいうことあるのかな。端的には人工無能的やり方。RSS を読み込んで、そこから名詞のリストを作って、単語を選択してテンプレートに当てはめるというやり方をしているようだ。名詞の抽出は、これはストップワード検出というやり方でやっているらしい(正規表現で大胆に抽出している)。どういう正規表現かは あなたのブログ、評論します。 に書かれている。勝手にブログ評論がα版へと無意味にバージョンアップ に「勝手にブログ評論」の原理を解説をしたUstreamビデオがあったので見てみる。モンタージュ効果についてなども話している。ここで言うモンタージュ効果は、人間にはモンタージュ効果というものがあり、全く無意味な現象の組み合わせでも、その順番にストーリーを見いだしてしまう傾向があります。失敗のススメ、成功の罠あるいは、しかし人間の意識にはモンタージュ効果というものがあって、全く意味の無い数字や文字の並びであっても、意味を見出してしまうのです。つまり、3,8,1,5と続いてきたら、奇数が多いから次は偶数だ、などとなんの根拠も無いことを瞬時に思ってしまうのです。ジェフ・ホーキンスは知性とは予測だと定義しましたが、とんでもない。知性とは妄想する能力だと思います。3,8,1,5の並びにはなんの意味もありません。けど、人間は次を予「想」するのです。予「測」ではありません。予測とは根拠のあるものですが予想にはありません。ゲームと無料喫茶店とニュースサイトが毎日更新される理由のような話が出てくる。なんだか分からなくても、出てきたものを見ると解釈してしまう。そういう意味では、傀儡師を脳内メーカで見てみたら とか、想像力をかき立てるもの、相関図ジェネレータ みたいなのも同じカテゴリに自分の中では入る。あるいは、My三国志の相関図ツクールとかも。でも、視覚に訴えるものと、言語に訴えるものは、また、違うところが刺激される。クレショフ効果クローズアップの無表情な顔の映像に様々な映像を組み合わせてみると、同じ顔であるにもかかわらず、後に繋がる映像によって最初の顔の印象が変わって見えるというものだった。後の映像が食べ物なら空腹を連想させ、棺おけならば悲しみ、女性なら欲情という具合。逆に、何かの後に人の顔を繋げると、その表情によって映像の意味を変えることもできる。モンタージュ理論エイゼンシュタインのモンタージュ「パッと見ほとんどつながりがないようなもの同士をモンタージュして、ただ補完するだけではなく、新しい意味を作り出す」というモンタージュを始めるわけです。考え方としては、ショットAと、それに続く(空間的・意味的に明らかなつながりのない)ショットBが衝突することによって、新たな意味が生まれる、っつうことですね。これを衝突的モンタージュ(Conflictive Montage)と呼びます。一般的には、これがエイゼンシュタインのモンタージュ、ということになります。映画学入門 Week5 (その3)その他参考モンタージュ理論のクレショフ効果クレショフ効果: クレショフの実験を再現これに加えて、プライミング効果という言葉が頭に浮かんだ。先行する事柄が後続する事柄に、影響を与える状況を指して「プライミングの効果(または”プライミング効果”)があった」と称される。そのような状況における「先行する事柄」をプライムと称す。先行する事柄には、単語、絵、音などがありうる。例えば、「医者」という言葉を聞くと、その後「看護師」、「あかひげ」などという言葉の読みが、「富士山」や「帰郷」という言葉の読みよりも早くなるのはプライミング効果があったこととなる。記憶 (Wikipedia)そうすると、連想の技術、プライミング効果、履歴からお薦めWebページこのエントリーを含むはてなブックマーク が見つかる。ふとキーワード抽出法で検索してみると ドキュメントからのキーワード抽出法の研究 なんていうのがヒットした。従来、作成者がテキスト内容を解読し、シソーラス用語を用いキーワードを設定してきた。しかし、大量のテキストに対し、人手によるキーワード付与には限界があり、情報提供に対するタイムラグ、キーワードの質の揺れ等の問題が生じ、検索精度に影響を及ぼしている。 これらの問題回避のために、テキストの内容を自動解析し、テキスト内に出現する単語を対象にキーワードとして抽出するキーワード自動抽出システムが提案されているで、次に 行動ファイナンスが頭に浮かんだ。代表性バイアス、保守性バイアス、損失回避バイアス、トレンド追随行動、自信過剰、云々。行動ファイナンス理論と株式市場分析 (野村證券)。 野村證券【サブプライム直撃】赤字転落 からの孫引き 古賀社長は「激変する市場で絶えずマイナスを回避する状況を作り出せるかといわれたら、『神様でなければ無理』という考えもある」と釈明した。行動ファイナンスの社会心理学的基礎 なども見てみる。熱狂やパニックが起こるプロセスは、一般に6つのステップがある。構造的誘発要因ストレイン(緊張や不安)一般的な信念きっかけ要因特定の信念行動への動員そこから、東京新聞:不正取引で7600億円損失 仏大手銀、職員が越権行為:国際(TOKYO Web) に繋がる。すごい、しびれちゃう。これ自体はサブプライムローン問題とは関係無しに出した損失らしい。けど、サブプライムローン絡みの損失も何気に増えている。事件を起こしたのはジェローム・ケルビエル氏なる 31歳の人らしいが、約49億ユーロ(約7600億円)とは、すごい。脳天しびれただろう。よくバレずにそこまで損失を広げられたものだと思うと、優秀なんだか、優秀じゃないんだか。んー、でも、やはり、こういうときには、生け贄ってやつが必要なわけだな。ソシエテ・ジェネラルはまた、米サブプライム住宅ローン関連で新たに二十億五千万ユーロの評価損が出たことも公表。これら損失により二〇〇七年の利益が減少したことを認め、資本増強のため五十五億ユーロを調達すると明らかにした。巨額の損失を計上するついでに、サブプライムローンの評価損追加が二十億五千万ユーロか。それでもニュース上では、個人の不正がサブプライムローン関連の損失を覆い隠しちゃった感じ。Rogue Trader(詐欺師トレーダー)。SocGen trader cooperating with French police | Reuters にも顔写真がある。さらしもの。7600億円といえば、Microsoft が過去最高の売上でまたも好決算 で、純利益が 47億700万ドルだから、一人でマイクロソフトの純利益を吹っ飛ばしても余りある損失を出したというのがすごい。ちなみに営業利益が64億8100万ドルだから、それよりもでかい。やっぱりすごすぎる。脱線しすぎて何のことやら状態なので終わり。
2008.01.27
コメント(0)
日本語係り受け解析器 CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer の cabocha 0.60 pre1 がリリースされていた。ダウンロードしようと思ったらすでに pre2 がリリースされているので、そちらを使ってみることにした。ちなみに、バージョン番号からも分かるとおり、まだ正式リリース前。変更点:- UTF8対応 (./configure --with-charset=UTF8)- 文節区切りと固有表現抽出に CRF (実装はCRF++)を使用- ChaSenへの依存を廃止し、MeCab のみのサポートに- 固有表現を行う前に文字列の正規化を行うことで若干の精度向上- 簡易並列処理の廃止。係り受けのみ- APIの一新、より粒度の細かい制御が可能- PerlやMakefileに依存していた部分の排除。- 単一バイナリ cabocha-learn による学習の簡易化 (Windows でも学習が可能)- TinySVMへの依存を排除。単体で学習可能- Juman のサポートを復活。ただし、形態素解析は mecab-juman に限定- 評価ツール caboca-system-eval の提供 cabocha 0.60 pre1UTF-8 に対応したということなので UTF-8 で使うことにする。とりあえず Windows でインストール。Shift-JIS と UTF-8 の選択があるので UTF-8 を選択すると、Shift-JIS のモデルファイル等、途中で自動的に UTF-8 にコンバートしてくれていた。とりあえず cabocha.exe を動かそうとしたら、morph.cpp(103) [charset() == decode_charset(dinfo->charset)] Incompatible charset: MeCab charset is SHIFT-JIS, Your charset is UTF8そういえば、Windows の MeCab は Shift-JIS で使っていたので、とりあえず Shift-JIS でインストールし直してみると動くようになった。以前に、ctypes で CaboCha を使う してみたが、0.60 pre2 で動くか確認してみた。とりあえず同じ方法で動くことまで確認。ついでなので簡単な自分用のベンチマークテスト。2倍ぐらいの速さで処理できるようになった(純粋な速さの違いは調べてない)。以前は ctypes で CaboCha を使う のやり方だと MeCab をどうやって使えるのか分からなかったので以前の Chasen ベースと比べても意味がないので、コマンドラインから -amecab をつけて以前のバージョンと比較してみたが、2倍ぐらいやっぱり速くなっているので、フルスクラッチで書き直したという効果が出てるみたい。すばらしい。cabocha 0.60pre2Version Number: Windows NT 5.1 (Build 2600)Exit Time: 3:11 pm, Sunday, January 27 2008Elapsed Time: 0:00:10.906Process Time: 0:00:00.046System Calls: 338614Context Switches: 144132Page Faults: 42346Bytes Read: 1304199Bytes Written: 6772557Bytes Other: 169688cabocha 0.53Version Number: Windows NT 5.1 (Build 2600)Exit Time: 3:10 pm, Sunday, January 27 2008Elapsed Time: 0:00:21.984Process Time: 0:00:00.031System Calls: 614361Context Switches: 255871Page Faults: 60164Bytes Read: 2329855Bytes Written: 2992005Bytes Other: 890287解析結果がどう変わったかはよくみてないが、固有表現タグを数えてみると B-PERSON をカウントしたら同じテキストに対して、以前 vs 最新が、174 vs 154、B-LOCATION が 406 vs 385 と減っている。例えば「沢山要する」とかいうのが、以前は沢山が固有名詞-人名-姓の「沢山」さんになってしまっていたのが、今は副詞の「沢山」(たくさん)に解析されるようになったりとか、よいところはあるみたいだけど全般的にどうかはちゃんとみてない。旧バージョンでは「昭和初期の」とか「昭和」が B-DATE だったのが、新バージョンでは B-LOCATION に悪くなってしまったりするところもあるみたい。「明治維新」はどちらも B-LOCATION で嫌だ。「イソップ」が B-ORGANIZATION になってしまう。今まで気がつかなかったが、イソップ 名詞,固有名詞,組織は辞書が悪い。なんで組織になっているんだろう。XX総理大臣って、組織?。細かく見ていくと、アレアレは見つかる。とりあえず気力が今ないのでここまで。係り受けがどの程度うまくできているか、どの程度変わったか等、見てない。
2008.01.27
コメント(0)
PythonMagazine の Vol. 2 (January 2008) が出ていた ($6.99)。今、あまり、読む気力がないので購入していない。Rethinking Regexctypes: Easy C in PythonRuling Nessus with PythonCommand line programs are classes, too!COLUMNSHappy New Year!Of Tests and AutomationIterators, Iterables, and GeneratorsThe Python Market - Python Inside?どこかの出版社でも、何号か出たところで、まとめて翻訳権を買い取って日本語版の書籍としてでも出してくれればいいのだけどなぁ。
2008.01.27
コメント(0)
矢野経済研究所など、企業の有価証券報告書を簡単比較できるシステムを開発 を読む。本システムでは、九州大学 廣川佐千男教授が開発した独自技術である「ConceptGraph?」および「MINDEX?」を活用、 利用者の方が入力した報告書から、特徴的なキーワードが抽出され、ツリー状のマップにより表示されます。これにより利用者は検索しようとしている 市場領域のみならず関連する製品、技術、ニーズ、周辺ビジネスなどに対する“気づき”を得ることができると同時に、そのキーワードを中心とした 市場トレンド全体を俯瞰することが可能となります。有価証券報告書を対象としたテキストマイニングサービスを開始 矢野経済研究所 も眺めて、トライアルページから デモ を見てみる。トライアル版では、分析対象企業の一部について、実際の機能をご利用いただくことができます。分析対象企業は「東芝、村田製作所、松下電工」の3社です。ということで、対象が限定されているが雰囲気は感じることができる。ここで使われている技術は Lafla(らふら):Laflaの技術Laflaの技術は大きく3つに分かれます。1つ目は、文章から単語を抽出し、その出現頻度に基づき単語間の関係を分析するテキストマイニング技術。2つ目は、単語同士の関係を視覚的にわかりやすく表現するための視覚化技術。そして、3つ目は、インターネット上から目的とするデータを効率良く収集するWebクローラー技術です。Lafla MINDEX なども見てみる。インターフェイスとしてはおもしろいとは思う。でも、それよりも トヨタ株など「51%取得」虚偽報告か、川崎市の企業・金融庁調査 ってすごいのがまたでてきたなぁ。トヨタ自動車、ソニー、NTT、三菱重工業、フジテレビジョン、アステラス製薬の6社の株式51%を取得したとEDINETを通じ発表した。その額、約20兆円。EDINETを見てみると、大量保有報告書の提出に関する調査について 本日16時12分頃、以下の発行会社に係る大量保有報告書が関東財務局に提出されました。 しかしながら、当該取引については、同報告書によれば、全体で約20兆円という異例な取引規模となっていることから、金融庁としては、現在、急ぎ事実関係を調査中であり、仮に虚偽記載と認められれば、訂正命令を含め厳正に対処します。と出ている。EDINET といえば ジャストシステム、EDINETに対応したXBRL形式データ作成ソフト の発表が 1月17日(プレスリリース [ 2008.01.17 ] 金融庁が4月より開始するEDINETへの XBRL形式での提出データの作成・活用ができる 「xfy Report Writer for XBRL(R) EDINET対応版 2008」を2月26日(火)より発売)。データ作るところまではいいとして、電子化されたものにチェックをどう入れるかというところがこれから問題と。何かを探すテキストマイニングではなくて、整合性検証のテキストマイニングとかももっと研究されてもよいのだろうな。あり得ない数字の validation なんていうのはおもしろい。固定的な数値ではなく、状況に応じて変動するけれど理屈上ほとんどあり得ない数字。先日も スポーツ報知が「三菱UFJの損失が5100億円規」と報じる とかあり得ないことが起きているし。本文とヘッダのチェックが自動的にかかるようにすれば、こうしたものは防げる。スポーツ報知って三菱UFJにちゃんと謝ったのかなぁ。元の話に戻って大量保有報告書問題。UPDATE1: ソニーなど6銘柄の大量保有報告に虚偽の疑いで調査開始=金融庁によると大量保有報告書の電子化は昨年4月から実施された。金融庁に、個人であれば住民票、法人なら定款を提出すれば、登録のためのIDとパスワードが付与される。入力されたデータは即座に公開され、事前チェックの仕組みがないことから、大量保有報告書の公開のあり方で議論を呼ぶ可能性がある。で、EDINET攻撃を確信犯が経済テロとしても使えるってことが今回ので証明された。しかし、もしウソでなく、本当に 51% も取得していたらすげぇーぉー。でも、「もし」って思う人がいないように、今回は事実関係を確認する前に「虚偽の疑い」ということで異例の報道なんだろう。一種の緊急事態対応だわね。仮に 5.1% と書くところを小数点が抜けて 51%と誤って書いてしまったとしても約 2兆円。それでもあり得ないだろう。でも念のため大口に確認してもそういう額が動いたことを裏付けるようなことはできなかったから、それもありえないでしょうとうことであえて「誤り」ではなく「虚偽の疑い」という表現にしたのだろう。とはいえ、背後関係なども明確にした上でないと続報が打てない状態か。チェックを厳しく確認が入るようにすれば、別の問題も起きる。管理を簡素化すればコストは減るが、簡素化しすぎれば問題が起きる。問題が起きたときに管理のせいにし過ぎれば、防衛的な動きにつながり過剰な規制と管理でコストが上昇する。高コストの組織や仕組みは誰かの利益になることがある。手続きを複雑化すればするほど、高コストの組織が正当化される。耐震偽装問題の追求は、結果として規制の強化を正当化し建築業界の窮状をさらに強め、景気減速の原因の一つとなった。痛し痒し。
2008.01.27
コメント(0)
The 1 Minute Painting (YouTube) を見る。こういうのの作者の頭の構造はどうなっているのだろう。不思議だ。
2008.01.27
コメント(0)
@niftyラボ から 自分発見プロフィール アバウトミーをなんとなく見る。本は買う派?借りる派?を見たら、圧倒的多数で買う派が多い。その割には、昨年から、# 2007年 * 4月 - リーフ出版・雄飛、破産。 * 9月 - あおば出版、破産。 * 9月 - 桃園書房・司書房、自己破産。 * 9月 - 朝日ソノラマ廃業、朝日新聞社へ版権譲渡。 * 10月 - エクスメディア、破産申請。 * 12月 - 山海堂、倒産。# 2008年 * 1月 - 新風舎、民事再生法を申請するも18日付で同手続きの廃止決定。破産手続き入り。 * 1月 - 草思社、民事再生法申請。出版不況 (Wikipedia)なのだ。質問を見て思った。「読まない」という選択肢がない。本を読まない人は答えられない。この手は使える。
2008.01.25
コメント(0)
改正測量法関連の政令公布される(1月18日) らしい。法律の概要地図等の基本測量の測量成果の電磁的方法による提供測量成果の複製に係る規制の緩和測量成果の使用に係る承認基準の明確化永久標識又は一時標識の設置等の公表公共測量において設置した永久標識の移転等に関する通知公共測量の測量成果に係る複製承認又は使用承認の申請の受理に関する事務の国土地理院の長への委託どういう改正かというと 国土地理院の地図がネットで入手可能に--測量法が改正へ とかに関わるものなのかな。基本知識がないので、よく分からない(頭悪いと言わないで)。新しい、分かりやすい解説はないのかな。基本的には、ずっと前の 測量法の改正とそれにともなう経緯度の変更 のときのような仕組み上のインパクトはなく、もっぱら利用方法に影響ということかな。ちょっと探す。【議事録】測量法改正案について質問…第166回国会 国土交通委員会 第9号 を見ると、インターネットに提供になりますと、先ほど言いましたような流通経路に流して皆さんに、本屋さんにお出しする、あるいはそういう古いものは回収する、こういう手間が相当省けるわけでございまして、地図に反映すべきいろんな諸条件が出てきましたら、それを我々は入手いたします。その後、データ整備をいたしましてそして提供するということになりますんで、今の時代、入りますと遅くとも六か月後ぐらいにはユーザーの皆さんに提供できるように、六か月じゃないですね、数か月後ぐらいですね、失礼しました、皆さんに提供できるようにやっていきたい、こんなように思っております。 それが結果として災害対応とか、その他もろもろにもいろいろ役に立つんではないか、あるいはそういう民間の方がいろいろ修正するにもお役に立つんじゃないか、こういうふうに思っております。とかそういう話がメインなのかな。そして、今回の測量法改正におきまして、インターネットによる提供というようになります。そうなりますと、デジタルないろんな地図というものがこれからももっと普及する、あるいは促進する。一方では、私たちといたしましても、一番問題は白地図といいますか、GISの基になる白地図が共通のものにならないといけない。そのために、我々も県と協力をしながら共通な白地図になるようなものをできるだけ早く整備をしていきたい、あるいは余りばらばらにならないように基準というものをきっちり作っていきたい、こんなように今考えておるところでございます。ということか。谷合正明議員、本件についてブログ更新してください とか書いておく。毎日、自分の名前検索しているような人なら、この記事を見つけるだろうw。それより 谷合正明議員の測量法のページをクリックしてもらってプレッシャーをかけるとか。Library & Copyright 図書館と著作権あれこれ: 測量法の一部改正法案、閣議決定 を見ると、それが今回、測量成果の複製承認手続に関する規制の緩和措置として、国土地理院長の承認が必要とされる複製を(1)測量に使用する目的、(2)刊行する目的、(3)ネット上で提供する場合、の3つに限定する改正を行うこととなったわけで、そうしますと図書館の複写サービスにおいていちいち国土地理院長の承認が要らないということになります。ただ、この一部改正法の施行日は、「公布の日から起算して一年を超えない範囲で政令で定める日」(附則第1条)とされていますので、今すぐ、というわけには行かないのが残念なところではありますが・・・。ほう、なるほど図書館にはそういう影響があるのね。まあ、知識がないなかなんとなくの勘では、インターネットサービス系のあれこれ何かよい方向でサービスに影響あるといいなと。過去に自分が書いたものを探してみると、地図にしてみると とか、都道府県の統計資料の視覚化 とか、 岩手県でも犯罪情報マップはじまる とか、地図系に反応している自分に気づいた。で、その手の情報をマップするような簡単に使えるサービスが欲しいなと。この法改正が施工されると、そういうサービスにもメリットになるんじゃないかなと直感的に思ったのだが、どうなんだろうか。
2008.01.25
コメント(1)
一定のコストをかけてきちんと運用できさえすれば、現状の技術でも今ほど情報流出が問題になることがないと思うのだが、情報流出事件が後を絶たない。結局のところ、まじめにやるとコストがかかりすぎる、運用が面倒とか、そのあたりにネックがあるんだろう。たとえば、マイクロソフトの Windows Rights Management Services だとか、日立ソフトの 秘文 のようなものを使ってちゃんと運用していれば、こんなにボロボロの状態になるはずがない。(秘文の開発秘話はおもしろい。最初は売れないソフトだったらしい。勝てば官軍)。ある程度の企業だったら、こういうのもありだと思うのだが、そこまで購入費用も運用コストも出せないという場合も多い。そこまでちゃんとしたものでなくてもいいから、少しでもなんかできないの。これに対してはいろいろなやり方があるだろうけど、一つ、使えるシナリオは限られるもののおもしろいソフトがある。携帯電話を認証に使う PSEC というのがある。このソフトをインストールして、流出すると困るファイルを登録する。そうすると、ファイルを開こうとしたときに待ったがかかり、登録した携帯にメールが飛ぶ。携帯電話でメールを開いて認証すると、ファイルが開けるようになる。評価版ダウンロード。インストール後、表示される README を見れば使い方が分かるので、習慣的にファイルを閉じてしまわないように。設定するマスターパスワードは忘れないように。ファイルを登録するのは、対象のファイルを右クリックして [PSEC に登録する] を選択、マスターパスワードを入力、確認ダイアログで [OK] をクリックする。そうすると、そのファイルが監視対象になる。ファイルを開こうとするたびに認証が求められるようになる。例えば、やむを得ず会社から重要なファイルを持ち出してノートパソコンなどに入れている場合、PSEC で登録しておく。そうすると、間違ってファイルを添付しようとしても認証が求められるし、コピーも認証なしにはできなくなる。Winny とかで流れ出てしまうことも防げるだろう。開くときにパスワードものだと、キーロガーでパスワードを拾われてしまうとアウト。これなら キーロガーをしかけられても、認証するのは外部なので大丈夫というところがいいかもしれない。マスターパスワードをキーロガーで取られても、登録解除の際にはやっぱり携帯からの認証がなければ変更できない。重要なファイルを置いたフォルダは [HOW TO] Windows XP でフォルダを暗号化する方法 でファイルシステムを暗号化しておき(ファイルやフォルダを暗号化する方法 等参照)、さらに PSEC で登録しておけば、そこそこの安全性が保たれると思う。(暗号化ファイル システムの最善の使用方法、BitLocker ドライブ暗号化)。つまり、ログインしない状態では EFS によって物理的にファイルが暗号化されているので読み書きができなくなる。でも EFS はログインしている状態ではユーザから透過的に使えてしまうのでメリットでもある反面デメリットなので、ログインしている状態では PSEC でセキュリティを確保する。こうしておけば、仮にパソコンを落としてしまった場合でも、まずログインできなければ、ファイルを取り出しても意味をなさず(物理的にハードディスクを取り出して別のマシンから見ようと思っても EFS で暗号化されているのでファイルの安全は保たれる)、万が一、ログインされてしまったとしても、PSEC の認証がかかるのでファイルが開けない。あるいは、ちょっとだけパソコン貸して状態で他の人に自分のマシンを使わせているときでも、密かにファイルを開かれてしまうこともなくなる。ログインしたままの状態で席を離れてしまったアホな状態であっても、誰かにファイルを開かれることはなくなる。ということで、使い方によっては有効なソフトであると思う。もっとも、大量の人がアクセスするようなファイルには使えないし(大量の認証メールが来る)、ネットワークドライブ上のファイルに仕掛けることもできないし(ファイルサーバ上に PSEC をインストールしてとかいうことになるのだろうけど、そのあたりウェブページ上の情報ではよく分からない)、ネガティブな面を取り上げれば、いくらでも取り上げられるが、使える場面で使えば有効だと思う。以上、知り合いの関係者からちょっと試してみてと言われたので試した結果なので甘いバイアスがかかっているけど、万能とは言えないが、少なくとも、自分のパソコンから重要なファイルを間違って流出させてしまったという間違いはかなり防げるソフトだと思う。アクセスする頻度が少なく、重要であるファイルへのアクセス制御としてはおもしろい方向だと思う。
2008.01.25
コメント(0)
人間型ロボットHRP-3 Promet Mk-II を見る。ページの下の方にある動画、例えば「脚腕協調・遠隔操作」とか、「滑りやすい路面の歩行」とか、「防滴性のデモ」とか、やたらとマニアック。単に歩きますとか、動きますといったレベルからはかなりの進歩があるんだろうけど、マニアはおぉーっとかいいながら見るんだろう。でも、こういう人型ロボットよりロボットスーツHAL(Hybrid Assistive Limb) みたいなものが順序的には先に実用化だなとも思う。Techno Tokyo: Robot Worn On Your Body Can Increase Your Stre。あるいは、上肢リハビリ支援スーツ は "Availability: By 2011" らしい。10年以内に実用レベルで使われそうな感じね。起動!人間力アシストスーツ (1)、起動!人間力アシストスーツ (2)。しかし、これにかなうものはない!。情に訴える点では、これだな。冗談ぽいけど本当なのは、世界初の“ロボットギター” ギブソン社より発売。ギターメーカーのギブソンがロボットに取り組むと Gibson Robot Guitar となる。Psycho のビデオがおもしろい。最後のマークに注目w一番左のがロボットギターで、ここに並んでいる中では一番安い。
2008.01.24
コメント(0)
最近、個人的には FTP ってあまり使わないのだけど、Python FTP server library (pyftpdlib) の関連のメモ。加えて、偏った言語信者の垂れ流し に、Django を使った FTP サーバの記事がある。Django を使い始めたら見てみようということでメモ。Python FTP server library (pyftpdlib)pyftpdlibとDjangoを使ったFTPサーバpyftpdlibをとりあえずインストール偏った言語信者の垂れ流し の方は、UbuntuでPython(Win32)を動かしてみた とか、WineでPyScripterが動いた とか、ファイル破断+がUbuntuで動きました とか、Wine を使っている。Wine ってけっこう使えるのね。試そう試そうと思いながらもいまだに試していない。
2008.01.23
コメント(0)
Gyao で 『マンダレイ』 を見た。むちゃくちゃ重たい。重さにおいて R18 (18歳禁) というのがうなずける内容。さて、ここで直接関係はないのだが Amazing Grace History/"Amazing Grace" By Wintley Phipps でも見てみよう。アメイジング・グレイス (Wikipedia) の下の方にも書いてあるが、この歌詞を付けたジョン・ニュートンは元々奴隷線貿易をやっていた人。1755年、ジョンは病気を理由に船を降り、勉学を重ねて神父となった。そして1765年、「Amazing Grace」が生まれたのである。この曲には、黒人奴隷貿易に関わったことに対する深い悔恨と、それにも関わらず赦しを与えた神の愛に対する感謝が込められているといわれている。重たいの限界。そして、Amazing Grace でも聴いてみよう。歌詞を見ながら Amazing Grace - Judy Collins and the choir を聴く。Native American - Amazing Grace (in cherokee) を画像をぼうっとみながら聴く。重くなりすぎたので Leann Rimes - Amazing Grace や Elvis Presley - Amazing Grace を聴く。日本人がこの曲に惹かれるっていうのはバグパイプで聴くとよく分かるけど Amazing Grace - Marines and Bagpipes、郷愁を誘うメロディーなのね。故本田美奈子さんバージョン Amazing Grace。アメリカは建国 200年かそこらだか、もっと国としての歴史が長い日本をなんとなく考えてみる。日本に置き換えたストーリーを考えてみるともっと重くなる。主人公を若き希望に満ちた官僚または政治家に置き換えたストーリー。いやぁ、また暗くなった。『マンダレイ』オフィシャルサイトGyao マンダレイ本田美奈子「ジュピター」 でも聴いて終わりにしておきましょか。時として人にはすべてを乗り越えて楽観的な希望あるいは救いも必要であるなと。nana mouskouri - amazing grace
2008.01.23
コメント(0)
今年はインフルエンザってあまり話題になっていないなぁと昨年末に思っていたけど、季節的にインフルエンザはこれからが本番なのね。昨年は鳥インフルエンザ話が年末あたりには盛り上がっていたから、そのせいでインフルエンザもその時期からと思ってしまっていたのか時期を勘違いしていた。国立感染症研究所 感染症情報センター に インフルエンザ流行レベルマップ がある。昨シーズンを見ると、1/15~1/21、1/22~1/28、あたりから増え始めて 3月頃がピーク。なんか、そういう細かい時期って覚えていられないものね。マップになっていると見た目に分かりやすい。で、今年はといえば、すでに色づいているから昨年より早い展開か。まだ本格的ではないようだが、徳島県、インフルエンザ注意報 今季初 とか、インフルエンザ急増 2008.01.19 気仙沼・本吉地方に注意報発令 面瀬小で授業短縮 とか、富山市内の小学校で インフルエンザで学年閉鎖 とか出始めている。三重県は 10小学校で集団風邪 インフルエンザ、前年の9倍 県内8市 か。栃木県は 昨年12月のインフルエンザ患者,前月の28倍。そろそろ油断できない時期にはなってきたか。銀行員、紙幣からインフルエンザ感染の可能性=スイス研究者 らしい。「その可能性は非常に低く、一般的な人が懸念するには及ばない」らしいが、この時期、万が一宝くじが当たっても、札びらをベッドに敷き詰めて眠るのはよした方がよさそうだ。鳥インフルエンザはといえば インドネシアで新たな死者、97人目 H5N1型 と、インドネシアが最多らしい。2008/01/17-15:09 イラン産家禽類の輸入停止=鳥インフル発生で-農水省 とかのニュースも出ている。インドでは インドの鳥インフルエンザ、住民が鳥の処分に抵抗 らしい。富山化学が新薬工場建設へ 新型インフルエンザに有効。株価を見ると、製薬やっとディフェンシブ銘柄に戻った感じ。「NHKスペシャル」 新型インフルエンザ 非常事態に備えよ ドラマも とかもあったから、ちょうどタイミング良かったのね。やっぱり NHK の職員って富山化学の株買って売り抜けしたんだろうか。インサイダー取引かどうかに関わらず、NHK では業務時間中に自宅に帰って株の売買が OK なようだから。報道機関は一定期間後に全社員の取引をまとめて公開すればよい。ちなみに CDC (Center for Disease and Prevention) の資料 Bird Flu: Message for Travelers to Asia, Lunar New Year 2008 | CDC Travelers' Health によると、旧正月の時期への旅行注意地域に日本もしっかり入っている。馬インフルエンザもまた発生。栗東トレセンで馬インフルエンザ陽性馬ところでマスクのモデルはなぜ女性ばかりなのか。
2008.01.20
コメント(0)
404 Blog Not Found: 紹介 - Data Visualization and Infographics で Monday Inspiration: Data Visualization and Infographics を知る。眺めているとおもしろい。Flags as Infographics はちょとブラックだけど吹いてしまった。Amadana's Wonderful Cautionary Infographics なんかも笑える。日本のデザイン会社で こんな風に 使われているけど、Wii の安全マニュアルとは違って、これは狙っているのね。美しさの中にちょっと笑いのエッセンスを加えている。いや、笑いを追求しているわけではなくて。When Bots Attack なんか見ると、ICBM 攻撃と Bot 攻撃がダブって見えてきておもしろい(視覚的にもきれい)。しかし、ICBM でおもしろいとか、きれいとかいうのは不謹慎な気もする。いや、コンピュータはいつまで弾道計算をしなければいけないのかと考えると憐れにも思えてくるか。そういえば、GYAO で ウォー・ゲームやっている。Data Mining: Mapping The Blogosphere なんかもきれい。こういうのとか、こういうのとか、意味もなくきれいだからみてしまう。 Influence Map of DNS Root Anycast Servers のように直接的にナニカの情報を分かりやすく説明するためってよりも、感覚的にきれいだなぁという世界。My Map とか、Yahoo! Design Innovation Team の Query Bursts までいくと、見せる化というよりも、魅せられてしまうので、魅せる化って感じ。ちなみに、見せてたまる化は、勢いで書いただけなので意味はない。が、見せてたまる化は日本の官僚がうまい。いわゆる隠蔽体質というやつ。すぐ書類をなくしたことにする。不都合なことの隠蔽はうまいかもしれないが(というより強引)、情報漏洩はある。セキュリティをしっかりと見せてたまる化をさらに進めましょうw可視化として、Nikkei225 Market Map は、やっぱり、おもしろいだけでなくて実用性の点からいっても優れている。その他 Visualization Economics なんかも好きなサイト。Share of Population Growth: China, India, Africa, Latin America, Western Europe, United States があらたにあがっている。ヨーロッパとか米国とか減っているように見えるけどあくまで割合としてのことで、Comparing Population Growth: China, India, Africa, Latin America, Western Europe, United States も見ないと誤解するか。人口ボーナスの問題。日本人が消滅する日 ”戦火なき有事”を前に、われわれはどうすべきか。
2008.01.19
コメント(0)
TIOBE Programming Community Index for January 2008 を見ると、January Headline: TIOBE declares Python as programming language of 2007! ということで、2007年一番盛り上がりを見せたプログラミング言語は Python だったようだ。Python は、2007年の 8位から 6位に上昇で、Perl を抜いてしまった。Perl は 6位から7位、C# が 7位から8位に落ちた。でも、結局のところ、絶対的な順位からすると 1位の Java、2位の C は不動。C++ が活性度が低下して 3位から 5位に転落。変わって (Visual) BASIC が 3位に来ているのがおもしろい。4位は昨年5位だった PHP。9位以下は、Delphi、JavaScript、Ruby、PL/SQL、SAS、D、COBOL、Lua、FoxPro/xBase、Pascal、Lisp/Scheme、Logo といった感じ。個別のグラフ (The Python Programming Language)を見ると、2004年~2005年にいったんピークでそこから落ちて、昨年、後半からまた盛り返しという感じ。Python 3000 とか、Django とか、盛り上がる要素があるからなのかな。四年に一度、オリンピックの年は Python が流行るので、今年は昨年よりもう少し盛り上がるかもしれない。というのは、何の根拠もないのだが、2004年当たりに何があったか考えてみると Zope が盛り上がり始めた時期と一致するんじゃなかろうか。Zope の開発が Python コミュニティを盛り上げた側面があるかもしれない。そして、昨年からは Django, TurboGears, Pylons といったフレームワークが流行始めているから、そのあたりが後押ししているのと、Python 3000 に向けた動き。そうすると、2009年から3年間はまた頭打ちになってとかなるカモしれないけど。そして、また新しいものが出てきて盛り上がってというサイクルがあるのかもねと。景気循環の波のようなものがプログラミング言語でもあるかもしれない。新バージョンが開発されているときと、安定期とでコミュニケーションの量が変わってくるだろうし。言語そのもののサイクルと、周辺のサイクルもあるか。小さな波と、大きな波。ガートナーのハイプ・サイクル みたいな話もあるか。"Peak of Inflated Expectations" を通り越すと "Trough of Disillusionment" に入って、よく知っている人でないと幻滅期で終わったなこれはって感じに見えるけど (Blind Spot に入る)、そこから "Slope of Enlightenment" → "Plateau of Productivity" と定着していくみたいな流れ。ガートナーって、こういうのやっぱりうまいな。2005年には XBRL とか RFID とか幻滅期だったけど、今、ちゃんと着実なところで普及し始めているものね。
2008.01.19
コメント(1)
読売新聞の 07年の企業倒産1万959件、今世紀最多 の見出し、まだ 2008年だというのに「今世紀最多」ってのは、まっとうな新聞社としては言葉を安売りし過ぎているんじゃなかろうか。スポーツ新聞じゃないんだからさ。スポーツ報知が「三菱UFJの損失が5100億円規」と報じる だし(訂正コメントも付けずに 500億円に直ってるけど)、マスメディアの質の低下が嘆かわしい。嘆かわしいといえば、NHK職員3人インサイダー取引か…放送前に情報取得 も嘆かわしい。というか、NHK は以前にも 日銀総裁の利上げ提案前に報道先行-インサイダー疑惑招く情報漏洩 やってる。でも、NHK の職員は言葉を安売りしないで金に換えている。しかし、結果として NHK を安売りした。倫理観の欠如。それにしても、日本製紙、官公庁にも偽装再生紙 って、もういいかげんにしてほしい。今年も偽装の話題が続くのか。。。。日本全国、「武士は食わねど高楊枝」と一日三回唱えよう。みんな無茶しすぎ。
2008.01.17
コメント(0)
OLPC XOにテトリス、オープンソース版SimCity、初代SimCityのソースコードが公開 なのね。OLPC版を開発するDon Hopkins氏によれば単なる移植ではなく、OLPCのGUI環境SugarとおなじくPythonでスクリプト可能にしてプログラミングの学習にも役立てる狙い。OLPC XOにテトリス、オープンソース版SimCity要するに構成主義(Constructionism)は子供たちが何かを為し作ることを通して学ぶという教育の哲学です。子供たちは情報を強制的に与えられるのではなく探求し発見します。Constructionismなのですと。OLPC (One Laptop per Child) は、すべての子供に一台のノートパソコンをこれは教育のプロジェクトです。ノートパソコンのプロジェクトではありません。The PLPC Wiki発展途上国の子供たちはシムシティから何を学ぶことになるだろうか。SimCity って、大気汚染や水質汚染、放射能汚染等の公害 の概念も組み込まれているから、都市計画のイメージも単にガンガン作っていけばいいんだとならないところがよいかもしれない。とりあえず、中国にこれを大量にばらまいてほしい。。。。。LinCity-NG 1.1.0リリース - あの"箱庭都市"をオープンソースで再現 なんてものもあるのね。こちらも公害の概念とか入っているなら中国にばらまいて欲しい。。。。。ちなみに、Python を使っている部分は、"Python 2.5 and the Python modules pygtk, pycairo and PIL" あたりが使われているようだ。画面History and Future of OLPC SimCity / MicropolisMicropolis Downloads(GPL のものは Microplis の名称)
2008.01.17
コメント(2)
もっと知りたいPython3000 特集を読む。第1回 Python 3.0の思想と意義第2回 組み込み型への変更知れば知るほど、自分が使う時期はかなり先だろうと、先送り感が強くなる今日この頃であった。とか書きながら、2.x 系でも 3.x 系でも OK の書き方とかは知っておいて損はあるまいとか、ダメになる書き方は避けられるものなら今から避ける習慣を付けようとか思うので、記事があれば読むのだけど、現状、積極的に使おうかなとかいうところまで行っていない Python 3000 a2 がリリースされたので試そうと思ったが、 Pytohn 3.0 a2 が使えるようになった とちょっとだけ動かしてみたところで止まっている。そういえば『みんなのPython(Webアプリ編)』をまだ買ってなかった。
2008.01.16
コメント(0)
三菱UFJの損失が5100億円規模に拡大…米サブプライム問題で というニュースが流れている。実際のところ、三菱UFJ、損失500億円超・今期、サブプライム絡みで で、ということなんだろうけど。桁がちがってんのね。ほんとうに5100億円も損失出しているならすごいこと。スポーツ報知は、いくらスポーツ新聞とはいえ、こういうニュース流してしまっていいのかな。。。。こんな記事出すなら、もう経済記事流すの止めたらって感じ。明日はスポーツ報知、三菱UFJに謝罪すんだろうけど、どういう謝り方をするのか要チェックだな。スポーツ報知は、このページに修正、お詫びのコメントを入れるのか、なかったことにするために、削除してしまい、別途お詫びをするのか。さて、どうすんでしょね。三菱UFJが気がついていないと気の毒なので IR に情報を流しておいた。まあ、めちゃくちゃなまでに日本を売り煽るメディアの多いこと多いこと。売るといえば、「「内調」機密漏洩疑惑、見返りに金品?」、内閣情報調査室の事務官もロシアに情報を売っていた疑いか。世も末じゃ。
2008.01.16
コメント(1)
こうやって日経平均をみると、ちぎっては投げ、ちぎっては投げという、投げ売り状態に突入している。Python Google Chart を使って日経225のグラフを描いてみる から Google Chart を使い始めたが、グラフを使うのに実に楽でいい。ちなみに、プログラムは Python, SQLObject, pygooglechart で作ったもの。そのうち SQLAlchemy に乗り換えようと思いつつ、まだ書き換えていない。移動平均は、トリガーを使って SQLite 側で insert 時に求めている。参照したいときにすぐに値を見ることができることと、特定の条件で検索しやすいことから、毎回求めずに保存している。1日のデータを更新するたびに何十個もの値が生成されるので、新しい指標を追加するたびに重くなる。けど、リアルタイムに見るものじゃないのでとりあえず気にしない。SQL で移動平均を求める方法については、相関サブクエリで行と行を比較する や 移動平均を求める のあたり参照。それにしても、こうきてこうきて、こうきた。さて、日本経済は底堅いと意図的にウソをつきまくっていた人たちは、さぞかし満足しているだろう。埼玉県の話だが、前年比61件増 07年の県内倒産件数 を見る。「〇七年は小規模倒産が多くを占め、件数・負債額ともに大きくなる傾向にあった」としている。結局、中小企業に大企業の好調さの恩恵が落ちてくる前に景気がさらに下向き観測になってきちゃったってことで暗いニュース。kizasi.jp で底堅い を見てみると、だいぶ下がってきた。それにしても、去年の年内と今年に入ってからの落差がすごい。ほとんど絶望状態で底堅いなんて言える人がいなくなってきたということか。経済参謀不在の日本の株価、底堅い指数 で使ったファイルはどこにやっちゃったかな。「底堅い」が不安と願望を表して実際とは違った動きをするのに対して、「不透明感」は素直な言葉かもしれない。株価が大きく下げるときには、この言葉の頻度が上がる。VIX指数を見てみると、米国の下げは年初に織り込み済みって感じで、下げ始めている。一日ベースで見てみると、なぜか下がってきている。対処できない急激な下げというよりも、気持ちの上では織り込み済みの下げだからなのかな。積極的に下げているというより、積極的な買い材料もないからズルズル下げているってことで、年末年始に期待させるようなことを言っていた(ここまで下げることはないだろうと)、メディアと証券会社にとっては、当然の嵌め込みだったわけね。ここまで下げると思わずに買ってしまった人は、各種メディアと証券会社の結託にしてやられたということになる。
2008.01.16
コメント(0)
綾鷹 KAMON ジェネレータ なるものがあるのを知ったので試してみる。日本コカ・コーラの綾鷹のキャンペーンサイトなわけね。ブログパーツとして貼り付けることもできるようになっているが、楽天ブログでは使えないので画像を貼り付けておく。さすがに日本コカ・コーラだけあって、いいデザイナを使っている。【すずらん】 すずらん紋のあなたはまるで野原にひっそりと咲く花のように純粋可憐。周囲の些細な変化を敏感に感じ、他人の痛みも分かる。それ故傷つき易い・・・非常に繊細な心の持ち主のようです。けれど、多くの喜びや悲しみがあなたの心を強く育てます。純粋さを忘れずに日々を歩んでください。上のように一人の名前と生年月日でも使えるし、二人分の名前、生年月日と血液型から相性診断のように KAMON を生成することもできる。【くぐつ し】さんから見た【わたしの ほんみょう】さんとの相性は・・・70%。大きな衝突や困難もなく、安定した関係が期待できる相性です。今以上に自分をさらけ出せれば、もっと濃く、充実した時間を過ごせるはずです。ペンネームと本名で相性が悪かったらどうしようかと思ったが、妥当な線であった。しかし、「自分をさらけ出す」とペンネームで書いている意味がなくなる(笑)ちなみに本名だと【水】 水紋のあなたは、型にはまらない自由な発想の持ち主。さらに面倒見の良い性格で、性別に関わらず強い母性を感じます。同時に、柔軟な思考の持ち主で他人の意見を直ぐに吸収し、自分のモノにする力もあります。とても優しい性格の持ち主ですが、時に優柔不断と思われる事もあるかもしれません。注意が必要です。星座占いがベースになっているようだ。この記述から私の生まれ月が推測できてしまうな。こういうことすると、日本コカコーラの人には私の本名が分かっちゃうのだが、まあ、気にしない。だって、普段本名出さずにやっているけど、楽天のショップとかだって、その気になれば本名チェックできちゃうわけだし。相性診断とかこの手のサービスって、それなりに信頼できる企業や組織がやっている場合はいいけど、運営者の中にとんでもないのがいると、けっこう恐ろしいな。まとめてデータが流出したら、すごいことになる。なかなかおもしろいサービスなんだけど、使う側は知らないうちにプライバシー情報を一般にも小出しにしていることも意識しておくべきだろうな。日本コカ・コーラみたいな企業はばかなことはしないだろうけど、作った人が見れば、埋め込まれた情報が分かるなんて陰謀サイトも理屈上は作ることができるだろう。そして、その方法が流出して大騒ぎになるとか。逆に言えば、カラーコード のようなものであえて情報を盛り込んだカラー画像を作るってのもあるだろうけど。白黒のQRコードから「カラーコード」へ──韓国発の新規格。なんてことは抜きにして、自分専用のマークやロゴって欲しいな。ブログの内容から勝手にそれっぽいロゴを作ってくれるサイトとかってないのかな(とっても難しい)。ロゴには一定の情報(ジャンル等)が埋め込まれていて、あつまれピニャータ のように、その庭の中にそこにあったものを招いてくれる。もっとも、そういうものがあったとして、使えるかどうかはかなり不明だが。考えてみたら検索とかも、検索結果が色分けされるなり、マークがついているなりすると、欲しい情報を見つけるまでの時間が短縮できるかもしれない。と話が飛んでいく。けど、視覚的に何かを表現する、というのは今年の自分の関心のあるテーマなので。視覚的な表現は見る人にリテラシーが必要とされる場合と、そうでなくても、それなりにの世界がある。情報圧縮の視覚化、見た目のおもしろさを含む視覚化。見た目にもおもしろく、ストレスがなく、かつ、目をこらせばたくさんの情報も引き出すことが可能な視覚化技術というのがおもしろい。そういえば 松下、社名を「パナソニック」に変更、「ナショナル」ブランドは廃止 なのね。大坪社長によれば、今回の社名変更およびブランドの統一に伴う費用は約300億円。これについては「ナショナルや松下の名前で投資した宣伝・広報活動の費用は約200億円。今後はパナソニックに全額投資すれば十分相殺できると考える」(大坪社長)とした。松下電器の理念 の世界文化の進展と考えれば、ナショナルブランドも廃止してパナソニック一本化というのもいい方向だろう。まあ、これで松下も名実ともに世代交代という感じか。がんばって外貨を稼いでくださいませ。文化とブランドを考えると、コカ・コーラやマクドナルドなんかは文化として完全に日本に定着している。飲食習慣とブランド名が直結している。でも、キムチはたくさん日本人も食べるようになったが、特定のキムチのブランドが定着しているわけではない。卵もたくさん食べるが特定のブランドが特別に強いということはない。牛乳も普及しているが何がなんでも森永乳業や明治乳業とかいうものではない。代替がききやすいものと、代替を拒むもの。それでなければ嫌の背景にはそれでなくては得られないものがあると同時に、見た目にも分かりやすく差別化されている。コカ・コーラもマクドナルドも対抗製品と比べたときにどっちがうまいかとかを超えたところにある。マクドナルドのハンバーガーはちっともうまいと思わないのだがときおり食べたくなる。ハンバーガーやピザを食べるとコーラが飲みたくなる。うまいこと洗脳されたものだ。もっとも、年間でコーラを飲むより爽健美茶を飲む方が回数が多い。自分の中ではコーラのブランドイメージほど消費には直結していない。爽健美茶よりもファミリーマートの牛乳の方が消費量は多い。さて、ふと身の回りを眺めてみると、あれ、松下やナショナル、パナソニックの製品って今持ってないや。記憶を呼び起こしてみると、けっこうナショナルの製品も使っていたことがあるのだが、なぜ使わなくなっちゃったのかな。しばらく前に買った電子レンジは三菱だった。次のチャンスは洗濯機、冷蔵庫、エアコンの買い換え時にチャンスがある。加えて大画面液晶テレビか。さて、パナソニックの製品が自分の生活の中に戻ってくることはあるのだろうか。さて、何の話だったか。。。。。
2008.01.15
コメント(1)
富士フイルムが 富士フイルム、顔検出技術をWebアプリに APIも公開 らしい。これを見て思い出したのが、The Laughing Man Hacks You!。このツールについては 「顔面認識→貼り付け」ツールがすごすぎる! 参照。笑い男については攻殻機動隊 STAND ALONE COMPLEX (Wikipedia) 参照。同時に複数の電脳に侵入し、人々の視界の自らの顔の部分に、名前の由来ともなった「笑い男マーク」をリアルタイムで上書きし続ける事も可能な凄腕ハッカー。瀬良野を誘拐し真実の公表を迫り、一時期姿を消したものの、再び活動を開始し、隠蔽された真実を公に知らしめようとする。実際に笑い男の事件が起きるためには、動画に対してリアルタイムで顔認識を行うことができること動画に対してリアルタイムにマークの上書きができること電脳化された人間が多数を占めること富士フイルムのニュースリリースの技術は対象が静止画であり、リアルタイムではなく、人が電脳化されていないので、現実に笑い男事件が起きるような時代はまだまだ先。でも、一歩一歩その時代が近づいてきているのを感じる。現実に戻り、富士フイルムの技術は、「1秒足らずで顔の部分だけを切り出し」らしい。APIが1月28日に公開されたら試してみるかな。でも、「顔シークレット」は、ぜひとも著作権元と交渉して笑い男マークを正式に使えるようにしてもらいたいものだ。富士フイルムがんばってくれ。世界トップと自負するのならば、それをやらねば。というか、まじめに、世界中から使ってもらえるサービスになると思うのだが。富士フイルムはそういう声を待っているのに違いないので、皆、富士フイルムに笑い男マークを使えるようにリクエストしよう!富士フイルムラボ をお気に入りに追加した。
2008.01.15
コメント(0)
このブログでも使っているアクセス解析 なかのひと には、あんな人にも見られてた! 「なかのひと」にアクセス元の性別・年齢推定機能 があって、利用者層の推計をしてくれる。年齢構成が公開されているような企業や組織のデータを元にしているのだろうけど、これはどの程度の精度があるのかなと思っていた。公務員叩きに物申す!-現職公務員の妄言 というブログに 「なかのひと」の性別・年齢解析を検証する という記事があった。後期高齢者医療制度SNS を運営されている方で、そこで登録されている年齢・男女構成比と比べている。これは各会員の自己申告によるプロフィール内容を元に集計しているので、未集計の方もいるし、100%正確というわけでもないが(誰だ!1歳や107歳にしているのは!)、確かに両者を比較すると傾向は非常に良く似ている。 特に45歳あたりの副次的ピークを正確にとらえているのは凄いとしか言いようがない。「なかのひと」恐るべし、である。なかのひとの値と比べてみると、確かに傾向はうまくとらえている。統計情報的手法のおもしろいところだな。単独の組織で厳密にみていけば、どの程度正確に出るかは分からないけど、複数組織のデータを使っていて、サンプルの数が増えていくと、だいたい、傾向をうまく表せるようになってしまう。統計マジック。ということで、なかのひとの性別・年齢解析は、そこそこよい線を行っているようなので、自分のサイトも見てみる。なんて悲惨な構成なんだろう。女性にまったく人気がない。そういえば昨年末にもチェックしたのだった。明日でブログ開設2000日、なかのひとで見るとこんな感じのアクセス状況。そのときと変わっていない。そのときは、週に一回ぐらいは年齢構成を幅広くするようなものや、女性が比較的多い企業からのアクセスが増えるようなものを書いてみようかな。とは、書いたもののすっかりそんなことは忘れていた。興味ないことは書く気になれないから仕方ないな。
2008.01.13
コメント(0)
日本、世界の10%割る・06年の名目GDP で「ピーク時の1994年と比べて半減」とか騒がれる今日この頃、日本の名目GDP、OECD加盟国中18位に転落 し、GDP年3・3%に鈍化 世銀見通し、日本減速1・8%成長 し、企業業績不安で日本株離れ 外国人投資家も敬遠 とか、新年早々、暗いニュースばかり流れる。世界の GDP の分布はどうなっているのだろうかと、Visualizing Economics の World GDP Density Map を見てみる。5分間ほど、ボーッと眺める。中国内の濃い赤($442,000-) の箇所を足し合わせて、これからの成長率を考えると、まあ、株式の時価総額で中国に追い抜かれてしまったのは分かるな。インドも潜在的な成長を考えると、10-20年後とかに濃い赤の部分がかなり増えているだろうな。長期投資は南米やアフリカに投下されづけるだろうな。世界全体が比較的豊になっていけば、国としての日本の地位は下がり続けるだろうけど、まあ、終わってしまったと悲観するほどのこともあるまいと思う。
2008.01.13
コメント(0)
Python のソースコードを Windows の EXE 形式の実行ファイルにコンパイルするツールとして py2exe がある。たぶん、一番よく使われるのがこれ。でも、setup ファイルを書かなくてはならないのが面倒。cx_freeze の方が、その点楽で setup ファイルを書く必要がない。FreezePython hoge.py で hoge.exe を作ってくれる。楽なのが一番。Linux でも、実行ファイルを作ることができるというところもいい。ただし、sitecustomize.py とか読んでないので sys.getdefaultencoding() が ascii になる。UTF-8 にしたい。さもないと LookupError: unknown encoding: utf-8 とかいうことになる(私はソースファイルを UTF-8 で書いているので)。そこで initscripts\Console の中に次の行を入れておく。こうしておくと、sys.getdefaultencoding() が UTF-8 になり、エンコーディングのエラーもでなくなる。from encodings import utf_8from encodings import cp932import sysif hasattr(sys,"setdefaultencoding"): sys.setdefaultencoding("utf-8")この手の実行形式のファイルを作ってくれるツールとして他にも Jungle .Py Compiler がある。これもjungle hoge.py で実行ファイルを作ってくれる。ただし、環境変数 PYTHONPATH を指定してない場合、ソースと同じ場所にライブラリがないと import している部分が読み込まれない。set PYTHONPATH=C:\Python24\lib\site-packages とかしてから jungle hoge.py とするか、-p オプションをつけて jungle -p C:\python24\lib\site-packages hoge.py のようにしないとダメ。.Py Compiler の jungle.exe 等、ソースファイルがどこで公開されているのか、あるいは公開されていないのか不明なことと、エンコーディングの問題でエラーが出るのに対して対処方法が分からないのでギブアップ。やっぱりソースコードがあるやつがいい。というか、ないとちょっと不安。PYTHONPATHの指定だけでは、コンパイルできても実行時に import できずにエラーになるものもある。Gnuplot.py を使ったものがだめだった。cx_freeze に比べると 実行ファイルが若干小さいの、実行速度もちょっと速いようなので、そこはいいところ。System Call の呼び出し回数が少ないので (61716 vs 56467)、そのあたりが効いてきているのかな。cx_freeze で作ったものVersion Number: Windows NT 5.1 (Build 2600)Exit Time: 4:18 pm, Saturday, January 12 2008Elapsed Time: 0:00:00.390Process Time: 0:00:00.250System Calls: 61716Context Switches: 6470Page Faults: 6948Bytes Read: 8084451Bytes Written: 45268Bytes Other: 372109jungle で作ったものVersion Number: Windows NT 5.1 (Build 2600)Exit Time: 4:18 pm, Saturday, January 12 2008Elapsed Time: 0:00:00.375Process Time: 0:00:00.218System Calls: 56467Context Switches: 6651Page Faults: 5962Bytes Read: 7526699Bytes Written: 45232Bytes Other: 462425でも、使い勝手とソースコードがあることの安心感とか、最低限のドキュメントがあるとか、使い方が一番簡単、ということで全般的なバランスから cx_freeze がいいかな。SourceForge.net: py2exepy2exe: Python スクリプトからスタンドアロンのWindowsプログラムへの変換py2exeモジュールについて: Pythonで単体で動くバイナリを作ろう!cx_freezeJungle .Py Compiler
2008.01.12
コメント(2)
Python Google Chart を使って日経225のグラフを描いてみる に引き続き、Google Chart で日経225のグラフを描いてみる。この状態からこの状態へやっぱり Google Chart は、画像の管理が不要だから便利。巷の噂によるとゴールドマンサックスがやってくれたらしい。ゴールドマンサックスの凄いところだな。結局、ロングで持っていたものをバーンと落としてきたとかいう噂なのだが、そういう噂が流されるメディアというのもすごいものだな。要するに日経 CNBC とか、証券会社のポジショントーク(自分のポジションを有利にするための話)がバリバリなのね。ゴールドマンサックスの先物売りが終わったらしいとか流して(これはゴールドマンサックスが流したのか、それとも売り優勢に困った証券会社が流したものか)、軽く上げたあとにドカーン。嵌め込み大会って感じ。ちなみに、日興シティグループ証券が昨年、12/14に買い推奨したJフロントリテイリングは、同日終値 1079円から下げ続けて、昨日はとうとう 833円のストップ安。ちなみに、1/10 の決算後に目標株価 1300円から 1200円に引き下げている。少しでも高く売り抜けるために買い推奨だしたんじゃないのと疑いたくなる。森トラストも 12/14 日には 160万目標株価を設定し買い推奨したが(終値 114万円)、昨日は、104万円。やっぱり、これはわざとなのだろう。プロがそこまではずすはずないんだから。レーティングを使って、わざと間違った方向を見せる手口。こういうのほんとに多いなぁ。そういえば、こんな地合の中で クアラルンプール総合指数が最高値、初の1500台突破 とは何?と思ったら、パーム油価格の高騰が原因のようだ。中部電力なんかも マレーシア国でのパーム椰子房バイオマス発電事業への参画について ~マレーシアにおける当社初のプロジェクト~ (平成18年7月28日)なのね。しかし、こういう状態だと、石鹸や洗剤など値上がりするのかな。マーガリンも値上がりするのかな。
2008.01.12
コメント(0)
生地にこだわり低カロリーパン/伊藤忠とユニーグループ らしい。200キロカロリー以下なのが嬉しい。(ユニーとファミマなど低カロリーパン発売 によると 164~190キロカロリーに抑えてあるらしい。これはけっこう嬉しいかもしれない。発売されたら買ってみようかな。小麦粉が値上がりしているから、そこを抑えて価格が安定している食物繊維を増やして量を少なめにしても、満腹感が出るようにして、砂糖と油脂も減らしてカロリー抑えつつ、材料費も抑えてるということかな。そう言う意味で、二度おいしい商品かもしれない。パン生地の発酵も低温熟成させた発酵種を使っているから、もしかして、加工費も安くて済むのかなぁ。材料費と加工費の点においては定かでないが、もし安くできているとすれば、買う側も作る側も嬉しい商品じゃなかろうか。とか書きつつ、甘い物を食べる。最近、ダイエットという言葉を忘れてしまって、また太ってしまっている。スーツを着ると苦しい。
2008.01.12
コメント(0)
農作業に教育効果 作文調査「苦労」「喜び」が頻出/近中四農研センター を読む。テキストマイニング系の話題なのでアンテナにひっかかってきた。この記事に「都市部で周辺に農家はなないが」にあるが「ないいが」はないでしょ。。。。。先進校の取り組みから農業体験学習の主要効果を特定しました の研究か。でも、なんだか結論ありきのあれで、テキストマイニングの結果新たな知見が得られました系ではないな。ちなみに TRUE TELLER みたいな高価なソフト使っていて、1ライセンスあたり 600万円~のソフトを買える程度の予算を持っているようだ。独立行政法人 農業・食品産業技術総合研究機構 近畿中国四国農業研究センター の 農業・農村のやすらぎ機能研究チーム なんてあるのね。独立行政法人 農業・食品産業技術総合研究機構 平成1 8 年度計画を見ると、日本版バイ・ドール条項 の記述もあった。産官学連携のモデルって 1980年代の米国がベースになっているのか。我が国においても、米国バイ・ドール法を参考とし、政府資金による委託研究開発から派生した特許権等を民間企業等に帰属させることにより、 ・政府資金による民間企業や大学での研究開発及びその実施化を活性化させる、 ・これらを用いた新しい商品の生産・販売、新しい役務の提供、新しい生産方式等の導入、新たな事業分野の開拓につながる、といった効果がもたらされ、新たな技術が活発に生まれる環境が整備され、全体として我が国産業の生産性向上が図られることとなる。 日本版バイ・ドール条項について(産業活力再生特別措置法第30条) 農業・食品産業技術総合研究機構って、年間 511億円程度の税金が投入されてるのね。さて、これは多いか少ないか。
2008.01.11
コメント(0)
裸祭りのポスター掲示断る 「不快感を懸念」とJR ということで、裸祭りのポスターが「ポスターは客に不快感を与えるかもしれない」という理由で断られたということだが、過剰反応に思える。それならば、週刊誌の中吊り広告の方が、もっと女性に不快感を与えるものがたくさんあるんじゃなかろうか。要するに、週刊誌の中吊りは大きな広告収入源だから許可で、そろばん勘定に基づく判断が行われているのだろう。過剰反応の裏にそろばん勘定あり。家が建たない 「国交省が引き起こした官製不況だ」 みたいなものにしても、一般市民の声を背景にして過剰反応をしたようでありながら、実は、官僚の支配力をこれを機会に強めたいというのが背景にあったのだろう。ちなみに 構造計算ソフトを仮認定、建築確認減で試験急ぐ で、住宅着工数が増える可能性があるのは 2月以降になるようだ。過剰反応の裏にそろばん勘定あり。ボーナス商戦、個人マネー争奪戦へ 金融・証券業界、金商法が逆風。個人投資家保護は大切だろうが、ここでも、個人投資家保護の過剰反応が起きて、足かせになっている。官僚君たちの関心は、個人投資家の保護よりも監督権限が強化されることのメリットがあるのだろう。たとえば、天下りとかに繋がるとか、金融紛争、裁判せず解決 日証協、ADR認証申請へ みたいなものから、新たな機関を作ってそこに天下るとか。過剰反応の裏にそろばん勘定あり。余計なことにはすばやく動くくせに、薬害問題や、社会保険庁の問題は放置してきたというより、過剰なまでに隠蔽してきた。過剰反応の裏にそろばん勘定あり。今年は株価の上昇は期待できない状況にあるから、こういうときこそ、一気に公務員制度を改革して、希望の持てる状況にしてもらいたいものだ。そこでさらに株価を押し下げるような巨大な問題が出てきても仕方あるまい。堺屋太一のビデオコラム Vol.92 公務員制度の改革(3)。過剰なまでに公務員制度を改革すれば、株価は上昇する。それができなければ、株価の下落基調は止まらない。「安倍改革」相次ぎ失速 教育再生や公務員制度 首相、官僚寄り色濃く なんて書かれるようではお仕舞い。やっぱり、公務員不祥事に賠償制導入 退職者の責任追及 は最低限やってほしい。悪事をはたらいたら、身ぐるみはいで刑務所送り。過剰反応の裏にそろばん勘定あり。
2008.01.10
コメント(0)
これぞGoogleキラー?Wikipedia創始者らの手による検索エンジン公開 なんていうのが話題になっているときに、Microsoft,企業向け検索技術ベンダーのFASTに総額12億ドルで買収を提案、 マイクロソフトが検索事業を強化、ノルウェーのファストを買収 なんていうニュースが流れてくる。やっぱり、マイクロソフトはマーケティング戦略がしたたか。でも、もっとしたたかなのは FAST だったのかもしれない。2004年に ヤフー、米ヤフーのウェブ検索エンジン“Yahoo! Search Technology”を導入 を見ると、Yahoo に FAST は ウェブ検索部門(AlltheWeb)を売却している。そして、今度は高値でマイクロソフトに会社そのものを売却。最高のエグジットって感じ。FAST の経営陣は、優秀でしたたか。もちろん、技術自体も 「FASTはGoogleの検索技術より2年先行」 とか書かれているぐらいで優秀なんだろうけど、技術だけでなく、経営といったいになって成功させているところが偉い。マイクロソフトは買収した FAST の技術を SharePoint Server の増強に使ってくるのかな。 驚異的な伸びを示すSharePoint Server 2007-その理想と現実を見る【前編】、 驚異的な伸びを示すSharePoint Server 2007-その理想と現実を見る【後編】 。マイクロソフト SharePoint Server。やっぱりマイクロソフトは企業としてみたときに強い原因はマーケティング戦略のうまさだと思う。別にクソミソに言われることなど気にせずに、どうやったら儲け続け、存続していけるかを考えた行動をとっている。当分の間は後進国の新規ユーザーも増えていくことだし、先進国で多少のユーザーが減ったとしても、業績を伸ばしていけるだろう。もうダメだダメだとか終わったとか言われながらも、ここまでやってきているのは、やっぱり偉い。たとえ、倫理的な問題があったとしても、人から恨まれようと、貶められようとも。まあ、したたかな企業だなと。なんだかんだで、この 5年間の株価を見ても こんなんだからね。ただし、パフォーマンスとしてみると、S&P, Nasdaq, Dow & MSFT、すでにイケイケの会社ではなくなっているのは事実だけど。MSFT vs. GOOG で見てみると、やっぱり Google のパフォーマンスに比べると劣りまくっている。じゃあ、現在ダメダメの NIKKEI225 と比較してみる。株価的には、もうマイクロソフトはパフォーマンスがダメだから夢を買うような企業ではなくなっているのは確かだけど、常に一定の評価は受けている感じ。ちなみに こうやって NIKKEI 225 を見てみる と、14000円以下に落ちないと安心して買いに入れるような感じに見えない。今の日経平均って、サブプライムローン問題もさることながら、官僚と政治家と企業とみんなで作った株価だからねぇ。さらに追い打ちで 成田など空港管理会社に外資規制…公共性確保、安全保障 みたいに外資規制がこの時期出てくる。昨年から官民で外資を追い出したから株価が下げたというのも、かなり真実味がある話。スティール「濫用的買収者」のインパクト もかなりあるだろう。昨年一年の世界の海外への直接投資は日本よりブラジルへの直接投資が大きい。もちろん、中国への方がさらに大きい。もう一度、今度は MSFT vs NIKKEI 225 の 6ヶ月のパフォーマンス を見てみよう。マイクロソフトが終わっているならば日本株はもっと終わっていることになる。かなり危機的な状況。
2008.01.09
コメント(0)
HTMLをPDFに直接変換するpisa と Python上でHTML2PDF「pisa」(MOONGIFT) を読む。最近 Python を扱う記事があちこちで地道に増えてきた。次のような記事もあった。へぇ、こういう記事を書く人も出てきたんだと思ったら翻訳記事だった。Pythonの技法:ZIPアーカイブを読むPythonの技法:ZIPアーカイブへの書き込みと追記Pythonの技法:Huffman符号化の実装元に戻って、HTML から PDF の変換について、pisaの日本語サポート を見てみる。pica の HTML 解析は html5lib、PDF の出力は ReportLab を使っているらしい。pica の日本語サポートは、次の内容のパッチをあてたもの。UnicodeCIDFontを読み込む処理の追加HeiseiMin-W3, HeiseiKakuGo-W5の読み込み処理追加helveticaをHeiseiKakuGo-W5にマッピング もしかしたら、ReportLab に真剣に日本語対応を入れているかと期待してみたら、そこまではやっていなかった。けど、そこに至る経緯とかが書かれているものって参考になる。ReportLab の日本語あれこれ対応は、そのうちやってみようかなと思いつつ、何年か経ってしまった。これを機会にちょっとチャレンジしてみるかな。以前試したときには、パラグラフに文字列を流し込んだとき、英語だとちゃんと折り返してくれるけれど日本語だとダメとかだったけど、今はそのあたりも対応できているんだろうか。でも、禁則処理もあれだなとか思って、ちょっと探してみる。textObject でなんちゃって禁則処理をしているもの は見つかった。PythonでPDFを作る、line-break・・・禁則処理を行うかどうかを指定する(IEが独自に採用) なども参照。禁則処理がきちんとできて、均等割付もきちんとできて、見た目にもきれいに表示できたらいいなぁと、以前、ちょっとやろうと思ってやりはじめたのだけど、めんどくさくなってやめてしまった。なんちゃって禁則処理の例 (pdf) とか見ても、行端揃え(justify)で右側がきれいに揃えられていないのだけど、ここがきれいに揃うようになると実用としていいなぁと。とりあえず pica を試してみるところから始めようかな。以前 PHP で FPDF を使ったことがあるが、やっぱり右側をきれいに揃えられなかった。
2008.01.09
コメント(2)
Python Google Chart の作者が公開している Python Call Graph を使ってみる。呼び出し関係、呼び出し回数と実行時間がグラフで表示されるので、いいかもしれない。大きいグラフになったときにどのようなビューアで見るかというところがポイントかもしれない。何か見やすいツールはないかなぁ。インストールは easy_install pycallgraph で OK。使い方は、下の通り。pycallgraph-dot.py --image-format=png mypythonapp.py graph.pngまたはpycallgraph-dot.py mypythonapp.py graph.png上記を実行すると、mypythonapp.py を実行してコールグラフを graph.png に出力してくれる。グラフの生成は Graphviz を使っている。pydot などと同じように dot ファイルを書き出して、Graphviz の dot コマンドを呼び出してグラフを生成している。pycallgraph-dot.py を引数なしで実行するか、--help を付けて実行するとオプションが表示される。Python Call Graph 0.4.0 も参照。コマンドラインから実行する以外に、プログラム中でモジュールを読み込んでトレースを仕掛けて、結果の画像を出力することも可能。下のように do something のところにコードを入れておけば、test.png が生成される。if __name__ == '__main__': import pycallgraph pycallgraph.start_trace() # do something pycallgraph.make_dot_graph('test.png')start_trace には次のコードがある。邪魔な関数は filter_func を指定してやれば削除することができるし、time_filter_func で時間にカウントしない関数をフィルタすることができる。詳細については、ソースコード参照。デフォルトでは、['pycallgraph.*'] のみ対象外となる。 if filter_func: trace_filter = filter_func else: trace_filter = GlobbingFilter(exclude=['pycallgraph.*']) if time_filter_func: time_filter = time_filter_func else: time_filter = GlobbingFilter()ちなみに、トレースする分、実行速度は通常より遅くなる(当然といえば、当然)。細かくみるなら Python プロファイラ を使った方がいいが、Python Call Graph は視覚的に分かりやすい。けれどもノードがたくさんある大きい、グラフはよいビューアがないと見るのが大変。実例は、Python Call Graph のページを参照。
2008.01.01
コメント(0)
花園フォント (Hanazono fonts)(ハナミン) が公開されている。漢字データベース計画 で作られたものが公開されたらしい。これでまた一つフリーフォントの選択肢が増えたのが嬉しい。と思って Graphviz と日本語のフォント で試したのと同じように試してみたら、漢字以外(かな、カナ、アルファベット、数字)が文字化けしてしまうので単独では使えなかった。いろいろな字形を KAGE(影)システム でアウトラインフォントに比べて簡単に作れるらしいので、そのあたりがポイントなのかな。つまり、普通にはない字形を作って使いたい人向け。よく見たら「JIS X 0208:1997の6,355漢字+1非漢字「仝」の6,356字が収録されています。非漢字は含まれません。」と書いてあった。水面字フォント 、切り絵字、モフ字 というのを見つけたのでこれも試してみる。サイズは小さいと見づらいので大きめにしておく。水面字切り絵字モフ字あんずもじ も試してみる。あんずもじフリーフォント最前線 とか見ると、いろいろ見つかる。純粋な見やすさの点から言えば、手書き風文字ではない方が見やすいけれど、手書き風の文字って、なにか脳みそを刺激する感じがする。発想の転換をしたいときには、手書き風のフォントを使って表示してみるといいかもしれないとか思う今日この頃。
2008.01.01
コメント(0)
Google Chart API の Python ラッパー Python Google Chart を使って日経平均のグラフを描いてみた。Google Chart API を使えば画像をアップロードする必要がないので、気軽にグラフを貼り付けられる(img src で URI を指定すればよいから)。画像を保存することもできるので、サーバにアップロードするところまで自動化してしまえばよいか。とりあえずは、直接 API 呼び出しているのが下のグラフ。楽天ブログのように JavaScript が使えないところでも使えるのが嬉しい。終値(Price), 3日下値平均(3Low), 3日上値平均(3High), 3日終値平均(3End), 5日終値平均(5End)、10日終値平均(10End) を描いている。結構長い URI になるがとりあえず大丈夫なようだ。基本的に、下のように自然な形で Python のコードが書けるところが嬉しいところ。複数の線を描くには、chart.add_data で追加していけばよい。from pygooglechart import SimpleLineChart, Axischart = SimpleLineChart(200, 125)data = [ 1, 5, 30, 10, 25 ]chart.add_data(data)chart.set_axis_range(Axis.LEFT, 0, 10)chart.download('hello.png')print chart.get_url()http://pygooglechart.slowchop.com/気をつけるところとしては、Google Chart API使ってみた・・・が。 に書かれているように Text encoding(chd=s:~) の場合は値が0.0から100.0まで表現でき、Extended encoding(chd=e:~) では 0~4095 という制限があること。ということで、ここでは API に渡す前に 0~100に収まるようにして指定している。また、Google Chart API はまだ漢字が使えないらしい ということなので、これは漢字も使えるようになるといいなぁ。YUIのアニメーションを用いてグラフを表現する の 例 みたいに動きを表現できるものも捨てがたいとは思う。こういうところは Yahoo UI の勝ちって感じもするが、とりあえず、静的な画像を作るなら Python のラッパーがある Google Chart API の勝ちとしておく。Google Chart APIを試すYahoo!UIのチャート機能を試すGoogle Chart APIDeveloper's Guide - Google Chart API - Google CodePython Google ChartYahoo! UI Library: Charts
2008.01.01
コメント(0)
ちょっと前の話になるが、理化学研究所が アレルギーの原因タンパク発見 なのね。(プレスリリース: アレルギー反応を制御する重要分子「STIM1」を発見 - 細胞外からのカルシウム流入が、アレルギー反応を引き起こす、(詳細) 免疫・アレルギー専門用語解説。奈良先端科学技術大学院大学では、植物免疫の中枢担うタンパク発見 (プレスリリース: 植物が病原菌感染を阻止する仕組みを世界で初めて発見~食糧生産の安定化やバイオ燃料の開発に向けた病気に強い植物の創生に期待~) らしいし、多能性幹細胞(iPS細胞)研究も京大・山中教授等かなりの成果を出しているようだ。米科学誌の新技術ベスト50に山中伸弥教授ら。ということで、2008年は、バイオ関連の期待と注目がこれまで以上に高まる。もっとも、これらの技術の恩恵を実際に受けられるようになるのは、まだまだ先のことだろうけど。でも、明るい未来を感じさせるという点で、新年の最初の記事にしておく。さらに現実的には知識がない一般人にとっては、それがどの程度すごいかもよくわからないんだけど、なまじ分からないものの方が明るい希望を感じさせてくれたりしてw。でも、アレルギー対策がうまくいく時代が来たら、それだけで苦しみから解放されて喜ぶ人も多いだろう。昨年はサブプライムローン問題を発端として、なんだか雲行きが怪しくなり始め、どよーんとした雰囲気に包まれて、トドメの一発がブット元首相暗殺だったわけだ。今年は、引き続きよろしくないことは続いて景気が悪くなるよねとかそういうのは、とりあえず新年なので気にしないでおくことにして、比較的、希望が持てるところに目を向けてみたときに目に付いたのが上記のニュース。昨年は、MyBoo ベータ版によると、傀儡師の館.Pythonは悲しい気持ちがにじみ出ているブログらしい ということだったので、これを消してみるかなとか思ったが、なかなか変わらないかもしれない。けど、楽しみをもう少し意識して出していくかなと。MyBoo ベータ版 を時々チェックしてみることにしようかな。意識して明るい気分になれるような言葉も増やしてみよう。未来は作るものであるって感じで。脳科学者の茂木健一郎氏は「株価は予想できない。未来は予想するものではなくつくるもの。どうしようかという意志が脳を活性化させる。明るい日本経済、経済政策をつくるという固い意志をもって前向きに取り組んで頂きたい」と語った。「明るい日本経済、経済政策をつくるという固い意志」っていうのは確かにそうだなと思う。ムーアの法則 なんかも、予想というより、むしろ意志の体現と考えた方がよいのかもしれない。予測を現実にしていく 強い意志。挑戦の言葉だったわけだな。そんなわけで、景気が良くなると信じて、皆でお金使いまくって消費性向を高めれば、株価も上がり経済も活性化する。世界経済が減速気味であるからこそ、内需を強くしないといかんよねと。これから値上げが相次ぐだろうけど、消費量を抑えずに同じ量を買えば、経済は上向く。どんよりしてきたときこそお金使うべき。金持ちのみなさん、頑張って消費性向を上げてください、と人頼みw何はともあれ、本記事をご覧いただいた方にとって、今年一年、良い年でありますように。
2008.01.01
コメント(0)
全37件 (37件中 1-37件目)
1