全55件 (55件中 1-50件目)
![]()
自動売買ロボット作成マニュアル を読み始めた。が、自動売買ロボット作成マニュアル(初級編) があるのに気づいた。と書くぐらいなので当然のように買っていない。アフィリエイトのリンクを作るのに検索したら出てきて気づいた。この本は Excel を使って実際にマクロを組みながら進められているので、実践的で、これまで読んだ本の中で一番まとも。初級編も手に入れて、そちらから読もうかな。。。。遅ればせながら初級編も注文。ということで一旦休止。とりあえず、もう一冊、株式自動売買ソフトウェアスーパー・株ロボを作ろう!を買ってあったのでそっちから読もう。というか、最後に残してあったやつが本命なのだが。スーパー・カブロボのコンテストを目指すようなものでサンプルのロボットも付属のCD-ROM に収録されている。でも、プログラミングの経験がない人は、とりあえず Excel を使ったものの方が取っつきやすいかもしれない。この本は Java なので。かくして、しばし Java を使うことになってしまった。とりあえず2章まで目を通す。カブロボコンテストの説明になっているので流し読み。株式自動売買ソフトウェアスーパー・株ロボを作ろう! については一通り試したらまた書くことにしよう。今日の3冊を読めば、今まで読んだ他の何冊かの本は不要だったって感じなのだけど、とりあえず趣味としては出ているものはとりあえず漁ってみたのであった。全般的な印象として、実際に動くものが付いていない、または、その本を参考に作ることができないようなシステムトレード・カブロボの本は絵に描いた餅って感じで手動のテクニカルトレードの本とあまり変わらないことになってしまうような気がする。これまで読んだ本は、このあたりに書いてある。
2007.05.31
コメント(0)
![]()
めかぶ石鹸なるものを見つける。というか、以前から気にはなっていたのだが送料込み 200円なのでスーパーポイントを消費して試すことにした。スローフードから生まれた、もっちりした泡立ちでしっとり潤う自然派海藻めかぶ石けん(簡易泡立てネット付き)まずはお試しにというアナタ!旅行にも最適♪<初回の方限定>プチめかぶ石鹸(14g)送料無料(代引・日時指定不可) 200円(2回目以降は、送料込みで 380円)ちなみに、100g サイズだと めかぶ石鹸(100gサイズ)2個以上で送料無料 2800円。自分は男なので別にお肌がどうのこうのというのはない。だから単なる興味本位で大きいのは買うつもりない。毎日が新鮮できたて今が旬!メカブには話題のフコイダン・アルギン酸がたっぷり♪お味噌汁やう... 特価 2,800円 (税込 2,940 円) 送料込。そのうち買ってみようと思っている。こんな感じで、ご飯にたっぷりかけて食べる。このページに、第1弾!めかぶの歌『メカメカメカブー』と、第2弾!めかぶ音頭『エレエレ音頭』という変なものがある。CD にしてしまうところがすごい。。。。。そういえば、形態素解析の mecab の方だが [mecab-devel 64] mecab .NET を公開している方がいらっしゃるということで、IronPython から使ってみたらどうだろうかとか一瞬思ったのだがまだ試していない。そのうち試してみようとは思っているのだが。特に必要性もないので試していないが。ついでなので MeCabで形態素解析、はてなとWikipediaが知恵袋に - infony登場 を使ってみる。http://plaza.rakuten.co.jp/kugutsushi を現時点で試してみると、下のようになった。とっても真面目なページに見える。でも、ブログのトップページは「本文のみ」にしても本文以外を拾っちゃうのね。 Senna を組み込んだ MySQL Enterprise認定バイナリのページを試してみると、こうなった。住商情報システムは一単語で登録されているが、未来検索ブラジルは、かわいそうに一単語で登録されていない。Google で「住商情報システム」を検索すると、 241,000 件。「未来検索ブラジル」を検索すると 207,000 件。企業名はどの程度、辞書に登録されているべきか。ん、ふと Senna と typo して Sennna (n を 3つつけてしまった)があるのに気づいた。やってしまった。他にもそういう人はいないかと思って Google で検索してみると、「もしかして: Senna 」と出てくるのはよいとして、538 件ヒットした。見てみると、グニャラくんのグニャグニャ備忘録@はてな 謎diff に 「MySQL 5.0.12-beta + sennna rev.49のpatchをsenna-devに投稿しようと思って」と開発者が間違えることもあるのか。
2007.05.31
コメント(0)
住商情報、MySQL Enterpriseに日本語全文検索エンジン"Senna"をマージ を読む。Senna も徐々に表舞台に上がってきたようだ。作者の直接の手を離れたところでいろいろ動くというのは成功といえるだろう。リリースの中に Senna が 未来検索ブラジル の開発によるものというのを入れてあげたほうがいいと思うのだけど。しかし、2ちゃんねる系であることがあれなのか、会社名があれなのか。住商情報システム、日本語全文検索に対応した「MySQL」の技術サポートを開始Senna 組み込み型全文検索エンジングニャラくんのグニャグニャ備忘録@はてな [Senna]TritonnTritonnとは21世紀の最新エンジンたち傀儡師の館の Senna 関連のエントリを見てみる。まともに使っていな割には何度も言及しているので、関心はあるようだ(人ごとのように)。でも、今、ちょっと興味が別方面に行っているが。NTTデータの全文検索エンジン Ludia を調べてみる組み込み型全文検索エンジン Senna を使ってみるSennna をもう少し使ってみるSenna のメモ全文検索エンジン Senna 1.0Tritonnプロジェクト
2007.05.31
コメント(0)
![]()
コトバのインフラ整備、著作権処理で法外なコスト - 国立国語研究所が大規模コーパスを試験公開 を読む。「現在の日本は世界に例がないほど著作権保護に厳しく、フェアユースという通念もない。著作権保護と公共利用を、どう両立させていくかが課題だ」(前川氏)。大規模コーパスを整備することの社会的意義を訴えるのも、今回の試験公開の目的という。大規模書き言葉コーパスのオンライン試験公開~KOTONOHA「現代日本語書き言葉均衡コーパス」~ (国立国語研究所の報道発表)国立国語研究所の言語コーパス整備計画KOTONOHA『現代日本語書き言葉均衡コーパス』の構築これはとても意義あるプロジェクトだと思う。本来なら 1990年代から始まっていてもよかったようなもの。著作権の問題があるから自然言語処理の様々な成果が微妙な形でしか公開されないという結果になっているのだし。例えば、京都テキストコーパス Version 4.0 のようなものにしても、著作権が放棄されていない毎日新聞の記事を使っているため、日本語の原文を含まない形でしか公開されていない(毎日新聞の記事の CD-ROM がなければ原文を参照できない)。この手のものがとても多い。加えて特殊な新聞文だけでは日本語の特徴を見誤ることになる。継続的に大量に収集されていなければ意義が薄れる。「風景」と「光景」の違いは? 国立国語研が大量の日本語データ公開コーパス構築作業の進捗に応じて、Webページのデータも随時拡充させる予定。毎年1000万件程度ずつ増やしていき、2011年にはすべてを公開する。この際には、検索機能を高度化したり、出力可能なデータ件数を無制限にした有償版(1年当たり3000円程度)の用意や、研究機関にデータ全体をDVDで配布する(20万円程度)ことも予定している。1年あたり3000円程度で、Web API も含めて公開してもらえればとっても嬉しい。下手に API を公開しないでスクレイピングされるよりサーバの負荷が低くなるわけだし。全部欲しい人は DVD で、部http://www.kokken.go.jp/syokai/unei/yakuin_keireki/yakuin_keireki.pdf分的に欲しい人は API で取得してという形で、誰かの成果を簡単に復元して使えるような仕組みができた方がいい。5年間で7~8億円というプロジェクト費用の大部分は人件費で、著作権処理の事務処理コストも大きな割合を占める。国立国語研究所ってそもそも予算が減ってきているから生き残り大変ねぇ。少しだけ売上げ向上に協力してあげようコーパスは将来、お金を生み出すのに役立つものなんだから、もうちょっと派手になってもいいかもしれない。書籍にしても地味すぎる。そういえば、国立国語研究所ホームページは,平成19年5月にリニューアルしました。 なのね。新年度に入ってあちこちの独立行政法人のホームページが更新されている。他のサイトも、だいたいのところ地道に改善されている感じ。ん、古いサイトの方はリンク切れちゃうか。。。。でも、まあ、ニュース記事にもなって、少しは注目度が高まって来年は予算取れるようになるかな?内閣府 イノベーション25 の「イノベーション」は、「外来語」言い換え提案 ── 分かりにくい外来語を分かりやすくするための言葉遣いの工夫 ── によると、数十年前から用いられている外来語で,省庁の白書にも多用されているが,一般の理解度は低い段階にとどまっており,言い換えや説明付与の必要性は高い。と言い換え提案の対象になっている。そういうことしているから嫌がられて予算をもっと増やしてもらえないのか?情報大航海プロジェクトの一部に組み込んじゃえばいいのに。経済産業省系のプロジェクトだから文部科学省系はダメなのか?お役所仕事はよく分からん。
2007.05.29
コメント(0)
![]()
ここが知りたい! ASP.NET AJAX を見る。ASP.NET AJAX と ASP.NET AJAX Control Toolkit を用いた Web 開発について、ウェブキャストがいくつかある。やっぱり、こういうものをどんどんと作れるところが金の力というものだなぁ。マイクロソフトはお金があるだけに、どんどん自分でコンテンツを作れるところが強み。敷居が低くなる。でも、実は使う気はなくって、リッチクライアントを実現する - Rialto JavaScript 0.8 ほか公開 を試してみるかなとか思っている。デモ や ビデオ を見た感じ、よさそう。ん、なんか見たことある。そうか マスカットに利用されている技術 を見たら、GUIオブジェクトの描画ライブラリとしてオープンソースのRialtoを利用しています。なのね。
2007.05.28
コメント(0)
xfyxfyラプソディ--第1楽章:インストールATOK『ATOKの辞書を語る』~ 日本語入力システム「ATOK」が扱う辞書・辞典や、変換辞書作成の取り組みをご紹介PessulusPessulusでGNOMEデスクトップの機能を制限する(手軽なキオスク端末作成ツール)Pessulusは、GconfというXML設定ファイル向けの設定を行うためのPythonで書かれたフロントエンドだ。Pessulus, GconfPython でXML 扱うアプリを書くときの参考になるかな。データセンターの老朽化と再構築「データセンターの半数以上がインターネット以前のもの」、リサーチ企業トップが最新事情を報告データセンター再構築の課題としては、消費電力を挙げた企業が最も多く、64.3%にも上った(写真)。以下、サーバー/ストレージの増加と冷却がそれぞれ57.1%、可用性と復旧性が50%で続く。日本の場合はどうなんだろう。楽天メッセンジャー楽天メッセンジャー ができたので登録する。Internet Explorer でないと使えない。。。もっとあれなのは使う相手がいないという。。。。フリービット、IPv6「楽天メッセンジャー」β版開発に協力楽天メッセンジャーは IPv6 で動作し、アプリケーション自体が IPv6 アドレスを保有する自律ノード型アプリケーション。将来の IPv6 インフラへの移行にもスムーズに対応できる。フリービット、「Emotion Link」に係わる新たな特許を取得Emotion Link とは、既存の TCP/IP ネットワークに仮想的なネットワークをセキュアに構築し、 NAT やファイヤウォールを越えて、安全に通信できるようにする技術。グリーンスパン中国株、劇的収縮も・グリーンスパン発言に市場動揺米連邦準備理事会(FRB)のグリーンスパン前議長が23日の講演で中国株は「いずれ劇的な収縮が起きる」と懸念を表明、市場を再び揺るがせた。欧州株:反落、グリーンスパン氏の中国関連発言で。IMFとOECD 日銀追加利上げ「慎重に」、 日本の利上げ、確実なCPIプラス予想できるまで見送りを=IMF、利上げ意欲隠さず 福井日銀総裁インタビュー 一問一答。老人が世界を動揺させる。中国中国 一人っ子政策に反発した住民が暴動元政府は2人目以降を産んだ人に数万元(数十万円)の罰金を科し、支払えない場合は当局が家財道具を押収したり、家を破壊したりしたほか、強制的に不妊手術も施していたという。「大きなおなかの妊婦が殴られて死亡した」と話す住民もいる。中国というのは。。。。米で中国産アンコウに猛毒フグ混入、当局が注意呼びかけ。なんだかなぁ。鮟鱇は何でも丸のみしちゃうから、フグを丸のみしたアンコウを適当に調理しているときにフグの毒が入っちゃったんだろう。。。。中国製土鍋から鉛を検出 販売店が回収へ とかもあったし。。。。SELinuxセキュアOSのオープンソースGUIツール「SELinux Policy Editor」,開発元の日立ソフトが有償サポート開始へ、 第1回 CMSツールをよりセキュアに導入しよう。SELinux Plolicy Editor
2007.05.27
コメント(0)
![]()
なるほどデータforきっず 「Let's統計学習」「改正統計法が成立」 なのね。総務省 統計局・政策統括官(統計基準担当)・統計研究所) の 日本の統計制度 を見ると、まだ反映されていない。個票データ公開がされ二次利用が可能になるとかいう話が、その手の方面の人の関心をひいているようだ。ちなみに、欧米では世論調査データ、とりわけ学術的なものについては、研究および教育目的の再利用(二次分析)のためにデータ・アーカイブに寄託することが常識として確立している。また、行政目的で行われる調査であっても、データ・アーカイブを通じて公開されることが多い。米国ではセンサス・データも一般公開されている。世論調査データの行方-データ・アーカイブの役割-日本では世論調査データの保存・公開が有効な形で行われてこなかった。これが今回の統計法の改正で変わったとか、変わらないとかいう話。大竹文雄のブログ 統計法改正へ統計データの公表・提供に関する実態調査及び在り方に関する研究に係る報告書世論調査データの行方-データ・アーカイブの役割-「個票データ公開の意義と方法」。 インターネット調査等の調査手法に関する実験調査」の個票データ政府統計・世論調査等の一次データ(含む個票データ)の体系的保存と活用・公開方策について政策研究リエゾンセンター主催 政策研究ワークショップ 「政府統計データを活用した日本企業の分析」 (2003年2月7日)ICPSRデータアーカイブの利用法SSJデータアーカイブ 日本の社会科学研究のためのデータ資源データベースの拡充とモデル操作運用の強化「特集 個票開示問題の統計理論」について個票データにおける分類の併合モデル統計リソース「患者の語り」のデータベースが医療にもたらすもの~英国DPIPExの試み平成16年度 世帯の金融資産及び金融機関の選択等に関する調査研究概要紹介科学研究費補助金特定領域「経済制度の実証分析と設計」プロジェクト内の 「国際貿易・直接投資理論の構築とデータの基盤整備」研究班ミクロ統計データの活用について文部科学省 の 本省情報基盤システムの業務・システム最適化計画 を見ると次のような記述がある。平成20年1月までに作るシステムで反映させるようだ。集計データ活用システムにより情報の高度利用・政策立案のためにデータを活用し、目的外使用申請システムにより調査票の統計上の目的外使用(以下「目的外使用」とする。)に係る業務負荷の軽減を図る。さらに、システム機器の二重化、システムの監視機能導入、バックアップの自動化などにより高可用性を確保するとともに、メンテナンス性の高いアプリケーションソフトウェアを導入し後年度負担を最小化する。(中略)3. 情報の高度利用による政策立案及び目的外使用への対応 平成20年1月までに集計データ活用システム及び目的外使用申請システムを整備し、多様な個票データ、統計表データの活用及び目的外使用申請の処理を効率化する。 これにより、調査実施課の厳密な権限管理のもとで省内の職員による統計表データの自由な利用を可能にするとともに、目的外使用対応業務にかかる負担を軽減し、年間延べ約39日分(試算値)の業務処理時間に相当する業務処理の簡素化を図ることが見込まれる。
2007.05.27
コメント(0)
![]()
3月に 最高のお役所仕事 で社会保険庁のことを書いたが、このところまた話題なのね。年金記録不明5000万件 社保庁に調査義務付け。そんなところで 社会保険庁の指導医療官ら3人を贈賄容疑で逮捕 みたいな話も出てくる。厚生労働省と社会保険庁は確信犯でやってきたことだから逮捕者何人も出さないとダメだね。天下りを禁止するよりも、国家公務員が国に対してあらかじめ予想できるにもかかわらず損害を与えた場合には逮捕できるようにした方がいい。あるいは将来的な損失が明らかであるにもかかわらず、わざと何も手を打たなかった場合にも。損保、不作為の40年 ー 不払い26万件に拡大、収束はなお遠く どころの話じゃないんだから。情報システムも「不作為の罪」に問われる時代に!? なんて話もあるが、最も内部統制が必要なのは行政だと思う。Google で「行政責任 不作為」 の検索結果 約 409,000 件。社会保障協定 に関わる部分は、ちゃんとできてんだろうか???
2007.05.27
コメント(0)
![]()
公文書に見る日米交渉~開戦への経緯~ を読む。写真館 で使われているものの一部に 経葉社 の 同盟通信社 -甦る戦時報道の軌跡-『写真特報』 が使われているようだ。「写真特報」は昭和11年に設立された国策の通信社「同盟通信社」が日刊で頒布した一枚もののニュースビラで、写真を主体として、1日あたり10万部印刷され、主に学校、工場、鉱山、農林、商店などに配布され、壁新聞として貼り出されました。同盟通信社『写真特報』コレクション 7大特長いくらなんだろうなと見てみたが値段がわからない。お問合わせ先 には値段がない。英語のページの方からORDER FORM (Collection of “The Domei Photo News” Japan’s War-time wall newspapers) を見てみると、US $ 1,500 になっているので、十数万というところか。こういう高いものは図書館に行くしかない。ちょっと探してみる。日本新聞博物館 のコレクションギャラリーに 「写真特報東京日日」(昭和17年9月13日発行)=太平洋戦争時ニューブリテン島ラバウルの戦場で取材をする報道カメラマン があった。なるほど、この時代の新聞を探すなら、新聞ライブラリー で探せばよいのね。幕末、明治期から現在までの新聞はマイクロフィルムで所蔵しています だそうだ。公文書に見る日米交渉~開戦への経緯~ に戻ると、画像ファイルは DjVu ファイル閲覧用プラグイン を使って参照できるのだが、トップページ 等にあるダウンロード先のリンクが間違っていてリンク切れになっている。リンクチェックやってないんだねぇ。。。。。
2007.05.27
コメント(0)
![]()
横浜文明堂(BUNMEIDO) の 世界初?甘納豆入りおしるこで出来た 「茶わん かすてら」 を見る。今、在庫切れで買うことができないが、こういうお茶目なものを見ると欲しくなる。中のカステラを食べた後に、茶わんを割ってお湯に溶かせば甘納豆入りおしるのできあがりという製品。売り切れているのを見ると欲しくなるのが人間の心理でもあるか。まあ、こういう企画的なものは本道じゃないから、ときおりやるぐらいがちょうどいいんだろうね。「カステラ一番、電話は二番、三時のおやつは文明堂~」の CM をきいて育った世代なので、カステラはやっぱりおいしいし、大好きなのであった。オークションで落とせたのでまた食べる。そのうちコニャックカステラを試してみたい。父の日用のもある。が、私の父は甘党ではないのでこれを贈ることはあり得ないが。
2007.05.27
コメント(0)
![]()
JETRO最新レポートで東南アジアのマンガ・アニメ市場調査(5/25) から、JETRO 調査レポート: 東南アジア3カ国におけるコンテンツ市場の実態(タイ、シンガポール、マレーシア)(輸出促進調査シリーズ) 2007年3月 を読む。なんだかんだで、いろいろ問題はあるのねぇ。ちなみに、JETRO のレポートには、マンガ・アニメだけでなく、映画、TV番組、ゲーム等に関する記述がある(だからコンテンツ市場と題名が付いている)。
2007.05.26
コメント(0)
![]()
マイクロソフトの 「はじめよう!データマイニングキャンペーン」 に応募したら、ひと目でわかるMicrosoft Office Excel 2007 があたった。ちなみに、サンプルファイルは、日経BPソフトプレス OnLine からダウンロードできる(書籍の紹介ページのサンプルファイルのところをクリック)。データマイニングアドインを見ると、やっぱりマイクロソフトって、なんだかんだで良いところついてくるよなぁと思う。しかし、まだ Office 2007 持ってないから実際に試すことができない。でも、Excel や Visio でお手軽にデータマイニングができてしまうというのが、とても良い釣り材料になっている。うーん、釣られてしまいそう。。。最近できるだけ MS製品に頼らない生活にしようと思っていたのだが、MS製品で固めると多少お金はかかるが、自分であれこれ探す必要もなくて楽でいいのだな。オープンソースだと Rで学ぶデータマイニング(1) ってことになるか。ペンタホ、自社オープンソースBIツールを次期OpenOfficeに統合 とかいう話もあるようだ。データ・マイニング/予測分析プロジェクト「Weka」はペンタホに買収されたのでここが有力か。あとは、データ分析ツールOpenOLAP とかか。MUSASHI によるデータマイニングも見てみる。でも、コンシューマー向けのできのよさとお手軽さの点においては、やはりマイクロソフトっていうのは改めて巨大な存在だなぁと思った。
2007.05.26
コメント(0)

NICT 独立行政法人 情報通信研究機構 の SWC 宇宙天気情報センター を見る。黒点数やフレア、太陽風等の情報が視覚的に分かりやすく表示されている。(DeskTopViewer( 760x260 )をクリックすると表示される画面)加えて、次のように今日の宇宙天気情報がある。太陽風速度は650km/s強、コロナホールからの高速風が到来したようです。この影響で地磁気活動はやや活発となっています。黒点群#956は衰退して見えなくなり太陽面は黒点のない状態です。太陽活動はしばらく静穏な状態が続くでしょう。とってもマニアだ。電波系の人にはとても有用なデータだろう(電波系というのは、あっちじゃなくて、電波伝搬障害研究プロジェクト とかの方面。ちなみにトップ画面の)。太陽観測衛星『ひので』(SOLAR-B)が観測した巨大フレア (2007年3月21日)太陽観測衛星「ひので」が巨大フレアをとらえた (2007年3月22日)“宇宙天気予報”が必要な時代 (2002年6月20日)太陽フレア発生、地球では電波障害の恐れ? (2003/10/27)太陽表面の大規模爆発、2週連続で史上記録 - 各地で通信障害も (2003/11/07)太陽フレア発生で電波障害の恐れ (2003年10月27日)リアルタイムに太陽の状態を知るフリーソフト「Solar Weather Browser」 (2006年10月15日)
2007.05.25
コメント(0)
JIPDEC: 日本情報処理開発協会をなんとなく見てみる。IT統計メタ情報検索サービス経済産業省における「我が国のIT利活用に関する調査研究(IT統計ポータルサイトの構築に関する調査研究)」において構築されたサイト Web上で公表されたIT関連の調査や統計の所在情報を一元的に収集し、カテ ゴリ別に 分類整理して検索を容易にしてあります。(登録件数:約900調査 2006/6/26現在)Google で検索できないことはないけど、まともなリンクしかないので、これはこれで便利かもしれない。情報化白書2006 (平成18年11月15日発表) のページの画像がリンク切れしている。
2007.05.25
コメント(0)
今年は 【父の日】銀座のすずめ aged 7 yearsを贈ることにした。
2007.05.25
コメント(0)
ぺタバイトのデータを送るには?「サンフランシスコから香港に1ペタバイトのデータを送るには、インターネットよりもヨットの方が速い。」この記事は話の展開の仕方がおもしろい。
2007.05.24
コメント(0)
![]()
高田式日経225先物システムトレード連勝法 を読む。先日読んだ 1日5分で超カンタン!「株&日経225」システムトレードで大儲けする本 が SPA の企画として作られたイケイケ本だったのに対して、この本は、慎重なシステムトレードの本。日経225先物の説明から始まって、一般的なテクニカル分析の説明(計算方法も説明されている)の後に、システムトレードのためのルール設定と検証作業というような流れになっている。検証作業は、MACD ベース。ただし、検証作業は一定の時期を説明しながらなので統計的にバックテストをしてこれだとこうだというような説明にはなっていない。また、ボラティリティが10%以下のときには RSI を使用してみるとかしている。何かに注目して戦略を変えるというような試行錯誤っぽい感じもするが。。。。戦略変更のときの統計的な検証はない。著者は NDシステムズ の方で、やっぱり広告材料としての著作なのかな。ヒストリカル・ボラティリティ(HV)無料配信 のページに 『高田式 日経225先物システムトレード連勝法』内第5章「プロになる為のトレード術~4.ストラテジー(戦略)を練る」で高田先生が検証に使用していたヒストリカル・ボラティリティ(HV)を配信致します。著書で先生も仰っておりますが、ボラティリティの数値の算出方法は いろいろあり、具体的には記載されておりません。今回、特別にその計算方法をお教え頂きました。ということで登録してみると URL が書かれたメールが送られてきた。Infoseek のメールで見たら化け化けだったが。。。。書かれていた URL からダウンロードしてみると、とりあえずヒストリカル・ボラティリティの出し方が分かった。しかし、独立した本の姿勢としてはよろしくないわなぁ。肝心なところをあえて書かずにメールアドレス入れないと取れないようにしているわけで。Google で探してみれば、ヒストリカル・ボラティリティ(HV) や指標解説 (ヒストリカル・ボラティリティ) のような説明が見つかる。主要指数や銘柄の株価チャートと20日平均のヒストリカルボラティリティのグラフ とかも見つかる。
2007.05.22
コメント(0)
![]()
独立行政法人 工業所有権情報・研修館 の 特許流通DB検索 なるものを見つける。活用可能な膨大な開放特許を、産業界、特に中小・ベンチャー企業に円滑に流通させ実用化を推進していくため、企業や研究機関・大学等が保有する提供意思のある特許をデータベース化(ライセンスの条件、利用想定技術分野、技術指導の有無等を蓄積)し、「ライセンス情報」としてインターネットを介して無料で提供しています。というもののようだ。それにしても、この手のもの重複投資が甚だしいんじゃなかろうか。あちこちに作られているような。NICT公開特許情報 みたいなものもあるし。これはあくまで 独立行政法人 情報通信機構 (NICT) のもので、こちらはそれ以外の一般企業のものも含んでいるという違いはあるのかもしれないが。その他、政府系の TLO として (財)日本産業技術振興協会 産総研イノベーションズ(経済産業省)、(財)ヒューマンサイエンス振興財団(厚生労働省)、(社)農林水産技術情報協会(農林水産省)、(財)テレコム先端技術研究支援センター (総務省)といった具合で縦割りでいろいろあるのね。データベースなんて、共同で一つ作って入り口を統一しておかないと使い勝手悪いし、利用度高めるの難しいんじゃないかな。これに加えて、各自治体でもいろいろあるだろうし。こういうのを全部集めると予算幾ら使っているのかなぁの世界。J-STORE 科学技術振興機構 研究成果展開総合データベース とかもあるし。ちなみに、特許流通DB検索は企業に対しては入力のインセンティブとして、ライセンスの情報登録を見ると、 画面から直接入力、または登録アプリケーションにて作成し提出された電子データから、新規のライセンス情報が登録された場合には、1件の登録につきデータ作成料(3,000円)をお支払いします。なのね。1000件で300万円、5000件なら 1500万円か。さて、予算はいくらとってあるのだろう。今年度の予算オーバーしたら、いったん新規登録を休止とかそういうことするんだろうか。あらかじめ、企業に打診して何件程度とかいう話になっているんだろうか。1億かけても、ほんとうにそこから億単位のビジネスがいくつも生まれるのであれば企業が支払う税金として戻ってくるからいいんだろうけど。特許流通DB検索については、対価条件とか、ある程度明示されていないと中小企業は使いにくいんじゃなかろうか。目安として 例:売上金額の○%、生産・販売数量×○円、一時金等 のようにもう少し情報開示が必要なのではないかな。特に中小企業にとって一時金の有無とその金額は利用するかを判断する上での大きな要員の一つになると思うのだが。結局、話し合いしないと話は進まないんだからということなのかもしれないし、ライセンスする気があるものかないものか、特許権の譲渡があり得るものかそうでないかが分かるだけでも意味はあるといえばあるだろうけど。あえて、こういう形で公開する特許というのは、単に後生大事に抱えているだけでは仕方ないから、何とかお金にしようという方向なのだろうから、なるべく高く特許料をせしめたい場合と、売れればいいの世界を明確に分けて、売れればラッキーというものについては、買い手がつきやすい形の提示方法ってあるんじゃなかろうか。すぐに売れるものならオークションの方が必要なのかもしれないし。あるいは、NS(ニーズシーズ)ハイウェイ みたいな方向とまた比べてみたりする。最後のオチとして、グーグル、特許検索サイト「Google Patent Search」を公開 のようなものにデータ取り込まれて検索は必要なくなりましたとか。あれこれ分散して作っていると、利用者の視点からしたら、まとめて検索できるところに行きたくなるだろうし。
2007.05.22
コメント(0)
あらためて衝撃――日本のソフト産業を統計分析する2004年の日本のソフトウェア輸出額(PCゲーム除く)は320億円。対して輸入は3646億円。うち、米国からの輸入は3292億円と90%を占める。懸念される中国からの輸入は171億とそれほどでもない。こうやってあらためて見てみると、入超の度合いがすさまじい。ふと、中国にやられちゃって衰退産業のイメージがある繊維産業を見てみる。日本の繊維はどこへ行ってしまった?を見ると、繊維産地の生産額は85年の7兆5390億円をピークに、04年には2兆304億円と大きく減少しました。日本全国の繊維の自給率も、高度経済成長期には170%を超えていたのに、04年には35%に落ち込んでいます。このままだと日本の繊維産業はますます衰退していくでしょう。そして、原因として考えられるのは、 (1)為替相場が変動して輸入が急増し、輸出が減ったこと。 (2)国内の人件費が高くなり、労働者を確保できにくくなったこと。 (3)既製服が衣料の主流になり、その最も大量に売れる商品領域で価格競争に走ったこと。ソフトウェア産業と繊維産業を比べてみると、産業の規模としてはほぼ同程度(繊維産業の方が大きい)。ソフトウェア開発の自給率という面で見れば、 1兆9345億7800万円のうち、3646億円が輸入だから約 18.9%が輸入。今のところは 80% 以上の自給率は保っている。しかし、このままでいくと自給率がさらに下がっていく可能性が高い。元々、輸出が弱いところに国内の需要を海外に持って行かれたら、繊維産業以上に深刻な状況になりかねない気がする。繊維産業がかつては輸出額が大きく花形産業であったこともあるのに対して、日本のソフトウェア産業は、そもそも輸出が大きかった時代などないという点でさらに深刻なのかもしれない。ガートナー ジャパン発表 - 世界のIT投資マインド、1位インド、日本最下位 - 日本は将来もIT先進国でいられるか? や、「日本企業のIT生産性が低い2つのワケ」,アクセンチュアが調査結果を公表, 「日本企業はITによる生産性向上を実感できてない」、アクセンチュアが大企業の管理職にアンケート実施 なども見てみる。さてさて、そんな中で日本のソフトウェア産業はなんとかなることがあり得るんだろうか。
2007.05.22
コメント(0)
粉飾決算予算が破綻する理由「そういえば,資金繰り表で粉飾した事例というのは聞いたことがないですねぇ」資金繰りに粉飾を施しても,現金預金が湧いてくることはないですからね。必然性のないことにコストと手間をかけていては,それこそ資金ショートを起こします。循環取引の原因というのは、資金繰りにショートする関連会社へのファイナンスの意味を持っているのではないかな。循環取引が成り立っている間は資金繰り表に破綻をきたさないのでは。xfyジャストシステム「xfy(エクスファイ)」先行投資がずいぶんかさんでしまったようだが、今期はなんとかなるのかな。ところで、xfy Blog Editor のページに出ている 「ジャストシステムブログ」と「xfy Blog Editor」 AFP BB Newsと連携し著作権処理された幅広い領域の写真ニュースを公式にブログに利用できるサービスを5月下旬から開始 は、いつ始まるのだろうか。グリーンスパングリーンスパン前FRB議長を批判=現議長と異なる見解を表明-英中銀総裁 を読む。グリーンスパン前米連邦準備制度理事会(FRB)議長が経済についてバーナンキ現議長と異なる見解を示しているとして批判した。バーナンキ議長はやりにくいだろうな。PIMCO、グリーンスパン前FRB議長を起用 で、私企業のために動くようになっているから、今後のグリーンスパン前議長の発言には要注意なのだろうな。彼は今誰のために発言しているのか。日銀の福井総裁は日銀退職後はどこに行くのか。TeX「TeX」の利用環境を自動でダウンロード・インストール「TeXインストーラ3」最近、使うことはないのだけど、使う必要が生じた時には便利そうなのでメモ。toto のシステムダウンtotoシステムが“6億円狙い”でダウン、販売店とのゲートウエイが原因 ということだが、結果として注目を集めて売上高が高くなってしまったというオチ?キャリーオーバーの額が大きくなったらシステムダウンさせて注目を集めるというのも手か。なんて、関係者は笑っていられないだろうが。ランキング症候群国内セキュリティソフトの“格付け”は、ちょっとヘン? (1/2) を読む。日本に来てさっそく秋葉原へ行ってみたのですが、セキュリティソフトの売り場を歩いていて驚いたのが、お店に貼ってある販売本数のランキング以外には、製品選びの指標になるものがないことです。あとは広告。物を選ぶとき、思考停止してランキング買いする人が多いからなんだろうな。とりあえず売れてるやつならいいだろうって。IT 投資とかにしても、そういう右へならえ的な発想がいかんとかあるのだろうな。WebラーニングプラザWebラーニングプラザに知財分野を新設、他にも技術者倫理など新コースを提供開始しました組み込みシステム技術、事例に学ぶ技術者倫理、技術者のための知的財産入門、ライフサイエンスの基礎-バイオ実験の原理、安全で快適な都市環境を支える昇降機技術、燃料電池基礎知識、社会資本整備における市民合意形成の7コースを公開しました。そういえば、独立行政法人 科学技術振興機構 のトップページの上部、リロードする度に変わるのね。リロードコンテンツ を見ていたら、絶滅に瀕する魚類保護への道。ヤマメからニジマスを誕生させることに成功。近い将来、マグロの卵を大衆魚のアジやサバに産ませてマグロを育てることができるようになるかも知れません。絶滅が危惧されている魚類の保護にも役立つ研究です。この手のものは、すごいなと思う反面、うーんとうなってしまうところもある。
2007.05.22
コメント(0)
深海の貝、シマイシロウリガイは細菌を「家畜化」 を見て、海洋研究開発機構 をまた見に行く。昔、Newton とか購読していた時期もあるので、こういうものってたまに見ると楽しい。何になるわけでもないが、気分転換にはなる。国際海洋環境情報センター (GODAC) にも、GODACスタッフおすすめ 深海映像 をはじめとして 深海映像データベース からあれこれ動画を見ることができて楽しい。世界初、化学合成生物を宿主とする最もゲノムサイズの小さい共生微生物のゲノム解析達成 ~光合成に依存しない深海化学合成生態系の実態解明に糸口~ を見ると、参考1:共同研究機関は、タカラバイオ株式会社 なのね。そういうところからも人物金が出ているから成り立つわけか。海水を長期間、自動で採集することに世界で初めて成功 ~海洋の二酸化炭素吸収メカニズムの解明に期待~ とか見ながら、地球温暖化のニュースを思い出す。「今後5年が最後の機会」温暖化防止でWWFが警鐘 とか、北極の海氷、予測超え減少、今世紀前半にも消失か とか、刺激的なニュースが流れる今日この頃。そういう刺激性を求めない場合は、脱地球温暖化─低炭素社会構築にむけて を見るとおもしろい。それにしても、グローバリゼーション - 資本の反革命と国家解体のプロセス のような時代に温暖化対策はうまくいくんだろうか。
2007.05.21
コメント(0)
ppkfなんてのを作ってみました を見つける。Pure Python で書かれた日本語の文字コード判別か。Python の一つあれなのは標準でそういうものがないところなのだな。手はいろいろあるけれど。低速(nkf_pythonと比べて100倍ほど遅い...とはいえ、 51万個の単語を71秒で処理する程度 は可能です)51万語 / 71秒 = 7183語か。ppkf対python_nkfガチンコ対決 を見ると、 [ppkf] Recognize 512084 strings within 71 seconds. [nkf] Recognize 512084 strings within 1 seconds.ということで、遅いことは遅いが、POST された文字列のコードをチェックして程度なら、それほど問題にならない速度かな。短い文字列に対しても高い判別精度(であってほしい)これがうまく動いているようなら使ってみる価値はありそう。Universal Encoding Detector は、文字コード判定ライブラリ Universal Encoding Detector の投稿にあるようにファイル単位とか長めの文字列で判定するにはよいけど、短い文字列の判定は苦手っぽい。ppkf の方はコメントを見たらeucjpでエンコードされた文字列で、半角英数と全角がほぼ同数ほど入っていた場合に間違うことがあるりました。なようだ。これを読んで、思いつく。ちょっと意地悪してみる。>>> import ppkf>>> p = ppkf.ppkf()>>> jstr = u"蛇のとぐろを見る".encode("euc-jp")>>> print p.guess(jstr) (0.7142857142857143, 'euc_jp')>>> print p.guess(jstr[:-1])IndexError: array index out of rangeのエラーで落ちる。中途半端にぶった切られた文字列が渡されたときにはエラーになるかもしれないので、それなりの対処が必要ね。標準的な日本語の判別モジュールがないところが Python のあれなところ。いろいろ選択肢があるのはよいのだけど。
2007.05.21
コメント(1)
「今、何をしているの?」でつながる『twitter』 の twitter がなんだか話題になることが多い今日この頃。この手のものは苦手なのだけれど、ちょっと調べてみる(IM とかも使ってないし)。とりあえず 先取り! Twitter使いへの道 AtoZ とか、新SNS「Twitter」--初心者のためのスタートガイド も読んでみる。日本でも追随路線で Twitter への同時書き込みや携帯利用にも対応したミニブログ「Haru」 、 Twitter ライクな一言 Blog も実装、SNS 的につながる初心者向け Blog「nowa」、「今、何をしているの?」Blog プラス SNS 的メモ共有サービス など出てきているようだ。「いまなにしてる」でゆるくつながる 続々増えるTwitterライクなサービス。Haru、Timelog、nowa、もごもご あたりのサイトも見てみる。ボットはいるのかなぁと思って探してみる。Twitter用天気予報ボット や CNN cnnbrk のように実用性をや いたら、酢鶏 が見つかるが、止められたようだ。会話ロボットです。(どうやら書き込みをロックされたようです、APIもWEBも投稿が出来ません)ボットとして投稿するよりも、ボット用の発言を収集して、ボットをタイムリーに賢くしていくのに twitter の投稿を使うとよいんじゃないかなとふと思った。あるいは口語表現や新しい言葉や表現を拾うのに。発言者が明確だから、個人差見るのにも使えるだろうし。それ系の人で流行っている原因の一つが、こっち方面の可能性から来るおもしろさなのかな。まつもとゆきひろ氏も、4月18日の“「次」の言語” と題したブログのエントリで「次にくるトレンドは『関数型』と『並列』。両方を押さえたErlangが本命。歴史も信頼性もあり、知名度上昇中」と、次にメジャーになりうる言語の本命にErlangの名前を挙げている。twitterブームの陰で注目を集める“Erlang” - @IT「Javaに並列処理と関数型言語の要素を」、ティム・ブレイ氏 - @IT とかも見る。Wikipedia で Erlang を見たり、Rubyist のための他言語探訪 【第 10 回】 Erlang なども見てみる。ふーん、と感心して終わる。Python 方面で twitter を探してみると、python-twitter - Google Code があった。これを使って、iTunesで聞いている曲をTwitterにPostするPythonのスクリプト とか 携帯メールからTwitterしてみる とか、Wikipediaを検索してくれるTwitterロボットユーザ とか、DjangoでTwitterの収集アプリ作成 とかやっている人がいる。ネットワーク監視の類に twitter 使う人とかいるんかなぁ。MoniTwitter のようにサーバの死活監視レベルだけじゃなくて、snmp のトラップによって何かしゃべらせる形で使うとか。効率どうこうの問題じゃなくて、一人で寂しくしているサーバの管理者がせめて少しでも人間的にということで、ネットワーク機器の発話を人間ぽくしてしゃべらせる。Nagios を外部から使わせるのはあれだけど、外からも状況をつかみたい。けど、内側の情報とは分からないようにしゃべる。「背中がかゆい」とかあったらどこかのトラフィックが一定以上に上がっているとか。IDS で何かひっかかったら「真弓がまた来た」とか。これを音声合成を使ってさらにしゃべらせる。ちなみにセキュリティに関しては、人気のTwitterにセキュリティ問題、研究者が指摘 のような指摘があった。でも、やっぱり基本的には興味ないんだな。我思うに twitter を好んで使うタイプの人は、情報遮断に弱いんだろうな。感覚遮断 の実験とかの被験者にするとおもしろかろう。というか、長時間感覚遮断状態を続けると自分で刺激を作り出すようになる。口が使える状態であれば、独り言が多くなったり口笛を吹くようになったり歌を歌い出したりするようになる。一種の感覚遮断状態にある人間が自分で刺激を作り出している状況に近いのかもしれない。人の目が気になる人は多い。けど、人の目が届かなくなり視線を感じないと逆に寂しく感じたりして、人の目を求める。見られていたい願望。そこを twitter はくすぐるところがあるから、いったん使われ始めたら試してみる人が増えたとか。見られながら、見られすぎないことが一つの救いなのかもしれない。見られてるかもしれないことから来る快感。自分自身の作り出した動きによる快感。ふと、「疲れたなぁー」と一人でいるときに、つぶやいたときになぜか感じる快感。そういうものとつながるところがあるのかな。一人でつぶやいたとき、場合によってはとっても寂しい気分になることもあるが、twitter 使っていても、そういう感じってあるんだろうか。関係ないけど、視線、目、オディロン・ルドンをふと思い浮かべた。
2007.05.21
コメント(0)
![]()
MonotaRO、全文検索システムを使用した「新商品検索エンジン」を導入 を読む。この「新商品検索エンジン」は、N-gram方式(※-3)による漏れのない全文検索システム「HyperEstraier」を使用しており、メーカー名、商品名といったキーワードだけではなく、特長や用途といった商品説明などからもテキスト検索できると同時に、インデックスを使った検索を行うため、同社が取り扱う80万点のアイテムからの高速検索も可能となります。HyperEstraier を使っているのね。MonotaRO で「テーパドリル 25.5」とか検索してみる。ちゃんと検索できた。「コレット 内径 12」とか「S-TPT」のような型番も大丈夫。この手の商品検索は N-Gram がやはり正解だと思う。まあ、当然といえば当然。ここで「着脱簡単」を考えてみる。N-Gram だと完全マッチで検索結果が出てくる。故に「簡単着脱」「簡単な着脱」「着脱が簡単」はヒットしない。形態素解析を使った検索であれば、どれも「簡単」「着脱」で検索することになり、どれもヒットするだろう。一般論としては、N-Gram の方が検索結果にノイズが多いと言われるが、こういうパターンでは逆の結果になるんじゃないだろうかとか、ふと思う。ということで、複合語で微妙にバリエーションが生じる言葉を検索するようなことになるときには形態素解析の方が意図としては漏れがない結果になることだってある。漏れがないとはいったいどういうことかを冷静に考える。
2007.05.20
コメント(0)
![]()
情報数理研究所 が「『R graphical manuals』統計言語『R』のマニュアルのサンプル画像を集めたページを公開しました。」ということで、R graphical manuals を見てみる。このページは多数の統計グラフを一堂に集めたものです。これらのグラフはR統計解析システムのマニュアルのExampleを実行することによって作られています。CRAN(Comprehensive R Archive Network)に登録されているほぼすべてのRパッケージ(937個のパッケージ、27,751個の関数)のマニュアルのExampleをすべて実行し、その結果作られた12,994個のグラフ・チャートがImage Browserから閲覧可能です。また、すべてのマニュアルのExampleの実行結果自体が、Package List以下の各マニュアルページの中に収められており、全文検索可能となっています。とあり、R でどんなグラフチャートが書けるか、自分で Sample を実行しなくても眺めることができて便利かもしれない。R graphical manuals -- Image Browser から見れば、グラフの一覧を眺めることができる。
2007.05.18
コメント(0)
![]()
1日5分で超カンタン!「株&日経225」システムトレードで大儲けする本を読む。Excel を使って、NYダウの4本値を入力すると「売」「買」のシグナルが出るという使える本。他のシステムトレードの本だと、システムトレードはこんなにいいものです的な内容で、具体的に使えるものがないが、本書は CD-ROM 付きで実際に使えるところがポイントだろう。内容も軽いノリで誰でも分かるようなレベルで書かれている。これで儲かる、儲からないは別として、動くものがついていて確認できるというところがすばらしいところ。WEB SPA! 日経225先物システムトレード を見ると、どんな感じのものか分かる(データはここから取得することができる)。それにしても SPA なのね。金と女、実に分かりやすい構図であった。ちなみに、同書の著者は、元キャバクラ譲だとか。企画としてもうまいやり方。さすがに雑誌編集がからんでいると人の気をひきやすい作りになっている。んー、それにしても、この本を買ったら、やろうとしていたことが NYダウも連動させる形でできてしまった。ちなみに、現状の相場で利益を上げられるかというと、大きな損はしないけれど、たいした利益も上げられないような感じかな。手数料まで入れるとどうだろうなぁという領域。今年に入ってからのデータのみを使うと、トレード数 62 で合計損益 470 円だから。1800万円程度つぎ込んでいれば1000倍して 47万。この半年間だと損はしなかったけれど大儲けにはほど遠いレベル。狭いレンジのボックス相場だと仕方がないかな。理屈上、ボックス相場が明確であれば、ボックスの底で買って、ボックスの上限近辺で売るという動きをするのが正解なのだろうけど、NY ダウが上がれば売りという感じだと、結果的に最近の相場にはうまく乗れないということになっているかもしれない。ただし、世界同時株安の影響でマイナスにひどく落ち込むということがない結果になったという意味では、暴落には確かに強い。ボックスを上抜けまたは下抜けしたタイミングで使い始めると、もしかしたら、それなりの成績になるかもしれない。それでも、少なくとも、日経平均1500円幅程度でボックス圏にあるときには負けない売買方法ではあることが分かった。もっともボックス相場であることをあらかじめ分かっていれば誰も苦労はしないわけで。。。。でも、システムトレードでよい成績を上げるには、ボックス相場での売買にも強くなるような方法も考えないといけないというのが確認できた。バックテストを行う際には、上昇相場、下降相場、ボックス相場、乱高下相場のいくつかのパターンのデータを用意して、そうした点からも検証するということが必要になりそうだ。この本は、システムトレードを考えるときのベースとしてよいスタート地点になるので、お勧めかな。買って損はない。繰り返しになるが、誰でも実データで検証できるというところがよい。Excel 持っていればだけど。我思うになのだけど、過去のデータで成功しましたという本が出たとき、それが未来永劫に通用して、そこに書かれた通りにはならないというところが、システムトレード本の難しさかもしれない。当たり前といえば、当たり前なんだけど。
2007.05.17
コメント(0)
![]()
独立行政法人 理化学研究所 wを見に行ったら、世界初:うつ病と統合失調症の2系統モデルマウス開発に成功 - 精神疾患の解明や治療法の開発に貢献する貴重な変異マウス系統を確立 - というのがあった。結合制御が可能な量子ビットの実証に世界で初めて成功 ~量子アルゴリズム実行が可能な回路技術を開発~ とかそっち系統だけでなくて、いろいろ研究成果があがっているわけね。理研ギャラリー とか眺めてみる。歴史を見るとおもしろい。日本という国を作っていくにあたって渋沢栄一が果たした役割ってやっぱり大きいのね(ナビゲーションの M のあたり参照)。これおもしろいのだけど、なまじ Flash だからここを見るとおもしろいとかリンクがはれないのがなんなのだな。。。。戦後、GHQ にいったん前身は解体されたとか、そういう歴史もおもしろいものがある。戦後 GHQ は財閥を解体して日本の国力を抑制しようとしたという歴史の一端を示す組織でもあるわけだ。そういう意味では怨念の組織でもあるわけだな。でも 財閥解体 の一覧を眺めていると、おもしろい。考えてみたら、三井物産・三菱商事って、GHQ に解体されたあと蘇って、バブルがはじけたときもかなり苦しみながらも、見事にまた再生して、実にしぶとい組織なわけだな。理研もそうだけど。財閥の形成と解体と蘇りって、日本の歴史を見るときに実におもしろいテーマだと思う。興味深いのは理研は、いつの間にか、独立行政法人になっちゃったところだな。ここに日本の一つの意志があるわけだ。なんてことはおいておき「うつ病と統合失調症の2系統モデルマウス開発に成功」というのはとても興味深い。これに加えて、統計でオーダーメイド医療を実現させる なんていう方向が明確になってくると、遺伝子レベルで病気に対処していく流れになる。当然、プライバシーの保護をどのように行っていくか、あるいは、遺伝的に問題があることからの不利益の排除あるいは悪用させない仕組み作りが重要になってくる。劣悪遺伝子排除法 (『銀河英雄伝説』マニア向け)のようなものができては困る。変形性関節症の新たな原因遺伝子「GDF5」を発見 - 高齢化社会の大きな課題の予防、治療に向けて新たな一歩 - などもそうだが、遺伝子レベルで病気の解明が進めば進むほど、危険な領域に踏み込むことにもなる。でも、調べてみると、劣悪遺伝子排除法のようなものを進める人の親族に排除されるべき遺伝子が見つかったりして云々と、遠い将来なるのは避けられないような気もするが。法律的にやらなくても結婚相手の遺伝子調査とかね。でなくても、生命保険業界なんて遺伝子調査によって保険料を変えるとかやりたがるだろうし。人の脆弱な精神を鑑みると、諸刃の剣ではあるが進んで欲しい分野でもある。遺伝子に関わる研究は、人の心の治療(つまり、そうした劣悪遺伝子と呼ばれるようなものを持つ人を排除しない寛容な人間観を維持できるようなココロの進化)とともに進んでほしいと思う。
2007.05.17
コメント(0)
サイトの内容に適合した「楽天商品」を自動表示するツール、サイドフィードが提供 楽ワードを利用する際には、ユーザーごとにアフィリエイトIDを指定。作成されたバナーには、指定されたアフィリエイトIDが埋め込まれた状態で商品が表示される。ということで、これを早速使ってみた。傀儡師の別館: 楽ワードを使ってみる のページに付けてみた。とても楽にバナーが作れるのがよい。別館の方は xfy Blog Editor を使って編集しているのだが、xfy を活かすなら、xfy Blog Editor 上で検索キーワードと楽天のアフィリエイトIDを指定すると取り込まれるようになると、さらに楽でよいかもしれない。ジャストシステム殿頼むぞよ。それができたらもっと使うかもしれない。このページにも同じように作ったものを貼り付けてみると、楽天ブログでは iframe が使えないのでエラーになって登録できない。
2007.05.17
コメント(1)
![]()
Project Indianaサン、「Project Indiana」で「LinuxのようなSolaris」を目指すSolarisにLinuxのような魅力を与えることを目指す「Project Indiana」というコードネームのプロジェクトを始動した。Ubuntu を取り入れて、SolarisにLinuxのような「ディストリビューション」が生まれている にあるような Nexenta が最有力候補かな。OpenSolaris と NexentaOS とか OpenSolaris と BeleniX のあたりでちょっと試してみたが、簡単に日本語の環境が揃うようになれば、もっと使う人が増えそう。Ubuntu 7.04 での Java, NetBeans, Compiz, Beryl に関する補足2007年度IT関連予算案2007年度IT関連予算案を読み解く、政策ジャンル間の“アンバランス”が課題か を読む。こうやって並べて足し込んでみると、800億円ぐらいになるのかな。実際のところ、あれこれ足していけば1000億円は簡単に超すのだろう。とはいえ、一国の次世代のための IT 予算としてこれが多いか少ないかということになるとお寒い感じがしないでもない。後の世代で生産性向上につながり、国民の収入を増すようなものであればもっと使われてもいいのかもしれない。だって、米国なんて ITセキュリティ教育に6億9000万ドル なんだもの。こういう金を IT企業が吸い上げて再投資にまわして技術開発しているわけだから勝てるはずないって気もする。加えて、上の 800億の予算のうちかなりの部分がハードウェアに絡むお金だし、純粋に人やソフトウェアに対する投資が少なすぎ。ただし、予算が有効に使われるかどうかとは別の話。上記のお金に関しても、かなりの部分が何も生み出すことがない人たちが消費してしまうのが現実。日本のソフトウェア産業の業界構造と生産性に関する実証分析 を見ると、ソフトウェア企業を「元請け」、「中間的下請け」、「最終下請け」に分類して、生産性レベルを比較した結果「中間的下請け」が最も低く、「元請け」と「最終下請け」については生産性のレベルにおいて統計的に有意な違いは見られなかった。この中間的下請け業者の生産性が上がらないことには、企業で無駄飯ぐらいの中間管理職が問題であるのと同様、ソフトウェア産業の産業構造においても、無駄飯ぐらいの中間的下請け会社の淘汰が必要なのかもしれない。IT利用産業(サービス産業)における労働生産性の日米英比較 ~IT資本深化が与える影響についての一考察~それは政府がやるべきことなのか政府がホテル・飲食店を採点、顧客満足度を公表へサービスの「質」を目に見える形にして、市場競争を促し、日本経済の生産性を高める狙いがある。ということのようだが、よけいなことしないで政府、自治体関連だけにしなさいって。よけいな金をよけいなところで使う。こういうものを目にすると、産学官モデルも、天下り先確保にしか見えなくなってくる。だいたい、民業圧迫だろうが。「日経225先物」などの売買を自動指示ひまわり証券、「日経225先物」などの売買を自動指示するウェブサービスを開始。ひまわり証券 システムトレードひまわり証券は5月8日、「日経225先物」など、株価指数を取引対象とする金融商品のシステムトレード(自動売買)向けサービス「TOPSCOLA Index」を開始した。ボックス相場では、人間は機械的な売買にかなわないような気がする。ただし、意図的に大きな動きを作り出すような資金が動けば別だが。ということで、システムトレードが増えれば増えるほど、転換点における巨大資金の投機的な仕掛けが強く出るようになると思う。2月末の中国株の大幅安を起点とした世界同時株安のような。jHepWork 1.2科学者/技術者向けのデータ解析フレームワーク「jHepWork 1.2」がリリースに1.2ではJython/Pythonエディタに関して多くの拡張を実施。加えて、コードアシスタント機能や、ヒストグラムを描画するための新しいJHPLOTクラスなどが追加されたほか、ドキュメントも整備されている。グラフ描くのは何が一番楽なんだろう。GDライブラリで棒チャートを作成するチュートリアル (Tutorials - GD Library Bar Chart)ソーシャルブックマークソーシャルブックマークを構築できるオープンソース「Pligg9.1」日本語版リリース。線の方に先に目がいっちゃう63歳の世界的デザイナーが挑む、新しきウェブデザインの世界縦も横も線だらけになっちゃうと、文字より線のほうが先に目に入っちゃう。「やらなきゃよかった」のかあの技術が期待外れに終わった理由、本当に「やらなきゃよかった」のか を読みながら、先端技術に関するコミュニケーションは基本的に困難だ。だからこそ一層の丁寧さが必要である。人は分かるまで分からない。分からなければ分からない。カラクリ人形東芝の創業者が示した本当の技術力、カラクリ人形に見る「日本的技術観」の秀逸さ。逆に、そういうところが足かせになっていたりして。気になるもの気になる!DNA抽出キットと走るASIMO。
2007.05.17
コメント(0)
![]()
プリファード、連想検索エンジン「reflexa」のWeb APIを公開 を読む。reflexaは、キーワードとキーワードの関連を計算し入力したキーワードに対して関連の深いキーワードを抽出する「連想検索」を行う検索エンジン。大量の文章を「確率モデル」を利用して分析することでキーワード間の関連度の計算を高精度で計算するほか、連想検索に用いるインデックスを圧縮技術を用いることにより効率的に格納。連想キーワードの抽出が高速に行える仕組みだ。ということで、reflexa Web APIの概要 あたり眺めてみる。Yahoo! JAPAN の関連検索ワードWebサービス あたりと比べると、返ってくる関連語がどのように違うか調べてみたらおもしろいかもしれない。プリファード は、Sedue 次世代検索エンジン を作っている会社なのね。高速なゲノム解析処理を1台のPCで実現する全文検索エンジン とか、まねっこさんじゃない独自路線を持っているのか。Sedue Flex - あいまい検索が可能な全文検索エンジン の GENOME SEDUCE を検索してみる。でも分からん(笑)。 で、連想検索エンジン reflexa を使ってみる。抹茶で検索してみる。なんだ、バスター事件 てと思って見てみたら、抹茶に含まれるカフェインは競馬施行規則によって禁止薬物に指定されていたため、抹茶を摂取した可能性のあるバスターは出走取消を余儀なくされた(なおその後の検査により、バスターは抹茶を摂取していなかったことが判明した)。が引っかかってきた。意外だったのは、「茶筅」が関連語として抽出されていないこと。抹茶を茶筅で点てて飲む人が少ないからなんだろうか。でも、データとしては拾ってきてほしいところ。Python で検索してみる。モンティ・パイソン、蛇のパイソン、言語の Python のそれぞれの関連のものが出てきているところはよいとして、関連語がざっくり3分野に分けられた上で出てくるともっとおもしろい。連想検索の類は、今の性能でも、見せ方をもう一工夫するとおもしろい何か出てきそうな気もする。だからこそ、それを期待して API を公開するってことかな。連想検索といえば、汎用連想計算エンジン(GETA) を使ってみようと思いつつ、まだ使っていない。
2007.05.16
コメント(0)
独立行政法人 農業・食品産業技術総合研究機構 中央農業総合研究センター を、農業経営シミュレーション を下記ながら眺めていたら、データマイニング研究チーム があるのを見つける。考えてみるまでもなく、この手のものってデータマイニングの対象の宝庫なわけなのね。そこで、農業概念検索を見つける。例によって、この手のものを調べるときには「抹茶」で検索する。今、サーバーが停止しています!暫くしてから、また、アクセスしてください!御迷惑をお掛けしまして、誠に申し訳ありません。がっかりさせやがる。「SDD」は Semi-Discrete Decompostion の略で潜在的意味インデキシングLatent semantic indexing(LSI)で実現した概念検索システムです。らしい。SDD ヘルプを見ると、SDDPACK Software for the Semidiscrete Decomposition へのリンクもある。農林水産省委託研究プロジェクト「データベース・モデル協調システムの開発」 当たりを見ると、質問応答システム(農林漁業情報) なんていうのも動かしているようだ。パラメータ指定して設定ボタンをクリックすると質問受付画面になる。質問応答システム(World Wide Web) は対象が各種検索エンジンを使ったものになるので何でも質問有り版のようだ。Copyright c 1998-2005 Mori LaboratoryGraduate School of Environment and Information SciencesYokohama National Universityと画面に書かれている。なんか、どこかで見たことがあるようなと思ってみたら、横浜国立大学 森研究室 各種サービス(デモ&ダウンロード) のところにあるやつか。受託研究費 のページを見ると、「独立行政法人農業技術研究機構. 森 辰則(代表). 「農業・水産情報テキスト知識ベース構築技術の開発」 H16-H17.」等々の受託研究があるので、そういうところからお金が出ていたのね。
2007.05.16
コメント(0)
インターネット上で簡単に農業経営のシミュレーションができる「農業技術体系データベース・システム」を開発中央農業総合研究センターと岩手県農業研究センターは、インターネット上の簡単な操作で農業経営のシミュレーションを実施できる「農業技術体系データベース・システム」を共同開発しました。九州大学と共にこのシステムの実用性を確かめるため、無料で一般に公開(http://fsdb.dc.affrc.go.jp/)します。ということで、農業技術体系データベースを用いた営農計画支援システムFAPS-DB を見てみる。こういうデータベースを使ったシミュレーションゲームが作られるとおもしろいのにな。本格的なシムファームとか。娯楽として興味を持つところから人を惹きつける。エデュテイメントというか。教育的でありながら、娯楽性に優れたゲーム。リアルタイムの市況や天候が反映されながら、農業経営が楽しめるみたいな。一定期間で最高のパフォーマンスをあげた人には農協からプレゼントが出るとかw
2007.05.16
コメント(0)
![]()
株ロボットで1日3万円寝ながら儲ける!長谷川式完全自動売買投資法 を読む。これもやはり入門書で、カブロボのすすめみたいな感じの本。基本的に、システムトレードの本はゴールデンクロスとか、RSI がなんちゃらとか、テクニカルチャート系の売買は統計的に見ると必ずしもうまくいくとは限らないよというところから始めるのがセオリーなのかw。基本的には、プレコオンライン の 株ロボ パーフェクトセット とか 株ロボット工房 の販売促進みたいな本かもしれない。読んでいるうちに、作るのは大変だ。買うしかないよという方向付けに持って行かれる。「チャート力学VS」のみ購入(247,700円)。うーん、作るコストに比べたら買った方が安いかぁって。でも、こういうものって 1ヶ月無料でおためし期間があるシェアウェアが向いている。有効であればお金を払って使い続けられるというような。本については、プレコオンライン のページを全部見れば、本は買わなくてもよかったかな。。。。。この手のシステムトレードの啓蒙書は基本的に一冊見れば十分という気がする。自分で何か作ろうとか思っている人であれば、むしろ チャート力学 VS による売買システム構築&システム売買入門 (PDF) でも見た方が参考になるかもしれない。システムトレードのプログラムが公開されると株価に影響を与えるから公開できないということについて思うのは、タイムマシーンのお話。タイムマシーンに乗って過去に行って過去を変えてしまうと未来も変わってしまう。だから過去は変えてはいけない。取引額が少額であれば、将来から見た過去のトレンドにそれほど影響を与えないが、大きくなりすぎれば未来に影響を与える。もっともらしいけど、ある一定の方法論で売買するロボットがどの程度の勢力(取引額)になれば市場に影響を与える可能性があるのかについては不明。基本的に個人の行動と変わらないと考えれば、それ自体が市場に影響を与える可能性はそれほど大きくないはず。むしろ、一定のパターンの取引が大量に行われているとき、これを見越した大口の仕掛け的な売買の与える影響がはるかに大きいだろう。広く知られることになったトレーディング方法は、人間の恣意的なトレード方法と同程度にしか相場に影響を与えないのではないだろうか。要は参加者の数と金額の問題か。同じトレードのシステムを使い、同じ動きをするならば、小さな額が集まると中口ぐらいの威力は出てくるかもしれない。そうすると、逆に無料でトレードシステムを配布して、自分と同じ方向で売買してくれるようなものを一大勢力とするようなやり口というのもあり得るのかもしれない。それは一種の仕手グループのような働きになるだろう。んー、仕手グループが同一のシステムトレードを使って一糸乱れず(抜け駆けせず)、相場を動かすなんていうのは、実はありそうな気もする。自律分散協調型の仕手システム。なんて恐ろしい。。。。。自律分散協調論 なんて見てみる。なんだかわけの分からない方に妄想モード。何はともあれ、秘すれば花なりと肝心なところは出さずに、予想外の動きをするようなところを持つものがよいのかもしれない。そうするとシステムトレードの本というのは、常に、肝心なところは書かれない本ということになるのかもしれない。でもって、やっぱり、肝心なところはシンプルなやつで十分だったりとかね。そういえば、上場企業の決算訂正、5年で10倍に 06年度は2025件 らしい。決算の公開時には ITが有効活用されていないということを物語っているのではないかと。ちなみに、XBRL とかはどの程度使われるようになったのだろうか。東証におけるXBRLへの取り組み とかいうのはどうなっているのかな。金融庁の業務・システムの最適化に係る最適化効果指標について のあたりから、最適化効果指標 (有価証券報告書等に関する業務の業務・システム)2006年6月27日 を見ると、XBRL導入による高度な情報利用の実現で 2008年度から 2,945千円の経費削減効果が見込まれているということだが。逆行安の新興株市場、2ケタ増益予想にも不信感、新興市場投げ売り状態。新興市場の会社は株主軽視しまくりなので仕方あるまい。さんざん嘘つきまくった×。まあ、どこかで買いに回るところも出てくるんだろうけど、ボロボロのところ多すぎ。4月の企業倒産件数、2.8%増・帝国データバンク前年同月比での増加は7カ月連続。負債総額は比較的規模が大きい企業の倒産が相次いだ結果、5912億6800万円となり、前年同月比で40.2%増えた。結局、大企業(特に輸出産業関連)がもう買っているけど、それ以外の国内だけの産業ってまだまだ厳しいのが現状。機械受注統計 も悪い感じ。ちなみに、こうした指標と株価の相関はどうなんだろう。んー、民間の予想とのギャップで株価に織り込まれていると考えるか、サプライズととらえるかというところになるだろうから、サプライズが大きいときは結果として先行指標になるんだろうか。でも、過去データがまとめて得られないからバックテストできないし、自動取引のルールにはしにくい。
2007.05.16
コメント(0)
グニャラくんのグニャグニャ備忘録@はてな を久々に見たら、Python 関連の話題が グニャラくんのグニャグニャPython備忘録 が分離されたので見に行く。Google vs 2ちゃんねる?-- 純国産検索エンジンに本気のベンチャー も見る。Wikipedia 検索 も使ってみる。Django 使っているのね。なんていうのはどうでもよいのだが、例えば、「簿記」で検索すると、Wikipedia には「簿記」というそのもののエントリがあるのだが、これがトップにこないのはなぜなんだろう。「タイトルで検索」のところにも出てないのね。不思議。「コンテンツで検索」で「2月10日」がトップに来ているのもまた不思議に思ったが、簿記の日だったのね。Google で 簿記 site:ja.wikipedia.org を検索したときと並び順が違うので、おもしろいものが見つかったりする。ふと、Wikipedia を KWIC で見るとおもしろいかなとか思った。
2007.05.15
コメント(0)
goo、Blog 検索機能を強化~口コミ・評判の分析機能を実装 を読む。この仕組みは、NTT のサイバーソリューション研究所が開発した「Eigen Rumor」という分析アルゴリズムを活用しており、「注目度」と「鮮度」の観点で、効率的かつ手軽に目的の Blog 記事を探し出せる。「goo」の Blog 検索サービス をちょっと使ってみる。こんな比較はおもしろい。こんな分析もおもしろい。いい線行っているかもしれない。このレベルまで来ると、ちょっと使ってみてもいいかなという気がしてくる。が、なんだかんだで情報を探すのには Google 使っている。要するに、みんながどう思っているかはどうでもよくってという世界になると、評判なんてどうでもいいから。であれば、次の話題は何かという、話題の萌芽と情報源を抽出してくれるようなものがあるとよいのだな。「次のネタ」というような情報検索サイトが欲しかったりして。別のところで ビー、商品から社会問題まで、ユーザー評価をグラフ表示する「マイ評価ドットコム」 も見てみる。ユーザーの指定したさまざまなジャンルのテーマについて、ほかのユーザーが評価とコメントを投稿できる。評価結果は、レーダーや円、棒グラフでリアルタイムに提供するとともに、評価順と話題性順でランキング表示する。ユーザーは、無料で利用できる。評価系のものが日々増えているな。まあ、マーケティングと結びつきやすいところだし、広告とも結びつきやすいところだからなんだろうか。myhyouka.com(マイ評価ドットコム) に行ってみる。製品に関してはコレを見るなら、価格.com に行くなぁ。評価投稿系か。これはあまり興味を感じない。投稿系よりブログから抽出されたものの方がおもしろい。
2007.05.15
コメント(0)
![]()
株勝率80%の逆張りシステムトレード術 を読み終わる。システムトレードの基本的な考え方が分かる本。プログラミングの話などはなく、一般の人が読んでも分かるように書かれている。移動平均線をベースとした逆張りトレードの考え方で全般的に説明されている。移動平均線のゴールデンクロスを手がかりにした売買は成績がよくない。それより移動平均乖離率を使ったものの方がパフォーマンスがよくなるようだ。ただし、10年間のデータを使ってのバックテスト(ルールを過去のデータに適用して検証する)を行うときにランダムにポートフォリオを作って運用したらどうなるかなどの手法を使っての検証については書かれていない。平均値でどうかということだけでなくて、実際の運用に近い形でいくつかの銘柄を適当にルールに合わせてピックアップして売買したらどうなるか、運用資金との関係も合わせて考えないと、ほんとうにパフォーマンスがよいとはいいきれないかもしれない。おそらく、東証一部または二部上場企業の場合は、本書に書かれている手法を続けていけばそれなりの成果が上がりそうな気がするが、もし、この2年間、新興市場の銘柄を中心にして、この手法を用いたらどうなったか?逆行安の新興株市場、2ケタ増益予想にも不信感 という状況で、逆張りルールが通用するか?全銘柄を対象にしての平均ではよくても、個別の取引ベースにすると当たりはずれがあるから、貧乏くじ引きまくると案外悲惨なのだ。ベースの考え方としては納得できるところがあるので、あとは、銘柄絞り込みを詳細化すれば、それなりのものができるのかもしれない。とりあえず、自分の場合は日経平均で考えるから絞り込みはそもそもいらないのだが。まずバックテストができる環境を、早いところ作らないといけないな。
2007.05.15
コメント(0)
![]()
セイコープレシジョン、東大などと時刻認証電子メールを用いた先端科学技術情報保護システムを開発 を読む。電子署名と時刻認証を組み合わせることで、本人確認と存在日時確認が可能となるセキュアな電子メールシステムを使った先端科学技術情報保護システムとのことだ。ついでなので、SEIKO Cyber Time 時刻認証サービス を見てみる。「RFC3161 に準拠したタイムスタンプ発行サービス」で、時刻精度は、500ms。占有タイプでは2048bit RAS鍵で、毎秒200件のタイムスタンプを発行する高性能なサービスです。で、時刻認証電子メールサービス が記事のものかな。価格が150万円予定のようなので、それなりの会社であれば導入できないことはないだろうが、ISP 等が無料または少額課金のサービスとして始めるとおもしろい。PFUタイムスタンプ の 定額制サーバ導入 の価格体系はどうなのだろうか。PFUタイムスタンプ SDK RFC3161(無償提供) みたいなものがあるようだから、場合によっては、こういうものを利用した方がよいのかもしれない。さらに調べてみると、→ セイコーインスツル株式会社の「クロノトラスト時刻配信サービス」の時刻配信・監査を採用→ 日本認証サービス株式会社(注3)の証明局からタイムスタンプ局証明書を発行なので、結局時刻配信サービスはセイコーインスツルなのね。PFU、RFC3161準拠の「タイムスタンプ・サービス」を9月より提供 (2004/06/18) からそうなのか。PFUタイムスタンプ10年サービスを開始 とか見ると、有効期間が10年ということなので、それ以上の保管期間が必要な場合はどうすんだろう。タイムスタンプサービス 入門講座 を見てみる。電子証明書の有効期間は、一般的なもので1~2年。長くとも電子署名法において5年間と定められている。(タイムスタンプサービス 入門講座 第2回)法律的にはそういうことなんだろうけどと読み進める。現状、残念ながら、30年、50年といった長期の有効期間を提供するにはいたっておらず、今後の暗号技術の進歩が鍵を握っております。サービスに利用される暗号技術の解読や脆弱性が見つかりにくく、将来に向けて強固で信頼性が高いと考えられる暗号技術の商用化が必要になります。(タイムスタンプサービス 入門講座 第5回)ということで、技術的な問題なのね。さて、ここで問題。何年かしたら30年サービスが出てきたとして、サービス事業者を乗り換えるとしたらどうなるか。この手のサービスって、けっこうロックインが起きやすいサービスって感じがする。RFC 3136: Time-Stamp Protocol については、IPA タイムスタンプ技術解説 最新動向と将来展望 (PDF) (2004/04/28) を見ると分かりやすい。この中に、電子署名の長期保存のページがある。上記サービスでは、RFC 3126 (Electronic Signature Formats for long term electronic signatures) の +認証パス上の全証明書+全ての失効情報(CRL/OCSP応答)+アーカイブタイムスタンプで繰り返し付与することで有効性を延長するという方向なのかな。長期署名に対応した製品としては、三菱電機MistyGuard署名延長システム(RFC 3126)や、 日本ボルチモアテクノロジーズSignusDVCS (DVCS) があるらしい。上記 IPA の資料はちょっと古いので最近の状況はどうなのかな。米国郵政公社(USPS) 電子消印サービス(EPM) はMicrosoftOfficeの専用プラグインを無料配布し、誰でも利用できるサービスのようで、1スタンプ$0.1~$0.8。郵政公社もこういうもの考えているのかな。本題に戻り、時刻認証電子メールでネックになるのが、S/MIME かな。【特集】S/MIMEでセキュアな電子メール環境をつくる!。まあ、今時のメーラーは S/MIME には対応しているものが多いだろうけど、導入コストの中にはメーラーの設定や社員教育等も含めて考えなきゃならない。なんだかんだで S/MIME でさえも敷居は高いが、なんとなく、使われる頻度が増えて来そうな気がする。そういえば、S/MIME といえば、三井住友銀行が電子署名付き電子メール(S/MIME) を平成18年5月22日(月)から送るようにしたらしい。銀行系が顧客へのメールで使い始めると案外 S/MIME が一般にも広まり始める可能性があるか。受け取りベースでは。
2007.05.15
コメント(0)
404 Blog Not Found, 紹介 - Shift Happens で紹介されていた Shift Happens を見る。これは、ほんとうにおもしろい、というかセンスがいい。スライドって、それはそれで文章と違ったイマジネーションを刺激してくれる。書いた人の意志や意図と違うところで遊べたりする。スライドと動画、漫画とアニメ、小説と映画。刺激されるところが違う。違うところが刺激されると気持ちいい。SlideShare を少し見てみる。SlideShare で Python を検索してみる。SlideShare も探してみるとおもしろいものみつかりそう。あなたのページを最速にする14の掟 は、素直になるほどねぇ。でも、アクセスがそんなに多いサイトは関係ないやとかいうのはおいておき、イントラネットのアプリケーションとかでこういうことを最初から考慮していれば気持ちよく使えるようなものになるかもしれない。少しでも軽い方が気持ちいい。
2007.05.15
コメント(0)
![]()
言語工学研究所の社長のブログ があることを知る。おもしろい。言語工学研究所 構文解析試用サイト も見てみる。これ、もう少し係受けがわかりやすいように出力をきれいにした方が同じ処理でも、魅力がまして見えるだろうが。構文解析 ブログなどの文体を意識 も見てみる。「クロールで泳いでいる彼女を見ていました。」「望遠鏡で泳いでいる彼女を見ていました。」なども、シソーラスで語と語との意味的な距離を測る ような方法で正しい解析ができるのね。格フレームの考え方でなくて、単語間の距離から構文解析しているのか。デジタル類語辞典 第5版。
2007.05.13
コメント(0)
邦銀格上げ邦銀9年ぶり「Aa」格上げ 米ムーディーズ らしい。銀行関係者は長い道のりだったと、ほっと一息なのだろうな。それにしても、そうした発表の直前まで、売られまくっていた銀行株。世の中、魑魅魍魎が跋扈してるなぁ。巨大な資金を動かしている人たちは、どこでどう結びついているんだか。この1年間は長期保有していたところが売りスタンスを続けていて、その仕上げが終わったということでもあるのかな。とりあえず、今年の底値確認になるのか、それともまだ何かあるのか。。。。億万長者バフェット氏ご健在米バークシャー、「巨大事業」の買収を望む=バフェット氏。まだご健在なわけか。米ダウ・ジョーンズ、ニューズ以外からも買収案受ける可能性=バフェット氏 。ダウ・ジョーンズの議決権の過半数を保有する創業者一族バンクロフト家は、ニューズの買収案に反対する意向を示している。飲酒運転と交通事故数GWの交通事故死者、過去最少に 飲酒運転が大きく減少 らしい。北海道でも 連休中の道内 交通事故の死者3人 過去2番目に少なく 。めでたいこと。とはいえ、ニュースを見ていると未だに飲酒運転関連のニュースが絶えない。量子コンピュータNECなど3者、「量子コンピュータ」の実現に近づく量子アルゴリズム実行が可能な回路技術を開発。量子コンピュータが実現するまでには、まだ時間はかかるんだろうが、着々と進んでいるのだな。それにしても、例えば現在では数千年もかかるような数百桁の数字の素因数分解が数十秒にして解けるようになると期待されている。演算能力は期待されているだろうけど、現在の暗号が破られまくる状態でもあるわけで、量子コンピュータが実現される時代には暗号も進化せざるを得ない。絶対に盗聴されない究極の暗号システム“量子暗号”は、5年以内に実用化するか?「これまでの5年で基礎研究の段階が終わり、これからの5年で実用化と複数の暗号システムのインターフェースを確立していくフェーズに入る」と述べた。着々と進んではいるわけか。OpenIDライブドア、認証 API「livedoor Auth」に OpenID 機能を追加。OpenID はどの程度、日本で普及するのか。
2007.05.09
コメント(0)
中国、北米、欧州のコンテンツ市場JETRO 中国、北米、欧州のコンテンツ市場の最新レポート3本を公開 らしい。この記事からの JETRO へのリンク、切れてる。JETRO 海外マーケット調査レポート(コンテンツ) のあたりにあるやつか。やっぱりリンク切れしてる。メンテナンス悪し。中国におけるテレビ番組販売ハンドブック(輸出促進調査シリーズ) は見ることができる。おもしろい。IC タグ第1回 コマツ物流、日英間で部品を輸送する専用パレットを追跡管理。2004年から検討開始していたらしい(つまり、3年ぐらい導入までにかかった)。輸送する部品の形状に合わせて専用バレットというものが 11種類あり、平均単価が約5万円、数量 3000個で合計 1億5000万円分。これを IC タグを使って管理するシステムを稼働させたという話。ソフトは凸版印刷の循環容器管理システム「NETLOOPASS」。Sun オンデマンド・コンピューティングSun,ネット経由のソフト利用を24カ国で可能に 、米Sun,オンデマンド・コンピューティング「Sun Grid」をネット経由で提供。http://www.network.com/WikipediaWikipediaライバル「Citizendium」、パブリックベータ開始 と 「Wikipediaの権威失墜。それがCitizendiumを作った理由だ」 を読む。選択肢があるのはよいことだけど、力は分散するということもあるか。まあ、両者が参照し合いながらやれば、それはそれで相乗効果もあるかもしれないが。モデレーションとエディション。Windows でフルバンキング百五銀行のWindows勘定系が稼働,フルバンキングで世界初 か。何使っていると思ったら、やっぱり 日本ユニシスの 「ES7000」 か。平成19年度科学研究費補助金の配分平成19年度科学研究費補助金の配分について(速報値) を見る。こういう資料は CSV形式なり Excel ファイルなりでデータとして再利用しやすい形でも公開した方がよいと思う。というか、あまり精査されたくないんだろうけど。ネットのニュースメディアは、こういうものから、科研費獲得ランキングなんて作ってみるとおもしろいと思うんだが。いろんな資料のデータをまとめていって、政府からの獲得金最大の大学や企業のランキングを作るとか。公的機関の発表資料を使ったコンテンツがもっと増えるとおもしろい。人工無能ボット・ロイディ人工無能ボット・ロイディと話そう! なんてのがあった。最近、この手のものを見ていない。ちょっと興味が遠のいている。三角合併森永 卓郎氏: 三角合併、これだけの誤算 ~ 日本経済は活性化しない日本の資金がローリスクの海外債券などの投資に向かい、そのカネが日本に環流して企業買い占めの資金になっているのだ。 これをして、「タコが足を食うような年金運用」と。
2007.05.08
コメント(0)
Pure-Python の PDF 読み込みのためのライブラリ pyPdf を使ってみる。Pure Python PDF to text converter のようにして日本語のファイルを読み込ませてみると、ちゃんとテキストを抽出できたと思ったら、ファイルによって扱えたり、だめだったりする。画像が入った 2M ほどのファイルを読み込ませたらかなり時間がかかった上にとんでもないことになった(ビープ音が鳴り続いて、文字化け状態の出力が延々続く)。試すときは、いったんファイルにリダイレクトしてテキストエディタで開いて確認しないと悲惨。お勉強用か、がんばってハックして日本語でも大丈夫なように書き換えるかしないと使えない。ソースはまだは見ていない。
2007.05.08
コメント(0)
![]()
総務省消防庁 の 「消防ヒヤリハットデータベースの運用開始」~ 消防職団員の事故事例の情報収集・提供システム~(pdf) で公開された 消防ヒヤリハットデータベース を眺めてみるとおもしろい。IT のシステム運用でも、こうしたヒヤリハットデータベースが作られて公開されるとおもしろいというか有意義。
2007.05.07
コメント(0)
![]()
日経平均の予測プログラムを少しずつ考え始める。取得した株価文字列のデータを float にすると、例えば、1.1 が 1.1000000000000001 とかなったりして困る。あくまで 1.1 になって欲しい。だから、5.5 decimal -- 10進浮動小数点数の算術演算 を使う。でも、SQLite を使うとすれば、Datatypes In SQLite Version 3 を見ると、REAL. The value is a floating point value, stored as an 8-byte IEEE floating point number.で保存しておいて、Python 側では Decimal で扱うしかないか。PostgreSQL や MySQL は DECIMAL があるが SQLite には DECIMAL がないのが困る。[pysqlite] Converter for decimal.Decimal (again)If you really need to store Decimals values, and do some operations with them in the database, just do *not* use SQLite.ごもっともな話。SUM とか集約関数を使うと REAL で保存されている値を使うことになって、誤差が出てしまうから。もっとも、簡単な予想だけなら、そこまで厳密に考えなくても問題ないだろうけど。いっそのこと FireBird 試してみるかな。Python から FireBird を使うには KInterbasDB がある。更新もされているようだし、FireBibird Data Types を見ると、Deciaml はあるし。日本医師会のオープンソース医療ソフトでFirebirdのユーザーが1万4000に とかで、安定して使えそうな感じだし。実際のところ、あれこれインストールし直すのが面倒だから SQLite なら Python 2.5 を使えば標準で SQLite に対応したモジュールがあって楽だしというのもあったんだけど。。。。。演算誤差の正体 ―― IEEE 754 浮動小数点数の仕組み
2007.05.07
コメント(0)
携帯電話の利用iモードのパケット定額が1000万契約を突破 らしい。ふーむ。そろそろ次の段階に入っているのだな。NTTドコモ報道資料: iモードパケット定額サービス契約数が全国で1,000万を突破。検索サービス検索サービス、米に挑む日欧米国には日欧のような計画こそないが、検索技術が国家安全保障を左右するとの認識が根本にあり、「大学や民間研究所に潤沢につぎ込まれる軍関係の研究費が、一般企業の競争力につながっている」(米スタンフォード研究所アナリストの清貞智会(きよさだ・ともえ)さん)。なのだよな、やっぱり。国家安全保障と検索がちゃんと結びついている。単純な Buy American の発想じゃない。引用の乱用ネット時代の危うさ 新聞記事引用も…すり替えられた内容 を読む。著者の意図を無視した引用は、ネットでなくて、通常の書籍でもあると思うけど。ネットで検索が簡単になったから意識されるようになっただけなのかもしれない。引用元の記事をたどることができさえすれば誤解は解ける。でも、引用元をたどらないときもたどれないときもある。そこにリスクはある。新聞社の記事は、一定時間経つと参照ができなくなってしまうものが多々あるが、これは悪用できる。乱用しているのを承知でリンクを張っておき、リンクが切れたあとの効果を利用する。新聞社の記事にこう書いてあったと勝手な主張を展開しておけばいい。リンクが切れていれば、後々そのページを見た人が確認することができない。いったん公開したものを非公開にするリスク。委託業務の統制委託業務の統制が意外な負担 を読む。日本版SOX法は、アウトソーシングを見直す1つのきっかけになりそうだ。大きい問題をはらんでいると思う。災害発生時第7回 災害発生時における意思決定を支援するICT技術の活用について大規模災害は頻繁に発生するものではないため、災害対応結果をノウハウとして蓄積し、次の担当者に確実に伝え、災害への備えとすることが重要である。頻繁に発生しないけれど、起きたときには影響が大きいことの対処。WinBinder【PHP TIPS】 31. WinBinder でデスクトップアプリケーション で WinBinder か。Winbinding Your Code: Win32 GUI Development with PHP and Winbinder を見ると、PHP はデスクトップアプリ開発環境が遅れていただけに、逆に、新しい形で進めたという面があるのかな。Python でも Win32 Extensions があるし、GUI 開発環境にしても TkInter も wxPython もある。IronPython の方向もある。IronPython のご紹介。でも、こうやってあたかも何かであるような名前をつけてパッケージ化していくこと別のイメージになって、さらに別の方向性の進化が始まるというところがあるか。なんとなく、WinBinder はそれなりの方向に行ちゃうかもしれないとか直感。
2007.05.07
コメント(0)
日経平均 や 東証株価指数 (TOPIX: TO-kyo- stock Price IndeX) の予測を行うのに、ベースとなる日経平均等、株価情報をどこからとるか考える。最低限、欲しいデータは次のもの。始値高値安値終値(前日比)(出来高)前日比のプラスマイナスは計算から求めることができるので必須ではない。出来高はあった方がよいが、出来高まで取れるところは限られているので(たとえば QUICK Money Life や ケンレミ株式会社の株式指標のページなら各種指標の出来高をまとめてとってくることができる)、第一段階では省略。最初はなるべく単純なところから始める。よって、始値、高値、安値、終値のみでやってみる。実際のところ、それだけで予測ができれば誰も苦労しないわけだが、すべての情報がこの4つの値に織り込まれているというスタンスで、まずはやってみる。あの日の日経平均は を使えば、正確な値を確認することができる。その他の情報源としては、Infoseek なら 日経平均株価 (指数コード:100000018) 2003年1月1日~ 2007年5月3日まで 等日付を指定してやれば、まとめてとってくることができるので、これで試してみる。その後、「あの日の日経平均は」を使ってデータが正しく登録されているかチェックをすればよいかな。何年分のデータを使うかというのは難しいところだが、実際のところ Infoseek が 2003年以降のデータしかとれないのでそれに合わせる。古いところが必要なら改めて あの日の日経平均は から取り出すことにする。Infoseek からは BeautifulSoup を使ってスクレイピングと、「あの日の日経平均は」に日付を指定してデータが取れるようになった。あの日は、下のような感じで簡単に取れる。Infoseek からとってくるのも、少し長くなるだけでできた。やっぱり BeautifulSoup は便利。# -*- encode: utf-8 -*-import urllibimport urllib2from BeautifulSoup import BeautifulSoupurl = 'http://www3.nikkei.co.jp/nkave/data/index.cfm'def print_nikkei225(yyyy, mm, dd): """ get Nikkei 225 index """ values = {'yyyy':yyyy, 'mm':mm , 'dd':dd} data = urllib.urlencode(values) req = urllib2.Request(url, data) b = BeautifulSoup(urllib2.urlopen(req)) data = b.findAll('tr', bgcolor="#FFF5DE", align="right")[0].findAll('td') data = [x.contents[0].contents[0].string for x in data] print "始値=%s, 高値=%s, 安値=%s, 終値=%s" % tuple(data)print_nikkei225(2007, 5, 2)実行すると、2007年5月2日の値が、次のように表示される。始値=17,310.75, 高値=17,441.10, 安値=17,227.09, 終値=17,394.92Infoseek の方もラフに書いたのであれだが、次のような感じでまとめてとってくることができる。# -*- encode: utf-8 -*-import urllib2from BeautifulSoup import BeautifulSoupimport sockettimeout = 10socket.setdefaulttimeout(timeout)URL='http://money.www.infoseek.co.jp/MnStock/slast.html?qt=100000018.i'def print_nikkei225(sy,sm, sd, ey, em, ed): global URL op = '&sy=%s&sm=%s&sd=%s&ey=%s&em=%s&ed=%s&k=d' % (sy,sm, sd, ey, em, ed) req = URL + op while req != None: b = BeautifulSoup(urllib2.urlopen(req)) data = b.find('table', 'ruled').tbody.findAll('tr') for tr in data: td = tr.findAll('td') print tr.th.string, td[1].string, td[2].string, td[3].string, td[0].string next_url = None next_urls = b.findAll('a', href=re.compile('/MnStock/100000018.i/slast/\?sy')) for n in next_urls: if n.contents[0] == u'\u6b21\u306e50\u4ef6 ': next_url = n.get('href', None) if next_url == None: req = None else: req = "http://money.www.infoseek.co.jp" + next_url req = req.replace("&", "&")print_nikkei225(2007, 1, 1, 2007, 5, 2)これで 2007年1月1日~2007年5月2日のデータが表示される。とりあえず動くかどうか適当に書いてみたので、後で汎用性があるように書き換えることにしよう。しかし、スクレイピングの弱点は、やっぱり、ちょっとでもHTML を変えられるとこけちゃうところだな。。。。追記追記req = req.replace("&", "&") のところが、そのまま & とそのまま書いてあったので、HTML になったときに消えてしまって req = req.replace("&", "&") に見えていたので修正。
2007.05.04
コメント(0)
自分の声で文章を読み上げる、音声合成サービス を見る。おもしろいなと思った。一度自分の声を合成してしまえば、どんな長い文章でも自分の声で読み上げることができるし、万一病気などで声帯を使えなくなった場合でも、 PC を経由して自分の声で日常生活のやり取りができる、とのこと。 できがよければ、犯罪者がアリバイ作りにも使えるようになるだろう。たとえば、10時に殺した人の声を使って、14時に家族に電話をかけるなど。あるいは、勝手に人の声を使って、滅茶苦茶なことをするなど、いろいろな用途が考えられる。なんて物騒な発想はやめておく。いくら似た声を合成しても声紋とればばれちゃうし。というか、そこまでできがよいのか、試してないから分からないが。。。。むしろ、私の声を聞かせたいある人に声を貸してあげるという発想がよいかもしれない。たとえば芸能人の誰それの声を使って、むふふっなことをしゃべらせる変態も出てくるか。どうも変な用途ばかり考えつく。
2007.05.03
コメント(0)
Zope / Pythonのリンク配信 - 日本の Zope 情報 を見ていたら、スペル修正プログラムはどう書くか が目についた。へぇ、日本人でもこういうプログラム書いてみる人がいるんだ。と思ってよく見たら、Peter Norvig / 青木靖 訳、と翻訳であった。読み始めたとき、「訳」というのが目に入っていなくて、海外留学している日本人が書いているものかと思ってしまった。オリジナルは How to Write a Spelling Corrector。青木靖さんは Fine Software Writings をみたら、いろいろ翻訳して公開されている方なのでした。失敗した結婚みたいな企業が多すぎる なんていう記事ももおもしろい。そのほかにもあれこれおもしろい記事があった。
2007.05.02
コメント(0)
![]()
クールからホットへ,2007年のPythonコミュニティ を読む。『みんなのPython』や『TurboGears×Python』の著者、柴田淳さんの記事。PyCon に出て、私は祖国を売ってしまったのかもしれませんが,とにかく会場は大爆笑でした。自虐ネタで笑いをとってきたらしい。笑いをとるのは重要だな。言語として大変魅力のあるPythonですが,私がそれ以上に魅力を感じるのがPythonに引き寄せられてくる「人」についてです。クール過ぎて一見つきあいにくそうだけど,クレバーで物事についてよく知っていて,美しいものについて造詣が深く,リテラシーが高い。海外でも国内でも, Pythonistaにはそんな有能な人が多いような気がしています。日本人に対しては、ちゃんと日本人の Python 使いをほめあげて記事を終えている。Google でも使われています戦略から、Python 使いほめあげ戦略へ転換かな。クールからホットへという話の流れも良い感じで終わっている記事。オンラインメディアの影響力は大きくなる一方だけど、良書を出し、流行に加担する出版社の役割というのは大きい。技術評論社にとりあえず次の一手を期待しておく。『Xen × Twisted × Python』とか『MailMan × Python』だとか、Python で書かれたものを 扱ったチューニングだとか、改造だとかを掘り下げたものとかもおもしろいかもしれない。『TurboGears × Python』は、昨日、本をまとめ買いしたときにいっしょに注文した。株価のデータを扱うのに、TurboGears でも使ってみようかなと。
2007.05.02
コメント(0)
昨年の12月に swicki を使い始めてはみたものの 、やっぱり反応が遅いのがちょっとネック。今日、少しだけ kugutsushi swickiを鍛えてみたものの、やっぱり、レスポンスが悪いのでたくさんやる気にならない。やっぱり、検索エンジンとしても毎日使いながら、地道に使ってやらないとだめだな。でも、やっぱりレスポンスが悪すぎ。このあたりがネック。利用者を増やすにはレスポンスの改良が必要。でも、利用者が増えないと新規投資(マシン等)についてはなかなかできないだろう。ということで、ニワトリが先か卵が先かというところがこの手のものにはあると思う。世の中にはサービスのアイデア自体はおもしろくても、リクエスト処理のパフォーマンスの悪さから利用度を上げることを自ら放棄しまっているかのようなサービスがたくさんあるかもしれない。意外とメジャーになりきれないけれどおもしろいものというのはたくさんある。日本でおもしろいサービスが伸びない原因の一つに、ユーザの保守性とかもあるかもしれない。利用者にとっても、将来性がわからないサービスを使うのは労力の先行投資でもあるわけだし、そのリスクを嫌えば定評のあるサービスのみを使うといった行動に出る。ソフトウェアについてもそう。育てゲームの一つとしてのソフトウェアやサービスの利用。かわいがってもらいやすいサービスやソフトウェアはどのようなものか。
2007.05.02
コメント(0)
全55件 (55件中 1-50件目)


