Last-Modified: Mon Nov 27 06:02:05 2006
結局、5年の時限付きで導入される模様。
……あれ、日経の記事には差し止め期間が書いてあるけど、
朝日の記事には載ってないや。
もちろん国益っちゅーもんがあるんで、ある程度国内の業界を保護することは重要だと思うけど、
個人的な感覚としては保護しすぎに思える。
境真良さんの輸入権問題に関するいくつかの後悔というのが参考になる。
リンク集としては、津田さんの2004/02/05あたりかな。
JUGEMがサービスインしているのでさっそくアカウント確保。
ちょこちょこ向こうに書いたけど、まとめるとこんな感じ。
乗り遅れた……_| ̄|○
泣きながら報告フォームに載ってるの全部読んだので心に残ったのをりすとあーっぷ!
|-`).oO(密かにラーズのが一番ラブコメの基本に忠実だと思えるのは贔屓目なんだろうか……。)
おいらは、流行廃りのループというか、まず王道ありきなんだと思います。 そこから異分子が〜というのには同意。
朝には既にリストに追加してあったんだけど(笑)
がんばれIT戦士がんばれ!
IT戦士 岡田有花リンク集を見つけたのでちぇき。
順調に増加中。
ちょっと関係ないけど、書かないと忘れるのでメモ。
知られざる通信戦争の真実―NTT、ソフトバンクの暗闘
は書名は胡散臭いけど中身は良い感じらしい。
はてなアンテナは、本文の差分で更新検知しているのは有名ですが、 さらにそれをはてなキーワードにも利用するようになってます。 やるなぁ、はてな。
あとはキーワードの固有名詞限定があれば……(まだ言い続けてみる)。
ログインできなかったのは、朝には復旧してました。
というわけで、物好きそうな人を何人か誘ってみてます。 面白そうだと思った人は登録してみてくださいな。
ちなみに、orkut ってのは一説には人間関係抽象化および数値化システム
と呼ばれるぐぐる様がやっているソーシャルネットワーク
サービスです。
要は、電子上のお友達リスト。
たださんの、
欲望渦巻く関心空間
という表現はうまいなと思った。
これも輪王さん経由。あと、1M hitsおめでとうございます〜。
まーじーでーっ!?
しばらく祭りの悪寒。
というわけで、実装完了。
基本戦略は昨日書いたように、 getkeywod を使って、キーワード索引からリストをまず作成。 このリストはカテゴリ単位に取得できるので、必要なカテゴリのリストを cat でくっつけて、list2re で正規表現に変換。 とりあえず web elec anime hatena music の5カテゴリに絞った状態で 90KB 弱と、オリジナルの 330KB よりずっとましに。
本当は一般名詞は外して固有名詞だけを取り出せるとノイズが減ってさらにいいんだけどなぁ。
というわけで、いくつか罠。
結論としては、正規表現化するときのエスケープ対象に「|」が入っていなかったということでした。
そりゃ化けらーな。
3バイト以上であっても、運が悪いと引っかかるんだけど、まぁ困ったら考える方向で。
輪王さん経由、 outsider reflex。
2行目から読んでないけど、
すごくよくまとまってる。
Web技術というキーワードに引っかかる人は読む価値あり。
……5.3 節だけやたら浮いてるけど(笑)
個人的に、SemanticWeb の目指すものがそれほど近い未来には実現しないとおもっているけど、 その過程である Syntax や、語彙の共通化については RSS や FOAF をはじめとする RDF Application のように成果が出てきているわけで、 すぐにオントロジーによる推論とかがイメージできないからといって SemanticWeb を目指す活動全体をこきおろしたがる人が多いのは残念な所。 夢は大きく実装は地に足付けて。
BEEP (Blocks Extensible Exchange Protocol) ってのは初めて聞いたかも。 ていうか RFC にもなってるのね、これは不勉強だったな……。 HTTP の経験をもとに様々な利用形態を想定した汎用プロトコル、でいいのかな。
こんなところや こんなところにも名前が出てきてるし、 IETF的には汎用のリソース 転送にはこれを使っていくというコンセンサスなのかな。
カテゴリ別、無ければやってしまえということで早速。
w3m -dump_source 'http://d.hatena.ne.jp/furigana/%a4%a1-%a4%f3%a4%f3?cname=elec' | perl -ne 'if( s#<a href=\"/keyword/.+\">(.*)</a></li>#$1#) { print "|" if($count); print $1; $count++} ' > keyword.elec
これでカテゴリー:コンピュータなキーワードが keyword.elec として 取れる。
で、ここまでやったところで正規表現としてちゃんとエスケープしてあげないといけないことに気づく。 時間無いのでまたあとでリベンジ。 あと、カテゴリー:ウェブ なキーワードもあるので、 索引からキーワードリストを作る段階とリストから正規表現を作る段階に分けたほうがよさそう。
ラック導入以後、純粋に空間効率が落ちた結果として部屋が本で溢れかえってます。
さて……。
ToDo:
春休み中になんとかしないとなぁ……。