Last-Modified: Mon Nov 27 06:02:05 2006

http:// aki.nekoruri.jp / diary / 200402b

Silphium Diary [2004 Feb]

いんふぉめーしょん

2004/02/20

1: IRCnet

猛烈にDoSられてます。
繋ぎはぐれた人は、IRCnet の WIDE Project 以外の接続点に繋ぐと良いかもです。

  • irc.fujisawa.wide.ad.jp
  • irc.huie.hokudai.ac.jp
  • irc.media.kyoto-u.ac.jp

ちなみに、irc.nara は WIDE 内の経路が消されてるので当面繋がらないかも。

関連: ともちゃとか国内サーバリストとか IRCへの最大接続数とか。



2004/02/19

2: 週末のあれ

ごめんなさい、さすがに見なかったことにさせてください。
私は静かにカプチーノが飲みたいだけなんです……。


1: はてなキーワード自動リンクAPIのリンク集

まぁ、実は私はAPIは使わなくなったんですが(笑)

一通り読んで見て、 正規表現の最適化とか興味深い。



2004/02/18

1: Re: 人工無脳天国

Hiki::人工無脳にまとめてみました。
動いているチャンネルは非公開です。

でもって、なっちゃん@Marganine に内輪の生活チャンネルの一年弱分の会話ログを食わせています……が、進捗を見ると一週間位かかりそう。 SELECT SUM(hoge) な処理があったりして mysql がボトルネックになってます。

あと、Ghotiを試して見たいんだけど、 MeCabRuby Binding がうまくリンクしてくれなくて止まってます。

あと、nekoruri@ししゃもが数十分くらいでIRCから落ちてしまうのはなんでだろう。



2004/02/17

1: 人工無脳天国

Margarineなまこししゃもロイディを飼って見た。 チャンネル別制御の出来るなまこを生活チャンネルを学習ON、 無能チャンネルでは学習OFFでおいて発言輸入用。

とりあえず初日のキーワードは黒ラピス



2004/02/16

1: 海外生産の邦楽CD、国内への還流禁止 著作権法改正へ

結局、5年の時限付きで導入される模様。
……あれ、日経の記事には差し止め期間が書いてあるけど、 朝日の記事には載ってないや。

もちろん国益っちゅーもんがあるんで、ある程度国内の業界を保護することは重要だと思うけど、 個人的な感覚としては保護しすぎに思える。
境真良さんの輸入権問題に関するいくつかの後悔というのが参考になる。 リンク集としては、津田さん2004/02/05あたりかな。



2004/02/15

2: Silphium@jugem

JUGEMサービスインしているのでさっそくアカウント確保。

ちょこちょこ向こうに書いたけど、まとめるとこんな感じ。

  • 本文中からのリンクからAutoDiscovery を掛けるボタンがあるのが好印象。 AutoDiscovery を無かったことにしている連中よりずっといけてる。
  • そのかわり、送ったトラックバックの管理が無い。ここはいけてない。
  • テンプレートHTML/CSS 共に完全編集可能。ただしサンプルは6種類。
  • 入力時に日付時刻を入力可能。 過去の日付であることが重要な日記等に向いている。
  • アクセス解析が未実装ながらメニューに存在。
  • あと、試してないけど複数ユーザを作れるぽい。

1: JPNIC: システムメンテナンスに伴うサービスの一時停止のお知らせ

ヽ(;´Д`)ノナンダヨー



2004/02/14

7: 一語100%

乗り遅れた……_| ̄|○

泣きながら報告フォームに載ってるの全部読んだので心に残ったのをりすとあーっぷ!

|-`).oO(密かにラーズのが一番ラブコメの基本に忠実だと思えるのは贔屓目なんだろうか……。)

おいらは、流行廃りのループというか、まず王道ありきなんだと思います。 そこから異分子が〜というのには同意。


6: BS-hi 「受信できません」

衛星とんどる!?

……って書いたら復旧したぽ(w
NHK中の人も大変だな……。


5: ITmedia PCUPdate:孤独なバレンタイン克服に向けて〜ある女IT戦士の作戦

朝には既にリストに追加してあったんだけど(笑)

がんばれIT戦士がんばれ!

IT戦士 岡田有花リンク集を見つけたのでちぇき。


4: DSL普及状況公開ページ 1月末現在

順調に増加中。

ちょっと関係ないけど、書かないと忘れるのでメモ。
知られざる通信戦争の真実―NTT、ソフトバンクの暗闘 は書名は胡散臭いけど中身は良い感じらしい。


3: はてなダイアリー日記: キーワードを含むページ

はてなアンテナは、本文の差分で更新検知しているのは有名ですが、 さらにそれをはてなキーワードにも利用するようになってます。 やるなぁ、はてな

あとはキーワードの固有名詞限定があれば……(まだ言い続けてみる)。


2: Re: orkut

ログインできなかったのは、朝には復旧してました。

というわけで、物好きそうな人を何人か誘ってみてます。 面白そうだと思った人は登録してみてくださいな。

ちなみに、orkut ってのは一説には人間関係抽象化および数値化システムと呼ばれるぐぐる様がやっているソーシャルネットワーク サービスです。 要は、電子上のお友達リスト

たださんの、 欲望渦巻く関心空間 という表現はうまいなと思った。


1: バレンタイン特別企画 - ちょコちょコ、はにゅ〜ん!

ぼむちゅ片霧嬢サイトリニューアルと同時に何かやってるので晒し上げ。



2004/02/13

4: 2003年2月13日(日本時間) Windows のソースコードの一部が流出した

これも輪王さん経由。あと、1M hitsおめでとうございます〜。

まーじーでーっ!?

しばらく祭りの悪寒


3: Re: はてなダイアリーキーワード自動リンクAPI

というわけで、実装完了。

基本戦略は昨日書いたように、 getkeywod を使って、キーワード索引からリストをまず作成。 このリストはカテゴリ単位に取得できるので、必要なカテゴリのリストを cat でくっつけて、list2re で正規表現に変換。 とりあえず web elec anime hatena music の5カテゴリに絞った状態で 90KB 弱と、オリジナルの 330KB よりずっとましに。

本当は一般名詞は外して固有名詞だけを取り出せるとノイズが減ってさらにいいんだけどなぁ。

というわけで、いくつか罠。

  • EUCの場合、正しくパターンマッチさせるためには前後数文字を確認しないといけないんだけど、 パターンをこれ以上長くしたくないので手抜き中。
  • というわけで、文字化けしていることからおそらくこれだろうと気付き、特に酷い2文字以下のキーワードは変換しないようにした。
  • 依然化ける。
  • 具体的には「機会」で化けていて、 バイナリ的には中央の 0xa1 0xb2 がキーワード変換されている。 文字数制限できてないじゃん! でもこの文字って「_」……?
  • キーワードリストを「_」で検索……。
  • _| ̄|○ (←何故かエスケープできてない)

結論としては、正規表現化するときのエスケープ対象に「|」が入っていなかったということでした。
そりゃ化けらーな。
3バイト以上であっても、運が悪いと引っかかるんだけど、まぁ困ったら考える方向で。


2: orkut

昨晩、いしばしさんに誘ってもらっていろいろコミュニティまわったりしてたんだけど、 なんか障害でもおきたのか回りみんなログインできなくなってる模様。


1: Webに現われつつある新たな潮流とそれらを利用した可能性について

輪王さん経由、 outsider reflex

2行目から読んでないけど、
すごくよくまとまってる。
Web技術というキーワードに引っかかる人は読む価値あり。
……5.3 節だけやたら浮いてるけど(笑)

個人的に、SemanticWeb の目指すものがそれほど近い未来には実現しないとおもっているけど、 その過程である Syntax や、語彙の共通化については RSSFOAF をはじめとする RDF Application のように成果が出てきているわけで、 すぐにオントロジーによる推論とかがイメージできないからといって SemanticWeb を目指す活動全体をこきおろしたがる人が多いのは残念な所。 夢は大きく実装は地に足付けて。

BEEP (Blocks Extensible Exchange Protocol) ってのは初めて聞いたかも。 ていうか RFC にもなってるのね、これは不勉強だったな……。 HTTP の経験をもとに様々な利用形態を想定した汎用プロトコル、でいいのかな。

こんなところこんなところにも名前が出てきてるし、 IETF的には汎用のリソース 転送にはこれを使っていくというコンセンサスなのかな。



2004/02/12

2: Re: はてなダイアリーキーワード自動リンクAPI

カテゴリ別、無ければやってしまえということで早速。

w3m -dump_source 'http://d.hatena.ne.jp/furigana/%a4%a1-%a4%f3%a4%f3?cname=elec' | perl -ne 'if( s#<a href=\"/keyword/.+\">(.*)</a></li>#$1#) { print "|" if($count); print $1; $count++} ' > keyword.elec

これでカテゴリー:コンピュータなキーワードが keyword.elec として 取れる。

で、ここまでやったところで正規表現としてちゃんとエスケープしてあげないといけないことに気づく。 時間無いのでまたあとでリベンジ。 あと、カテゴリー:ウェブ なキーワードもあるので、 索引からキーワードリストを作る段階とリストから正規表現を作る段階に分けたほうがよさそう。


1: おへや

ラック導入以後、純粋に空間効率が落ちた結果として部屋が本で溢れかえってます。
さて……。

ToDo:

  • 図面引き
  • 資源確保
  • 机側の下半分に、A4 系が高さ2段、奥行き2列入るスライド式の本棚を構築
  • 天井解体
  • タンス移動
  • PC側を再構築
  • 単行本用のスライド本棚を2-3列
  • 天井再構築

春休み中になんとかしないとなぁ……。