Last-Modified: Mon Nov 27 06:02:25 2006
ちょっと注目中。
urlbot の欠点は、注視箇所を記録できないところなんだけど、
そこらへんをうまくやれないもんだろうか。
やっぱ、ContextMenu から urlbot の WebUI 叩いて突っ込むかなぁ。
この手のアプリ、airWeb あたりから色々あるけど、
おいら的利用ケースを考えると Windows 上のアプリケーションという形よりは、
もっと色々と結びつけられるようにストレージを RDB みたいな感じで色々な形で叩けたほうが嬉しいんだよなぁ。
本来、こういう目的には RSS じゃなくて Annotea が対象なんだろうなぁ。
あとでちゃんと読もう。何年も後回しになったけど……。
というか、Blogmapは Annotea 的には各サイトの言及内容を Annotation とするイメージ?
どうすれば「既知の情報」を探し出せるか経由で。
というか、Next todayが exblog なのですが、アンテナ捕捉しきれてませんでした……。
私は、urlbot つーのを回してます。
プログ
ラム的にやっていることは簡単で、
IRC の幾つかのチャンネルに常駐している bot がひたすら流れた URL を記録しているだけです。
で、もう何も考えず URL と HTML ならそのタイトル、あとは URL の前後に文章くっつけたらそれもコメントとしてデータベースに突っ込むだけ。
ここからさきは運用の問題で、自分が巡回して、日記(ここ)に後で書きたいと思うようなネタを含め、
自分が興味持ったネタを片っ端から IRC に張っています。
タイトルの取得とかは自動なので、自分でやることは Sleipnir でアドレスをコピーして LimeChat に張るだけ。
で、あとから一覧を見てにひひと笑う、と。
実は、この日記の右下にある 今日の urlbot はこのデータベースから過去 24 時間分を引っ張ってきたものです。 RSS とかも吐いているのですが、私以外の誰かが RSS Aggregator 経由で見てたりもするようです。 まぁ、影響をかなり受けている mu antenna もほとんど同じものなのですが、 urlbot の方がよりおれ様用という意識が強い気がします。
さて、ここまでは自動化したんですが、 ここから先にどうやって整理、そして再利用していくかがまだ全然未実装だったりします。 内部向けインターフェースでは軽めの検索とかも一応付いているのですが、 やはり半自動のカテゴライズ等が必要な気がしています。 カテゴリは、はてなキーワードの初期のカテゴリツリーのような感じで割り振っていけると面白いんじゃないかと妄想しています。 そうすると、あるツリー以下の archive みたいな感じで取れるのでいいかなぁ、と。
あともう一つ、urlbot にキャッシュ機能を付けて全文検索、というのはやるつもりです。 URL の永続性なんて考え方はとっくに姥捨て山に捨てられてしまっているので、 それにたいする自己防衛、というのもあります。 また、ローカルにとりあえず保存することで、後から色々な検索システムを導入できる、という目算もあります。
お薦めされているインターネットブーメランですが、
実は出た当時から注目はしていました。
語句検索ベースのエンジンを使ううえで最も重要なことは、ページを特徴づける単語群を人が記憶することだと思うのですが、
あまりに揺らぎが多かったりして限界は感じていました。
なにしろ ATOK のあの会社ですから、そこらへんにかなり期待をしているわけです。
ただ、使っているという人を聞いたことがなかったこともあって放置になっていたわけです。
なので、使っている人がお薦めということであれば、ちょっと試してみようかな、という気分になっています。
貧乏学生に 8000円というのがちょっと辛いところですが……。
ちなみに、Mind を出した会社が MindSearch II なんてのも出してるんですよね……。
ノーサポートかつ再配布要相談の SDK で十分で、これは無償で利用できるのでこちらをまず試してみようかなぁ。
freshportsから。
2.0.49 か 2.0;48 への公式パッチが出たらあちこちお祭り。
あるいは、遅れるようなら 手パッチ。
昨日ふと考えていたことと似たような発言を見つけたので dump 。
そもそも、ネチケットの基本は、「相手が嫌がることをしない」である。
で、既存の社会において相手が嫌がることがどういうことかは小さい頃から経験から学んでいる。
インターネットという少し違ったツールを使ったときに、
どういうことをすると相手が嫌がるのか、ということは経験がないので、
使い始めたばかりでその特性をあまり分かっていない「初心者」には経験的には判断しがたい。
そこで、それをリストアップしたものを俗にネチケットと読んだりする。
RFC1855 ネチケットガイドラインなんてのが一例だが、要は相手が嫌がるような事の事例紹介である。
インターネットというツールを利用したときに相手が困る状況を判断する材料として、
そこに書かれた複数の事例が参考になるわけだ。
当然ながら、事例は事例に過ぎず、実際に何が相手を困らせるかは状況に依ることは言うまでもない。
さて、ここで典型的なネチケット信者の一例を考えると、 状況によらず、ただ過去の事例に従うことを他人に強制させる。 その事例が状況に沿うかどうかはさておき、重要なのは強制することで相手が嫌がることである。 よって、ネチケットガイドラインを相手に押しつける信者自身こそネチケットの基本に反していることになる。
こんなことは、書くまでもないようなことだけど、 NIFTY-Server の時代からループを続けているようなので、同じくループだと分かっていながら書いてみるテスト。
如星先生のネタ集を読んでちょっと思うところがあったのですが、 この日記ではてなキーワード リンクを仕掛けているのは、あくまでネタの一貫です。
……と言い切ってしまうと身も蓋もないのでもう少し書きます。
まず、美意識という観点から キーワード誤爆(意図しないキーワードへのリンク)に対する「嫌さ」の認識は自分でもかなり持っています。 リンク化するカテゴリを絞っているので相当ましになっていますが、 それでも nekoruri が URI を含んでいたりとかいう誤爆がかなり残っているのが現状です。 というわけで、まず一つめの問題は誤爆の多さという美的問題があります。
第二に、キーワードページの内容に対する不安。
某ウ社やらはてなダイアリー評議会議題2号を例にあげるまでもなく、
キーワードページに書かれた内容によって、
そこにリンクを張って(しまって)いる自分の文章の解釈に影響を与えてしまうという問題があります。
自分の言霊に誇りを持っている人にとって、余分な情報を勝手に加えてしまうキーワードシステムなんて不満の塊にしかなりえないでしょうな。
と、まぁ、キーワードシステムに対する不安・不満なんてごろごろしているわけですが、 なんでこの日記でそれを取り入れたかといえば、 キーワードシステムに対する小さな可能性を信じてみようと思ったからです。
キーワードシステムは、日記からキーワードへの片方向だけでなく、 少なくともはてな内においてはキーワードから日記へもリンクされます。 というより、こっちがおそらくはてなの本当の狙いなんでしょうが、 文中のキーワードによる「あまりにゆるやかな繋がり」を見つけ出す、というのは一つの可能性だと信じています。 現に、複数のキーワードを「含む日記」をアンテナのように使って、 それに興味を持つ人を探したりもしています。 その上で、どんなキーワードがあるのか探して回るほどのモチベーションは無いので、 自分の日記で書いたキーワードリンクをたまにたどるわけです。
とはいえ、はてなの外にあるこの日記は「含む日記」にはちゃんと捕捉されないのですが、そこは妥協点ということで。
さらにいうと、もう一つの理由は、単純にあるもので遊んでみよう、という純粋な理由も。
毎週月曜に pdumpfs が cron から呼ばれるんですが、今週も失敗。 ちなみに先週はマシンごと落ちていて、その前の週にスクリプト書いた。
今回は、PATH 再設定を忘れていて、そもそも pdumpfs が /usr/local/sbin にあるとか、 メールを送る段階で ~/bin とかにある小物スクリプトを呼ぼうとしていたとかそんな感じ。 結局、フルパスに直して手で実行。
あと、ログが 10MB 以上もあるので bzip2 するようにしてみた。 さて来週動くといいなぁ。
10分を大幅に超えていたので再調整。
適当に追加しててまともに取れていないサイトとかを直したりして、6分まで復帰。
というか、鞠絵ちゃんが落ちてるとほとんど自力で取りに行っちゃってよろしくないので、 ここら辺を調整しないと。
ちょっと遊んでみようかと思って、 aki.nekoruri.jp 以下で一ヶ月の永続 cookie を発行するようにして見ました。 目的は特に無く、なんとなく Apache の mod_usertrack で遊んでみようというだけなんですが、 そういうのが嫌いな人は cookie 禁止リストにぶち込んじゃってください。 cookie の可否で見え方とかが変わることは (現状) 無いです。
携帯のメールアドレスですが、spam が物凄いので変えました。 @ の左側の2つの c を k に変えてください。
というか、転送 アドレスはそのまま使えるので、 そっちに普段送っている人は何も気にしないでいいです。
InternetWatchの記事から。
ていうかかなり面白い。陳述内容の(5)(6)あたりなんてもうぼろくそにこき下ろしてる。
今回は公取委側が行きすぎだと思っているけど、さぁどうなる。
なんていうか、終電間近の東海道線を見ていると、
日ごろ最近の若(ry
と言っていそうな世代がいかに酷いかを感じるここ数年です。
酔っぱらったりして横になってるのは責任能力無いですし、苦笑しつつ許せます。 自分もやってしまうかもしれないし(もちろん、そんな状態にならないように心がけたいところ)。 でも、普通に新聞読みつつ靴脱いでボックスの対向に投げ出すのはわたし的には常識外です。 小さな子供は椅子に上って外を見たがったりしますが、それと大差無いですもの。 それこそ、床に座る方がなんぼかましです。
きっと彼らはそれが嫌がられる事だとは気付いていないでしょうから、営団のマナーポスターとかに誰か書いてほしいなぁ。 でも営団にはボックス車両無いし。
きりないので注意なんてしません。一車両あたり数人居るし。
でも、前々から機会があれば書きたかった事なので。
aki 的には写真を張っていなかったんだけど、 やっぱり寂しいので某免許証をデジカメでぱちりして載せてみる。
……さ、詐欺だ。
やっぱり、多言語を使えるようにしてほしいなぁ、 言語障壁を取り除きたいというポリシーがあるのかもしれないけど、 日本人が使うにはやっぱり不便は不便。