home «前の日記(2005-01-23) 最新 次の日記(2005-01-25)»

いろいろ
Seize the day.

2004|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|07|09|10|

2005-01-24 [長年日記]

[blog] カウンタから bot をはじく

tDiary のカウンタから bot をはじくには,@options['bot'] に追加すればよい.このオプションはもともと,リンク元を隠してキーワードの連鎖ヒットを防ぐという役割があるのだが,counter.rb はこいつ「も」見てカウントすべきか判断するとのこと. というわけで,いろいろ加えてみた.とりあえず生ログのあるディレクトリで
grep GET * | cut -d " " -f 12- | sort | uniq -c | sort -nr 
して (一部,うまくパースできず referer が混ざってしまうところがあったけど無視),適当に bot らしいもの,正規のアクセスでなさげなものを除外してみた.
@options['bot'] = ['^(Naverbot|Cowbot)-','^BlogLines/','^blogmap','^FAST-WebCrawler/','^Hatena Antenna/','MI[CK]AN/','^msnbot/','^NG/','^Openbot/','^samidare','^TAMATEBAKO/','^TomSoftAntenna','^1\.0$','Ask Jeeves/Teoma','^ConveraCrawler','Slurp','^Googlebot','^SharpReader','Comaneci_bot','^ia_archiver','^BlogRanking/RSS checker','^Mediapartners-Google','^Bulkfeeds','ZyBorg','^\-$','^Technoratibot','^Pockey-GetHTML','^psbot','^Infoseek SideWinder','^CaptainNAMAAN','^ParabolicMini','^Jigsaw','^Blogpeople','^BlogWatcher_Spider','^tDiary RSS recent plugin','^Wget','^ndl-japan-research-robot','^libwww-perl','^gazz','^Swooglebot','^CreativeCommons','^ping\.blogger\.jp/RSSdiscovery','^lwp-trivial','^W3C_Validator','MSIECrawler','^Microsoft URL Control']
いろんな UA があるんやなー.学術目的とかの bot もけっこうあって面白い.blog ランキングサイトの bot は一体どうやってかぎつけてくるんだか? リンクをたどってるのか.

[blog] 日本のアルファブロガーを探せ 2004

いや,もう締め切られちゃってるし,応募はしないんだけど,自分なりに考えてみた.
 (1)「会社のオフィスでは『3つだけ』しかブログを読んではいけない」と言われたら、どれを読みますか(一つだけでももちろんOKです)
 ・ブログ名1と(簡単な理由)  
 ・ブログ名2と(簡単な理由)
 ・ブログ名3と(簡単な理由)
ウェブでいわゆる日記に近いものを書いた最初がたぶん 1997 年.ただし 1 ヵ月に 1 回くらいの更新だったので,日記というよりはエッセイか.
ほぼ毎日更新する日記を書き始めたのが 2000 年.
以上は内輪ネタばかりの日記で,ごく限られた人にしか公開していなかった.
で,2004 年に思うところあって,いわゆる blog を書き始める.
2000 年にウェブ日記を始めたのは,数人の知人の影響が大きかった.2004 年の blog 開始は,もちろん知人 (2000 年の時とは別人) の影響もあるけれど,それよりも知人でない人の blog に触発されたことが大きい.そういう意味で,ここでは敢えて知人 blog を除外して,3 つ挙げてみるとすると….
  1. 梅田望夫 英語で読む IT トレンド: もう終わっちゃったけど.とりあえずけっこう影響受けた.
  2. Okumura's Wiki: wiki の形をとっているが blog だと思う.わりと自分の興味に近いトピックが多いので.大学人の blog としても面白い.
  3. たつをの ChangeLog: これも最近自分の中でヒット記事が多いので.
なんというか,多分いわゆる世間で言う「アルファブロガー」というのは,わりと社会的なネタを扱っているような感じで,今回でいうとそれにあたるのは 1 だけかも知れない.2,3 に私が期待しているのは社会を斬るとかではなくて,技術的情報なんだよなー.投票の中間報告で上位に上がっている切込隊長氏の blog とか百式とかネタフルとかは,よく耳にするけど何か読むと疲れちゃって(ぉ.典型的な非社会的技術ヲタだな私は(ぉ.いや,単に今余裕がないだけで,少し社会現象も追ってみたいと思っていますが.
ちなみに次席として「ただのにっき」「高木浩光@自宅の日記」「日本がダイスキな外人のBlog」をあげておこう.たださんのサイトは tDiary を使うようになって読み始めたが,なんと最近入院されているらしいので,早く復活してまた面白い記事を書いていただければと思っている.高木さんの日記はここでよく取り上げるわりに 3 位入賞しなかったのは,ひとえに自分の知識が不足しすぎて,高木さんの記事が理解できないことがあるからだ(激ぉ.というわけで精進します.「日本が…」は会社から読めなくていいから週に 1 回くらいは読みたい.
このマイランキングはどんどん変わっていくものだと思う.またしばらくしたら書いてみたい.

[space] デブリ対策

スペースデブリ対策の国際指針を作ることになったとのこと. たたき台によると,設計段階からごみを出さない工夫をするとか,衛星は軌道を制御して安全に落下させるとか,ありきたりな案ばかりで,もっと「デブリ屋に人海戦術でゴミを落下させる」とか「赤道上の軌道エレベータに幕を張って捕捉する」とかぶっ飛んだ案がでて欲しかった(ぉ.
ちなみに,ひろゆき氏もデブリ屋になろうと思っている模様.
157 :東葛 ◆s6tAuTPLb2 :05/01/11 03:35:08 ?# ID:???
失礼ですが、ひろゆき氏は遺書書いてますか? 
158 :ひろゆき ◆3SHRUNYAXA :05/01/11 03:37:14 ?## ID:m87A1zqG
デブリ屋になったら書こうと思ってます。 

[comp] mb_regex_encoding() エラー

覚え書き.PukiWiki で,mb_regex_encoding() が undefined だというエラーがでると思ったら,どうも PHP が 4.2.0 以降でないとだめだったらしい.4.1.2 を使ってたからだめだったのか.安易にバージョン上げて動かなくなったら支障がでる時期なので保留.
このエントリーをはてなブックマークに追加 はてなブックマーク数 はてなブックマークコメント   このエントリーを livedoor クリップに追加 livedoor クリップ数 このエントリーを del.ici.ous に追加 このエントリーを buzzurl に追加 buzzurl クリップ数

お名前:
E-mail:
コメント:
[TrackBack URL: http://nao.s164.xrea.com/td/tb.rb/20050124]
[(注) スパム対策のため,言及リンクのないトラックバックは受け付けていません.]

以下の広告はサーバによって自動的に挿入されています.


Copyright © 2004-2006, nao. All rights reserved.