いろいろ
Seize the day.
2005-01-24 [長年日記]
■ [blog] カウンタから bot をはじく
tDiary のカウンタから bot をはじくには,@options['bot'] に追加すればよい.このオプションはもともと,リンク元を隠してキーワードの連鎖ヒットを防ぐという役割があるのだが,counter.rb はこいつ「も」見てカウントすべきか判断するとのこと. というわけで,いろいろ加えてみた.とりあえず生ログのあるディレクトリでgrep GET * | cut -d " " -f 12- | sort | uniq -c | sort -nrして (一部,うまくパースできず referer が混ざってしまうところがあったけど無視),適当に bot らしいもの,正規のアクセスでなさげなものを除外してみた.
@options['bot'] = ['^(Naverbot|Cowbot)-','^BlogLines/','^blogmap','^FAST-WebCrawler/','^Hatena Antenna/','MI[CK]AN/','^msnbot/','^NG/','^Openbot/','^samidare','^TAMATEBAKO/','^TomSoftAntenna','^1\.0$','Ask Jeeves/Teoma','^ConveraCrawler','Slurp','^Googlebot','^SharpReader','Comaneci_bot','^ia_archiver','^BlogRanking/RSS checker','^Mediapartners-Google','^Bulkfeeds','ZyBorg','^\-$','^Technoratibot','^Pockey-GetHTML','^psbot','^Infoseek SideWinder','^CaptainNAMAAN','^ParabolicMini','^Jigsaw','^Blogpeople','^BlogWatcher_Spider','^tDiary RSS recent plugin','^Wget','^ndl-japan-research-robot','^libwww-perl','^gazz','^Swooglebot','^CreativeCommons','^ping\.blogger\.jp/RSSdiscovery','^lwp-trivial','^W3C_Validator','MSIECrawler','^Microsoft URL Control']いろんな UA があるんやなー.学術目的とかの bot もけっこうあって面白い.blog ランキングサイトの bot は一体どうやってかぎつけてくるんだか? リンクをたどってるのか.
■ [blog] 日本のアルファブロガーを探せ 2004
いや,もう締め切られちゃってるし,応募はしないんだけど,自分なりに考えてみた.(1)「会社のオフィスでは『3つだけ』しかブログを読んではいけない」と言われたら、どれを読みますか(一つだけでももちろんOKです)ウェブでいわゆる日記に近いものを書いた最初がたぶん 1997 年.ただし 1 ヵ月に 1 回くらいの更新だったので,日記というよりはエッセイか.
・ブログ名1と(簡単な理由)
・ブログ名2と(簡単な理由)
・ブログ名3と(簡単な理由)
ほぼ毎日更新する日記を書き始めたのが 2000 年.
以上は内輪ネタばかりの日記で,ごく限られた人にしか公開していなかった.
で,2004 年に思うところあって,いわゆる blog を書き始める.
2000 年にウェブ日記を始めたのは,数人の知人の影響が大きかった.2004 年の blog 開始は,もちろん知人 (2000 年の時とは別人) の影響もあるけれど,それよりも知人でない人の blog に触発されたことが大きい.そういう意味で,ここでは敢えて知人 blog を除外して,3 つ挙げてみるとすると….
- 梅田望夫 英語で読む IT トレンド: もう終わっちゃったけど.とりあえずけっこう影響受けた.
- Okumura's Wiki: wiki の形をとっているが blog だと思う.わりと自分の興味に近いトピックが多いので.大学人の blog としても面白い.
- たつをの ChangeLog: これも最近自分の中でヒット記事が多いので.
ちなみに次席として「ただのにっき」「高木浩光@自宅の日記」「日本がダイスキな外人のBlog」をあげておこう.たださんのサイトは tDiary を使うようになって読み始めたが,なんと最近入院されているらしいので,早く復活してまた面白い記事を書いていただければと思っている.高木さんの日記はここでよく取り上げるわりに 3 位入賞しなかったのは,ひとえに自分の知識が不足しすぎて,高木さんの記事が理解できないことがあるからだ(激ぉ.というわけで精進します.「日本が…」は会社から読めなくていいから週に 1 回くらいは読みたい.
このマイランキングはどんどん変わっていくものだと思う.またしばらくしたら書いてみたい.
■ [space] デブリ対策
スペースデブリ対策の国際指針を作ることになったとのこと. たたき台によると,設計段階からごみを出さない工夫をするとか,衛星は軌道を制御して安全に落下させるとか,ありきたりな案ばかりで,もっと「デブリ屋に人海戦術でゴミを落下させる」とか「赤道上の軌道エレベータに幕を張って捕捉する」とかぶっ飛んだ案がでて欲しかった(ぉ.ちなみに,ひろゆき氏もデブリ屋になろうと思っている模様.
157 :東葛 ◆s6tAuTPLb2 :05/01/11 03:35:08 ?# ID:??? 失礼ですが、ひろゆき氏は遺書書いてますか? 158 :ひろゆき ◆3SHRUNYAXA :05/01/11 03:37:14 ?## ID:m87A1zqG デブリ屋になったら書こうと思ってます。
[ ツッコミ | permalink | trackback ]
[TrackBack URL: http://nao.s164.xrea.com/td/tb.rb/20050124]
[(注) スパム対策のため,言及リンクのないトラックバックは受け付けていません.]
[(注) スパム対策のため,言及リンクのないトラックバックは受け付けていません.]
本日のリンク元
検索
- mb_regex_encoding エラー ×6 / mb_regex_encoding エラ ×2 / アクセス 除外 bot ×2 / mb_regex_encoding undefined ×2 / php mb_regex_encoding エラー ×2 / mb_regex_encoding() エラー ×2 / pockey-gethtml はじく ×1 / tex カウンタ 全角 ×1 / カウンターからBOTを ×1 / botをはじく ×1 / はじく ボット ×1 / W3C_Validator ×1 / キーワード不明 ×1 / robot はじく ×1 / 検索ボットをはじく ×1 / MSIECrawler 対策 ×1 / pukiwiki #comment BOT ×1 / アクセスカウンター BOT ×1 / 大学人のブログ ×1 / 2004 アルファブロガー ×1 / lwp trivial ×1 / Bot カウンター ×1 / カウンター ボット 除外 ×1 / perl botを弾く ×1 / Pockey-Get ×1 / @options['bot'] ×1 / bot カウンタ 除外 ×1 / Access エラーいろいろ ×1 / lwp-trivial (bot|ロボット) ×1 / Googlebot はじく ×1 / カウンタ bot ×1
以下の広告はサーバによって自動的に挿入されています.
Copyright © 2004-2006, nao. All rights reserved.





