If you're having trouble accessing Google Search, please click here, or send feedback.
はてなダイアリーのデザインの見直しを行った次に手をつけたのは、スパム対策でした。 ブログを用いたスパムは昨年ころからどんどん増加していて、今年の2月時点で、はてなダイアリーに毎日投稿される全5万件のコメントのうち、実に90%以上がスパムコメント、という状況でした。また、トラックバックスパムや、スパムブログも毎日大量に投稿されています。 はてなダイアリーでは、サービス開始当初からアダルトコンテンツの掲載や無許可の商業行為を禁止しています。しかし、常に新手のスパムが出現し、こちらの監視を掻い潜ろうとしています。これらのスパムとは本当に長い闘いを続けています。 まず、スパムコメントですが、これは特定の条件に適合したコメントをスパムとして自動判定して書き込めない措置を取ったり、ゲストがコメントを書くときには画像認証を行うようにしました。(この画像認証については、機械的に識別が可能だという話が先日上
_ [日記/blog] Referer spam 臭が強い検索サイト tDiary のリンク元を見ていると、ここ最近見慣れない検索サイト?からのアクセスが急増していることに気がついた。 ざっと眺めていると、ある程度共通点がある。 このサイトへのリンクは、ページのメインコンテンツからではなく、「関連エントリー」「ピックアップ・エントリー」等としてページ最後などに小さな枠として表示されているアフィリエイトがページの大半を占めているものが多い関連エントリーのリンク先が tDiary サイトであることが多い どうも、検索サイトを装って Anti Referer Spam プラグイン対策を行ったうえで tDiary を狙った spam サイトではないかという疑いがある。 (Anti Referer Spam プラグインの作者の日記でもちょうど spam 対策漏れについて取り上げられていた) アクセス
ある程度予測していたが、先日開始した海外スパムサイトが orz 曲線を描き、見事に失速した。 こんなきれいなグラフはなかなかお目にかかれない。 興味深いのは、2007年7月13日 午後12時16分 をもって、Google 検索結果からのリーチと Googlebot(クローラー) からのアクセスが同時にほぼゼロになった、という点だ。 ちなみに Googlebot からのアクセス(*1)はこんな具合だ。 7/11 950 hit 7/12 676 hit 7/13 495 hit * 7/14 5 hit 7/15 2 hit さらに 7/14 以降も細々と続いている Googlebot からのアクセスはナビゲーションページばかりであり、AdSense が貼ってあるランディングページは全くクロールされなくなった。 これらのことから、Google が「AdSense が貼ってあるランディングペー
ワードサラダのつくり方は簡単 このようなスパム行為に使う文章は、非常に滑稽(こっけい)なものだ。試しに似たような文章をつくってみた。「最近の韓流スターにご当地カレーを爆発し、旅先の参議院選挙をかくまった。そのまま逃走する」「安心とできちゃった結婚をお届けする。次世代ゲーム機もそろそろ向こう見ずなセレブだし」といった具合だ。 実はこのようなめちゃくちゃ文章は、コンピュータのプログラムで自動生成できる。また安易な方法としては、既存の文章を元に、特定の単語を入れ替えて再使用する方法もある。例えば文章内に現れる固有名詞を「旬のキーワード」で置き換える方法が一般的だ。その「旬のキーワード」でさえも、ネット上から自動的に拾ってくればよい。適度に「旬のキーワード」が混ざった文章であれば、検索エンジンで比較的上位にランクされる。 「言葉のサラダ」に加え「文章のサラダ」も登場 最近は、「言葉のサラダ
スマートフォン向け位置情報データサービス。独自開発SDKによりスマートフォンの位置情報データを保有。広告・プッシュ通知・分析などの様々なソリューションを提供。
元来国際通信に長けている某大手電気通信事業者が運営している、某個人向け ISP に加入しています。 昨年個人情報流出事件があり、それ以来、何故か SPAM 等の迷惑メールが大量に増えました。 ※ ISP 発表によると調査した結果メールアドレスは流出していないので、因果関係は不明。 迷惑メールなんて、会社のメールを含めれば一日 1,000 通以上は受信しているので、個人的には割とどうでもいいんですが、その某 ISP が迷惑メール対策をしてくれているのかどうか、一日に 3 〜 5 通程度、本文の無いメール、厳密に言うと、ヘッダが終わって直後に本文とのデリミタ行 (空行) が無く、ドットのみの行が来るメールが届いてます。 自力で SMTP を喋って中身を見てみると、 Return-Path: <itukamiwo@example.co.jp> Received: from example.com
0001デフォルトの名無しさん2006/11/13(月) 18:19:03 相談できる相手がいないのでここで知識を得たいと思いスレ立てしました。 Perlでのより良いプログラミングの話以外に、spamフィルタ技術の話全般で 切磋琢磨したいです(切磋琢磨という表現はおこがましいとは思いますが。。) 一応動くものは作ったので上げたいと思うのですが perlは初めて1ヶ月ほどな上、人に見せるつもりで書いたプログラムではないので かなり読みにくいと思います。 (作っているものはbsfilterやPOPFileのようなベイズを基本にしたクライアント側のフィルタです) 0002デフォルトの名無しさん2006/11/13(月) 18:26:32 動くものが欲しければ既存のもの使えば良いじゃない 技術的な話なら書籍なり論文集なり漁れば良いじゃない あとなぜに Perl? 0003デフォルトの名無しさん20
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く