Windows付属のNotepadのバグが書いてあった。
"Bush hid the facts".; Now save it and open it again.
4文字 + 3文字 + 3 文字 + 5文字 タイプしてファイルに保存して、再読み込みすると文字化けを起こすらしい。
そんな餌に俺様が……クマーーー!!!となった。どうやら、ファイルopenするときに文字コードを自動判定するのだけどそれに絡むバグのようだが…。
え 2006/07/06 21:17 そんな餌には釣られ…クマー
28園 2006/07/06 21:35 クマーーーーーー
じゃんぬねっと 2006/07/06 21:42 確かに文字化けしますね。
うさぴょんの育ての親 2006/07/06 23:05 うーん、文字化けのタネをつかんで、化ける面白い文字列探しをしてみたいなぁ(^^;notepadを逆アセンブル(w?
優 2006/07/07 00:55 文字化けとは関係ないですが、Win95の時点で既に先頭行に.LOGと書いておくと時刻が追記される機能とかありましたねぇ・・・
nik 2006/07/07 05:16 メモ帳のソースは2000ソース流出時の中のソースにありましたね。誰かパッチ作って><
pochi 2006/07/07 17:02 クマーーーッ
774- 2006/07/07 18:31 ねぇねぇ、ぎれって書くとピカチューってIMEが変換するのは既出?IME2002の「顔文字・話し言葉辞典」
yaneurao 2006/07/07 18:49 ↑http://www.sun-inet.or.jp/~yaneurao/nlog/log200306_11.html
Br 2006/07/07 19:34 MEではならずに2000とXPでなりましたよ。
yaneurao 2006/07/08 02:11 /.にタレコミしてくれはった人がいて、/.のほうの議論で以下のようなコメントを見つけたのでぺたぺた。----notepad.exeをVisualStudio付属のDependancyWalkerで調べると、IsTextUnicodeなんてAPIをリンクしています。で、MSDNを調べると、こんな注意書きがあったり。>IS_TEXT_UNICODE_STATISTICS をセットした場合と>IS_TEXT_UNICODE_REVERSE_STATISTICS をセット>した場合は、統計的分析が行われます。>この2つのテストは絶対的確実性を持っていません。>統計的なテストでは、文字列の上位バイトと下位バイ>トの間である程度の変動を想定しているため、ASCII>文字列が ASCII 文字列として認識されないことがあ>ります。----やねうらお補足) 上記のAPIでファイル読み込み時に言語を自動判別するのだけど、そのときに誤って判別することが原因みたいです。これってnotepadのバグと言えるのかな…。仕様と言えるような気が。notepadには以下のように起動オプションがあるようです。(同じく/.でのコメントから引用)----ちょっとnotepad.exeを見てみたら、案の定起動オプションがありました。/A : ANSI(とゆーか、日本語版ではShift-JIS)として読み込み文字化けするファイル hoge.txt をANSIとして読むばやい、notepad /A hoge.txtとすればおっけーです。(同じく /W もあるみたい) ----
うさぴょんの育ての親 2006/07/08 13:05 あぁ、APIで判定なのか…。何かnotepadの中に仕掛けがあるなら、逆アセする意味があるのだけど。じゃ、APIが誤判定するかどうかチェックするプログラム書いて面白い文字列でも探すか(w。
127 2006/07/11 00:50 偶数字で始まり他が全て奇数字かつ、改行無しかつ、3字以上が3以上あれば化けるみたいですね。
http://www.sun-inet.or.jp/~yaneurao/nlog/log200306_11.html
----
notepad.exeをVisualStudio付属のDependancyWalkerで調べると、
IsTextUnicode
なんてAPIをリンクしています。
で、MSDNを調べると、こんな注意書きがあったり。
>IS_TEXT_UNICODE_STATISTICS をセットした場合と
>IS_TEXT_UNICODE_REVERSE_STATISTICS をセット
>した場合は、統計的分析が行われます。
>この2つのテストは絶対的確実性を持っていません。
>統計的なテストでは、文字列の上位バイトと下位バイ
>トの間である程度の変動を想定しているため、ASCII
>文字列が ASCII 文字列として認識されないことがあ
>ります。
----
やねうらお補足)
上記のAPIでファイル読み込み時に言語を自動判別するのだけど、そのときに誤って判別することが原因みたいです。これってnotepadのバグと言えるのかな…。仕様と言えるような気が。
notepadには以下のように起動オプションがあるようです。(同じく/.でのコメントから引用)
----
ちょっとnotepad.exeを見てみたら、案の定起動オプションがありました。
/A : ANSI(とゆーか、日本語版ではShift-JIS)として読み込み
文字化けするファイル hoge.txt をANSIとして読むばやい、
notepad /A hoge.txt
とすればおっけーです。
(同じく /W もあるみたい)
----