[B! encoding] kuyのブックマーク

Base64エンコーディングの考え方メモ - 今日もスミマセン。

考え方元のバイト列を6ビットづつに区切るこのとき6ビットに満たない部分には0を足す 6ビットを4個ひと組として変換表に従って文字列に変換このとき4個に満たない部分に"="（イコール）を足す変換表引用元：Base64 - Wikipedia (Creative Commons ― Attribution-ShareAlike 3.0 Unported ― CC BY-SA 3.0)

kuy 2011/06/22

リンク

Universal Encoding Detector: character encoding auto-detection in Python

Character encoding auto-detection in Python. As smart as your browser. Open source. >>> import urllib >>> urlread = lambda url: urllib.urlopen(url).read() >>> import chardet >>> chardet.detect(urlread("http://google.cn/")) {'encoding': 'GB2312', 'confidence': 0.99} >>> chardet.detect(urlread("http://yahoo.co.jp/")) {'encoding': 'EUC-JP', 'confidence': 0.99} >>> chardet.detect(urlread("http://amazo

kuy 2010/10/05

リンク

文字コードの記事のために作成した図をGoogle Docsで公開してみました - 今日もスミマセン。

本当は内容を修正してから公開したかったんだけど、修正できるのがいつになるかわからないので、とりあえず現状のままを　Google Docs 上で公開します。たぶん、Googleのアカウントあればコピーして自由に再利用とか出来るんじゃないかと思います。改変／コピーなど自由にどうぞ。文字集合と文字コード JIS X 0208 での符号位置 Unicodeでの符号位置 ISO-2022-JPの求め方 EUC-JPの求め方 UTF-16の求め方 UTF-8の求め方 Shift_JISの求め方

kuy 2010/07/27

encoding

リンク

MBCS 文字列の折り返し - その 1 - 彷徨えるフジワラ

Mercurial の 1.4 版から、端末表示幅にあわせてヘルプテキストが折り返されるようになったのだけど、案の定というか、言語設定を日本語にしてある(LANGUAGE=ja 等)場合、折り返された行末で表示が乱れるケースがちらほらと。ぱっと見、複数バイトで構成される文字の途中で改行されているんだろうなぁ、と原因の目星は付いていたのだけど、何やかにやでついつい後回しになっていたパッチ作成作業に、ようやく着手することに。ソースを追いかけていくと結局のところ、Python 標準の行折り返しライブラリである textwrap モジュールが、明らかに１文字＝１バイトな文字コードしか念頭に置いていないことが原因っぽいことが判明。そんな textwrap を Mercurial で使ってしまっていること自体は、まぁ良しとしましょう。でも、21 世紀ももうすぐ 10 年が経とうとしているこのご時

kuy 2010/05/15

TortoiseHg的にも嬉しい。

リンク

はてなブログ | 無料ブログを作成しよう

ベルリンのかっこいい建物ドイツ旅行9日目＆10日目。ベルリンに2泊する。ベルリンは1度家族旅行で来たことがあり、今回はエスカレーターをめあてにしていただけで、他に予定は決めていなかったのだが、今回のドイツ旅行で一番印象に残った街で、「また訪れたい」と思った街でもあった。ナチス…

kuy 2010/04/20

リンク

Pythonにおけるエンコーディングの扱いとエンコーディングの変換について - 試験運用中なLinux備忘録・旧記事

(2010/11/1)本記事の内容はバージョン2系のPythonについて書かれている。バージョン3系ではエンコーディングの扱いが変わっており、「バージョン3系のPythonにおける文字列とそのエンコーディングに関する覚え書き(文字列型とバイト列型)」で扱っている。 (2014/11/20)リファレンスのリンク先を修正した。エンコーディングとエンコード/デコード操作エンコーディングの変換 encode()やdecode()が失敗する場合についてエンコーディングとエンコード/デコード操作Pythonにおいて、UTF-8やCP932(WindowsのShift_JIS)などのそれぞれのエンコーディングの文字列はUnicodeの文字列と相互に変換することができる。各エンコーディングにエンコードされている文字列オブジェクトのメンバ関数decode()の引数にそのエンコーディング名を指定すると

kuy 2010/04/01

リンク

エンコードマニアックス - 各種エンコードやハッシュを一発作成

JavaScript encodeURIComponent() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuricomponent" in /home/akiyan/encodemaniax/webroot/index.html on line 71 JavaScript encodeURI() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuri" in /home/akiyan/encodemaniax/webroot/index.html on line

kuy 2010/01/26

リンク

Text Escaping and Unescaping in JavaScript(Unicode の文字列をエスケープする JavaScript)

Notes No data is sent to the server (i.e. everything is done in JavaScript). Conversion from Unicode to other encodings such as Shift_JIS can be slow first time as it needs to initialize internal conversion tables. Surrogate pairs in UTF-16 are supported. Try inserting \uD840\uDC0B in the second form. Three-byte characters in EUC-JP are not supported. Links JavaScript Unicode Charts Try GNU Libidn

kuy 2009/08/09

JavaScriptによる文字列のエスケープ結果を調べられるオンラインツール

リンク

AutoFenc - Tries to automatically detect and set file encoding : vim online

Thanks to Ingo Karkat for the updates in this version. - Improved the detection regexp for comments: - added "fileencoding" and "charset"; - demands that there is a whitespace in front of the keyword, so that "daycoding" doesn't match; - g:autofenc_autodetect_commentexpr allows to configure the pattern for comment detection. - Introduced g:autofenc_enc_blacklist to disable some encodings. For exam

kuy 2009/07/27

この発想はいいな。他にも応用できそうだ。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (18)

encodingに関するkuyのブックマーク (9)

お知らせ

今週のはてなブックマーク数ランキング（2025年12月第1週）

月間はてなブックマーク数ランキング（2025年11月）

今週のはてなブックマーク数ランキング（2025年11月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス