Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
[6] 使えない文字 - インターネットメールの注意点
[go: Go Back, main page]

[6] 使えない文字


日本語のインターネットメールを送る場合、ISO-2022-JPが無難なわけですが、こいつは使える文字に限りがあります。どんな文字でも使えるわけではありません。


[6.1] 分類して考えてみよう

[6.1.1] 使えないカタカナがある

実は、有名なカタカナには2種類あります。
このうち一方が、日本語メールで使われる文字コード(ISO-2022-JP)に選ばれています。もう片方は禁止です。

実は、「使える方/使えない方」の区別を「全角/半角」で見分けられる場合があります。「半角カタカナは使えない」と書いている文書が多いのは、この為なのです。
しかし、見分けにくい場合もありうるので注意してください。

JIS X 0201 のカタカナ使えない半角に見える場合がある
JIS X 0208 のカタカナ使える全角に見える場合がある

使えない筈のカタカナを使えてしまった場合、それはISO-2022-JP以外の方法なのです。当然、受信者側のマシンやソフトでちゃんと読める可能性は減ります。

マシンやソフトによっては、送信時に 使えない方 → 使える方 に自動変換が行われるようですが、使わない癖を付けておいた方が良いでしょう。半角 → 全角 になって1行の幅が長くなり、横にはみ出る可能性があります。

ついうっかり使ってしまう文字があるのですが、全角/半角で区別出来るフォントの場合は、次のような判断が出来ます。

うっかり見本図

[6.1.2] いろんな記号や絵文字は心配だ

まず、使ってよい記号の一覧を見てみましょう。
これらは、1978年にJIS X 0208という規格で決まった記号なので、問題なく使えます。

1978年に決まった記号

ところが、1983年に改訂されたときに、もっと記号が追加されました。
これらも使ってよい記号とされていますが、受信者が古いフォントを使ってる可能性があるときは注意してください。

1983年に追加された記号

人によっては、これでもまだ足りないと思うことでしょう。
だから、マシンやソフトによっては空き領域に独自の記号を追加している場合があり、これをシステム外字と呼ぶ場合があります。他のフォントでは同じく見えるとは限らないので、使ってはいけません

使えない記号の見本図

まるいち」「まるに」などは一部のマシンの文字なので、他のマシンでは見えなかったり、別の文字に見えたりすることがあります。「昭和」とかを1つのフォントにしてる文字もそうです。「株式会社」等を表す記号もそうです。
かつては、それぞれのコンピュータは使えるフォントが決まっており、別のフォントが使えませんでした。機種によって異なるので機種依存文字と呼ばれるようになりました。現在はフォントの変更が出来る場合が増えているので、実際にはフォント依存と考えた方が良いでしょう。

更に面倒なのは、使える文字に似た機種依存文字も時々あることです。どうしても心配なら、記号は一切使わないのが安心かもしれません。

また、携帯電話には絵文字が使えるものがありますが、これも独自であり機種によってバラバラです。

[6.1.3] 外字は使えない

マシンやソフトによっては、空き領域に自分でデザインした文字を追加できて、これを外字とかユーザ外字と呼ぶようです。
でも、あなたがデザインした情報は送信されていないので、相手には見えません。

[6.1.4] 罫線は心配だ

もともと、1978年にJIS X 0208という規格が出来たときには、罫線はありませんでした。
その後、1983年に改訂されたときに追加されたのです。
だから、古いフォントを使っている人は罫線が見えません

1983年に追加された罫線

また、マシンやソフトによっては、空き領域に独自の罫線を追加している場合があります。機種依存文字ですから、使ってはいけません

この区別は大変なので、代わりにASCIIの縦棒「|」マイナス「-」プラス「+」を使う方法があります。

安心な表の見本図

しかし、次の見本のように、フォントの関係でずれて見える場合があります。

ずれた表の見本図

結局、安心出来る方法が思い付きません。

[6.1.5] やたら難しい漢字には使えないものがある

インターネット用の日本語文字コードであるISO-2022-JPには、全ての漢字が含まれている訳ではありません。特に、旧字体や珍しい人名/地名等の漢字は使えないことがあります。
UnicodeISO-2022-JP-1ISO-2022-JP-2等ならば、漢字が増えているので何とかなる可能性もありますが、今のところ完全に普及しているわけではないです。
ですから、自分の名前すらメールに書けない人が大勢いるわけです。

特に、EUC-JPShift_JISのコンピュータの中には、ISO-2022-JPに絶対に変換出来ない漢字が含まれていることがあります。

[6.1.6] TABは、ずれるかもしれない

ここで言うTABとは、ASCII制御文字であるHTのことです。多くのキーボードでは左上の方にあります。これは使って良い文字です。
普通、行頭を揃えるのに使ったりしますが、スペース4つ分だったりスペース8つ分だったりと、マシンやソフトによって違います。だから送信側と受信側で違ってみえるかもしれませんね。


[6.2] ヤバイ文字を使わないコツ

まず、使えない方のカタカナを送信できないメールソフトを選ぶのが一番です。送信できないのが当然なのですから。

送信できてしまうソフトを使う場合は、細心の注意が必要です。

  1. あなたのメールソフトや「かな漢」の設定を調べましょう。「JIS X 0201のカタカナ」「半角カタカナ」「1バイトカタカナ」を使えなくする設定があったら、ぜひ選んでください。たぶんそれは、使えない方のカタカナを書けなくする設定でしょう。
  2. 等幅フォント(固定ピッチフォント)だと、使えない方のカタカナを半角で表示するものが多いようです。そういうフォントを使えば、目で見て簡単に区別出来ます。
  3. 数字やアルファベットを使う時は、「かな漢」とか「カナ入力」をoffにします。するとASCIIになるはずです。これで、カタカナの「のばすしるし」が避けられます。
  4. 句読点は特に注意してください。大抵のフォントでは文字の幅で区別が付くようです。
  5. 便利な記号に限って、「使ってはいけない文字」です。「かな漢」とか「カナ入力」をoffにして記号を使えば、それはASCIIなので心配ないでしょう。

[5] へ戻る ← → [7] へ進む


[補足] (暇なら読んでね)

[*] 「半角カタカナ」という言葉の混乱

まず、JIS規格を調べてみても「半角カタカナ」「半カナ」という言葉は出てきません。
JIS X 0201には「フォントのデザインは, この規格の規定範囲外とする」と書かれていますから、必ずしも半角じゃなくていいのです。
しかし、実際には半角になっている場合が多いので「半角カタカナ」という言葉が広まったようです。こうした経緯から、JIS X 0208 附属書5 では、「これまでの慣用的な利用との互換を目的としてだけ用いる文字の代替名称」ということでJIS X 0201の片仮名用図形文字に「HALFWIDTH KATAKANA」という名称を与えています。混乱しますなあ。
あと「1バイトカタカナ」という呼び方もありますが、EUC-JPだと1文字あたり2バイトのように見えるので注意してください。

[*] JIS X 0201のカタカナの扱い

JIS X 0201のカタカナを使わないという話は、RFC1468の Background Information の項に明記されています。

無理矢理使ったメールを調べてみたら、少なくとも3種類あることを確認しました。

1)は何しろ8ビットなので、壊れずに届くかどうか心配だし、もしそのまま届いても色々な化け方をするでしょう。
2)3)も色々な化け方をすると思いますが、ありがちな見え方を[11.4.1]で紹介しました。

[*] JIS X 0201のカタカナはUNIXで使えないのか

UNIXでは「JIS X 0201のカタカナが使えない」「半角カタカナが使えない」「1バイトカタカナが使えない」と言う人もいますが、そんなことはないです。大抵は使おうと思えば使えます。古くからJIS X 0201のカタカナを排除していこうという動きがあったからサポートしないソフトが多いだけです。ISO-2022-JPを前提としたソフトで使えないのは当然です。また、EUC-JPやShift_JISを前提としていても原理的に自動認識が難しいのでJIS X 0201はサポート外とするものもあります。

[*] 空き領域の扱い

JIS X 0208の空き領域は、もともとユーザが文字を割り当てて使う為のものでしたが、現在の規格では、当事者間の合意がなければ使ってはいけない事になっています。

[*] かな漢

「かな漢」と呼ばれるものは、 「仮名漢字変換プログラム」 「日本語入力プログラム」 「日本語FEP」 「日本語フロントエンドプロセッサ」 「日本語IME」 「日本語IM」 「日本語インプットメソッド」 なんて色々な言い方があって、それぞれ意味があるのですが、まあ、日本語を入力するってことで間違いないですよね。


[5] へ戻る ← → [7] へ進む


五十音順さくいん / アルファベット順さくいん / 数字順さくいん

目次へ