日本語のインターネットメールを送る場合、ISO-2022-JPが無難なわけですが、こいつは使える文字に限りがあります。どんな文字でも使えるわけではありません。
実は、有名なカタカナには2種類あります。
このうち一方が、日本語メールで使われる文字コード(ISO-2022-JP)に選ばれています。もう片方は禁止です。
実は、「使える方/使えない方」の区別を「全角/半角」で見分けられる場合があります。「半角カタカナは使えない」と書いている文書が多いのは、この為なのです。
しかし、見分けにくい場合もありうるので注意してください。
JIS X 0201 のカタカナ -- 使えない -- 半角に見える場合がある JIS X 0208 のカタカナ -- 使えます -- 全角に見える場合がある
使えない筈のカタカナを使えてしまった場合、それはISO-2022-JP以外の方法なのです。当然、受信者側のマシンやソフトでちゃんと読める可能性は減ります。
マシンやソフトによっては、送信時に 使えない方 -> 使える方 に自動変換が行われるようですが、使わない癖を付けておいた方が良いでしょう。半角 -> 全角 になって1行の幅が長くなり横にはみ出る可能性があります。
ついうっかり使ってしまう文字があるのですが、全角/半角で区別出来るフォントの場合は、次のような判断が出来ます。
まず、使ってよい記号の一覧を見てみましょう。
これらは、1978年にJIS X 0208という規格で決まった記号なので、問題なく使えます。
ところが、1983年に改訂されたときに、もっと記号が追加されました。
これらも使ってよい記号とされていますが、古いフォントだと表示できないのでちょっと心配です。
人によっては、これでもまだ足りないと思うことでしょう。
だから、マシンやソフトによっては空き領域に独自の記号を追加している場合があり、これをシステム外字と呼ぶ場合があります。他のフォントでは同じく見えるとは限らないので、使ってはいけません。
「まるいち」「まるに」などは一部のマシンの文字なので、他のマシンで読めないことがあります。「昭和」とかを1つのフォントにしてる文字もそうです。「株式会社」等を表す記号もそうです。このような、機種によって異なる文字を機種依存文字といいます。
しかも、使える文字にそっくりな機種依存文字も時々あるようで、混乱します。どうしても心配なら、記号は一切使わないのが安心かもしれません。
マシンやソフトによっては、空き領域に自分でデザインした文字を追加できて、これを外字とかユーザ外字と呼ぶようです。
でも、あなたがデザインした情報は送信されていないので、相手には見えません。
もともと、1978年にJIS X 0208という規格が出来たときには、罫線はありませんでした。
その後、1983年に改訂されたときに追加されたのです。
だから、古いフォントを使っている人は罫線が見えません。
また、マシンやソフトによっては、空き領域に独自の罫線を追加している場合があります。機種依存文字ですから、使ってはいけません。
この区別は大変なので、代わりにASCIIの縦棒「|」マイナス「-」プラス「+」を使う方法があります。
しかし、次の見本のように、フォントの関係でずれて見える場合があります。
結局、安心出来る方法が思い付きません。
インターネット用の日本語文字コードであるISO-2022-JPには、全ての漢字が含まれている訳ではありません。特に、旧字体や珍しい人名/地名等の漢字は使えないことがあります。
ISO-2022-JP-1やISO-2022-JP-2ならば、漢字が増えているので何とかなる可能性もありますが、今のところ完全に普及しているわけではないです。
ですから、自分の名前すらメールに書けない人が大勢いるわけです。
特に、EUC-JPやShift_JISのコンピュータの中には、ISO-2022-JPに絶対に変換出来ない漢字が含まれていることがあります。
ここで言うTABとは、ASCIIの制御文字であるHTのことです。多くのキーボードでは左上の方にあります。これは使って良い文字です。
普通、行頭を揃えるのに使ったりしますが、スペース4つ分だったりスペース8つ分だったりと、マシンやソフトによって違います。だから送信側と受信側で違ってみえるかもしれませんね。
まず、使えない方のカタカナを送信できないメールソフトを選びましょう。送信できないのが当然なのです。
送信できてしまうソフトを使わなければならない場合は、細心の注意が必要です。
まず、JIS規格を調べてみても「半角カタカナ」「半カナ」という言葉は出てきません。
JIS X 0201には「フォントのデザインは, この規格の規定範囲外とする」と書かれていますから、必ずしも半角じゃなくていいのです。
しかし、実際には半角になっている場合が多いので「半角カタカナ」という言葉が広まったようです。こうした経緯から、JIS X 0208 附属書5 では、「これまでの慣用的な利用との互換を目的としてだけ用いる文字の代替名称」ということでJIS X 0201の片仮名用図形文字に「HALFWIDTH KATAKANA」という名称を与えています。混乱しますなあ。
あと「1バイトカタカナ」という呼び方もありますが、EUC-JPだと1文字あたり2バイトのように見えるので注意してください。
JIS X 0201のカタカナを使わないという話は、RFC1468の Background Information の項に明記されています。
無理矢理使ったメールを調べてみたら、少なくとも3種類あることを確認しました。
1) 8ビットを使っている2) 前に ESC ( I というエスケープシーケンスを付けている3) 前にSOを付けて、後ろにSIを付けている
1)は何しろ8ビットなので、壊れずに届くかどうか心配だし、もしそのまま届いても色々な化け方をするでしょう。
2) や 3)も色々な化け方をすると思いますが、ありがちな見え方を[11]で紹介しました。
UNIXでは「JIS X 0201のカタカナが使えない」「半角カタカナが使えない」「1バイトカタカナが使えない」と言う人もいますが、そんなことはないです。大抵は使おうと思えば使えます。ただし、インターネット用のソフトだと使えないものが多いですし、それはあたりまえでしょう。
JIS X 0208の空き領域は、もともとユーザが文字を割り当てて使う為のものでしたが、現在の規格では、当事者間の合意がなければ使ってはいけない事になっています。
「かな漢」と呼ばれるものは、 「仮名漢字変換プログラム」 「日本語入力プログラム」 「日本語FEP」 「日本語フロントエンドプロセッサ」 「日本語IME」 「日本語IM」 「日本語インプットメソッド」 なんて色々な言い方があって、それぞれ意味があるのですが、まあ、日本語を入力するってことで間違いないですよね。