投句が文字化けする理由

私は、日々の仕事内容に、「俳句の投稿一覧を取りまとめる」という作業があります。

その取りまとめの際に、「投句したあと自動返信メールを見たら、文字化けしていて、ビックリした」と連絡をいただいたことが、何回もあります。私も、どうして文字化けしちゃうの?と気になっていたので、調べたことを共有しますね。

投句フォームからCSVで、投句一覧をダウンロードすると、俳句が文字化けしていることがあります。投句した人、心配してるかも……

投句フォームの管理画面を確認してみると、管理画面上に保存された投句は文字化していませんでした。自動返信を受け取るときに文字化けが発生しているようです。文字化けしてしまうのはなぜでしょうか?

文字化けが発生する原因は、大きく「環境依存文字の使用」「文字コードの違い」の2パターンが考えられるようですが、この記事では「環境依存文字の使用」に絞って調べたことを掲載しています。

環境依存文字(機種依存文字)

特定のコンピュータでのみ正しく表示できる文字のことです。
互換性のないその他のコンピュータでは、表示が異なります。

入力内容の一部が文字化けしている場合は、環境依存文字が原因だと考えられます。
使用しているPCやOSによっては、正しく表示されない文字があるようです。

環境依存文字を使用してメールを送ると、相手のPC上ではレイアウトが崩れたり表示されなかったりしてしまいます。投句の自動返信メールでの文字化けは、こういった事情で文字化けしていたんですね。

コンピューターが文字を理解できるように、文字の一文字一文字には、番号が付けられています。

機種依存文字は、コード空間の空き領域に各コンピュータメーカが独自に拡張した記号類を定義したものだそうです。

機種依存文字の例として、丸数字(①②③…)やローマ数字(ⅠⅡⅢ…)など、JIS(文字セット)には含まれなかった記号類や漢字などが割り当てられています。

▼投句一覧の中で、よく文字化け修正を行う漢字を3つだけ紹介します

「本当は、こっちの漢字を使いたいのに……」投句した人もそう思っていると思いますが、受け取った私も「確かにこっちの漢字の方が、一句のデザインが良くなりますもんね……」と思いながらも、様々な事情からあきらめることもあります。

作句するときの想い、俳句の文字デザインとしての視点、歳時記の表記、文字コードの事情。環境に制限はありますが、折り合いをつけながら、うまく付き合っていきたいですね。

現在のOSはさまざまな文字コードに対応しているので、Unicodeを使用していれば、基本的にはコードの割り当て違いに起因する文字化けは防ぐことができるようになっているようです。(不特定多数とのやりとりを行う電子メールなどでは、文字化けが発生する場合があります。)

写真提供: craftbeermania /photo AC

ここまでは、WEBの投句フォームでの文字化けについて書いてきましたが、

はがきについても、文字化け問題があるんです。冊子作成の際には、「はがきなら文字化けしないし安心だ」というわけにはいきませんでした。

俗字や簡体字、楷書など、どの人もご自身が学習してきた表記で手書きしています。投句者の年代の幅が広いため、学習していた時期によって、習った漢字の形が若干異なってしまうのかもしれません。

その場合、紙媒体用の入稿データをInDesignで作る時に、意図した字形にならない事があります。多くの場合は、同じ意味で字形が異なる「新字」と「旧字」を設定で切り替えることで解決しますが、

使用する書体によっては、文字コードが割り振られていないものもあるようで、解決するためには、似たような書体の中から、該当の文字に文字コードが割り振られているものを探して、一文字だけ差し替えることもあります。

草冠の間に隙間がある文字を眺めていました。投句した人の人生が、使う漢字から読み取れるような気がして。草冠の間の隙間、作ってあげられなかったな……

俳句の表記と「環境依存文字(機種依存文字)」について、興味深いことが多いですね。私も、引き続きいろいろ調べてみたいと思います。

PR
PR


参照元:モリサワ データを開いただけなのに……文字化けってどうして起こるの?
参照元:モリサワ フォント用語集 機種依存文字
参照元:字体・字形・書体
参照元:トライコーンラボ Webフォームの文字化けを解消。エンコード処理と効率的なデータ活用のためのシステムのあり方ついても解説