みなさんは「unicode」と「utf-8」という言葉がどのような意味を持っているかご存知でしょうか?
そこでこの記事では、「unicode」と「utf-8」の違いを分かりやすく説明していきます。
「unicode」とは?
「unicode」は「ユニコード」という読み方になります。
この「unicode」とは「文字コードの国際的業界標準の1つ」であり、「世界中の色々な言語の文字が収録されている表のようなもので番号を割り当てて同じコード体系をベースにして使用できるようにしたもの」です。
「utf-8」とは?
「utf-8」は「ユーティーエフエイト」という読み方になります。
この「utf-8」は別名「UCS変換フォーマット8」とも呼ばれているもので、「WWW(ワールドワイドウェブ)において最も一般的な文字エンコーディンブログ」と言っていいでしょう。
1文字あたり1〜4byteで表われており、「UTF-8」はASCIIに対して後方互換性を持っています。
そして、全ての標準Unicode文字を表現することができるようになっているのです。
「unicode」と「utf-8」の違い
ここで「unicode」と「utf-8」の違いを見て行きましょう。
どのような相違点があるのでしょうか「unicode」は:「世界中にあるさまざまな文字16進数の数字、すわわちコードポイントを割り振った表のこと」で、文字からコードポイントに変換する表のようなものです。
一方の「UTF-8」は「Unicodeで割り振られたコードポイントをパソコンで認識できるように別の16進数の数字(=符号)に変換される方法の1つ」です。
「unicode」の例文
では、「unicode」の例文を見て行くことにしましょう。
具体的な使い方としては以下のようなものがあります。
・『unicodeは符号化文字集合と呼ばれるものの1つで、コンピュータが使う文字文字に割り当てた番号が対応する表なのです』
・『unicodeと言葉を目にしたら、文字と文字に割り当てた番号の対応表だと思うことだ』
「utf-8」の例文
続いて「utf-8」の例文を見て行きましょう。
具体的には以下のような文章が挙げられます。
・『文字コードには色々なものがあるが、中でもスタンダード的なのが、UnicodeのUTF-8となる』
・『世界中にある文字を集合体は文字集合と呼んでいるが、文字集合で定義された個々の文字をコンピューター上で表示する数値の振り方が符号化方式であり、UTF-8でもあるのです』
まとめ
ここまで「unicode」と「utf-8」の意味と違いを説明してきました。
ITに詳しくない人がこの意味を見てもかなり難しく感じるかもしれません。
日常生活やビジネスシーンでもほとんど使われる言葉ではありませんが、知識の1つとして知っておくこともいいのではないかと思います。