Logo ar.removalsclassifieds.com

الفرق بين UTF-8 و UTF-16 (مع الجدول)

جدول المحتويات:

Anonim

تتعامل أجهزة الكمبيوتر بشكل عميق مع الأرقام ، ويتم تعيين كل حرف وعلامات ترقيم وحروف أبجدية ورمز ، وما إلى ذلك ، بواسطة أرقام مختلفة في الكمبيوتر. قبل اختراع حرف Unicode ، كانت هناك طرق عديدة لتعيين رقم لأحرف مختلفة وأكثر من ذلك هو ترميز الأحرف. يعتبر Unicode رسميًا طريقة توفر أرقامًا فريدة للأحرف المختلفة إلى جانب الأنظمة الأساسية أو الأجهزة أو التطبيقات أو اللغات المختلفة.

Utf-8 مقابل Utf-16

يتمثل الاختلاف بين UTF-8 و UTF-16 في أن UTF-8 ، أثناء ترميز أي حرف باللغة الإنجليزية أو أي رقم ، يستخدم 8 بتات ويعتمد الكتل 1-4 بينما نسبيًا من ناحية أخرى UTF-16 ، أثناء تشفير الأحرف والأرقام ، يستخدم 16 بت مع تنفيذ 1-2 كتل. أيضًا ، حجم ملف UTF-8 يتطلب مساحة أقل ، في حين أن الملف الموجه UTF-16 هو ضعف حجم UTF-8.

يرمز UTF-8 إلى تنسيق تحويل Unicode 8 الذي يستخدم تنفيذ من 1 إلى 4 كتل جنبًا إلى جنب مع 8 بتات ويحدد جميع نقاط رمز Unicode التي تم التحقق من صحتها. يبلغ الطول المتغير لـ UTF-8 حوالي 32 بت لكل حرف. تم تشكيل UTF-8 من قبل عقلين لامعين - كين تومسون وروب بايك في سبتمبر 1992. تم إنشاؤه عندما كانا مشغولين في إنشاء نظام تشغيل الخطة 9 ، واستغرق الأمر أسبوعًا لصياغته.

يرمز UTF-16 إلى تنسيق Unicode Transformation 16 الذي يستخدم 1-2 كتلتين منفذة على طول 16 بت للتعبير عن نقطة رمز. بعبارات بسيطة ، يتطلب UTF-16 Unicode ما لا يقل عن 2 بايت للتعبير عن نقطة رمز. يتطلب UTF-16 أيضًا طولًا متغيرًا يصل إلى 32 بت لكل حرف. تم تشكيل UTF-16 للتغلب على استيعاب عدد نقاط الرمز.

جدول المقارنة بين Utf-8 و Utf-16

معلمات المقارنة

UTF-8

UTF-16

حجم الملف

إنه أصغر في الحجم. هو أكبر في الحجم بالمقارنة.
توافق ASCII

وهو متوافق مع ASCII. إنه غير متوافق مع ASCII.
اتجاه البايت

إنه موجه للبايت. انها ليست بايت المنحى.
استعادة الأخطاء

إنه لأمر جيد في التعافي من الأخطاء التي ارتكبت. انها ليست جيدة كما في التعافي من الأخطاء التي ارتكبت.
عدد البايت

في حالة الحد الأدنى ، يمكنه استخدام ما يصل إلى 1 بايت فقط (8 بتات). في حالة الحد الأدنى ، يمكن أن يستخدم ما يصل إلى 2 بايت (16 بت).
عدد الكتل

إنها تتبنى 1-4 كتل. لقد اعتمدت 1-2 كتل.
كفاءة

أكثر فعالية أقل كفاءة
شعبية

إنه أكثر شيوعًا على الويب. لا تحظى بشعبية كبيرة.

ما هو UTF-8؟

يرمز UTF-8 إلى تنسيق تحويل Unicode 8. وهو يقوم بتنفيذ الكتل 1-4 مع 8 بتات ثم يحدد جميع نقاط الشفرة الصالحة لـ Unicode. يمكن لـ UTF-8 صياغة ما يصل إلى 2 ، 097 ، 152 نقطة رمز كحد أقصى. يتم ترميز أول 128 نقطة رمز بواسطة الكتلة المفردة المكونة من 8 بتات ثنائية ، وهي متطابقة مع أحرف ASCII.

العقول اللامعة وراء إنشاء UTF-8 هم كين طومسون وروب بايك. قاموا بإنشائه أثناء التخطيط لـ 9 أنظمة تشغيل في عام 1992 سبتمبر. تم إنشاؤه في غضون أسبوع ، والنظام الدولي للتنظيم (ISO) هو ISO 10646. كما أنه أكثر تنسيق ترميز مقبول على نطاق واسع ، ويتم إنشاء ما يقرب من 95٪ من جميع صفحات الويب بناءً على تنسيق UTF-8.

ما هو UTF-16؟

يرمز UTF-16 إلى تنسيق تحويل الاتحاد 16. تنفيذ بايت واحد أو اثنين من الكتل المكونة من 16 بتًا للتعبير عن كل نقطة من نقاط الرمز. بعبارات بسيطة ، يتطلب تمثيل كل نقطة رمز في UTF-16 حدًا يصل إلى 2 بايت. يعبر الطول المتغير لـ UTF-16 عن حوالي 1 ، 112 ، 064 نقطة رمز.

يأتي حجم ملف UTF-16 ضعف حجم UTF-8. لهذا السبب ، يعتبر UTF-16 أقل كفاءة. UTF-16 ليس موجهًا للبايت ، كما أنه غير متوافق مع أحرف ASCII. UTF-16 هو أقدم معيار ترميز في مجال سلسلة Unicode. التطبيق المتنوع لـ UTF-16 هو الاستخدام في برمجة Microsoft Windows و JavaScript وجافا داخليًا.

الاختلافات الرئيسية بين Utf-8 و Utf-16

استنتاج

تمت صياغة معايير Unicode لإعطاء أرقام فريدة للأحرف المختلفة. في مجال معايير Unicode ، يعتبر UTF-16 أقدم ترميز Unicode ظهر إلى الوجود. مع العديد من ميزات معايير Unicode ، يختلف كل من UTF-8 و UTF-16 في نواح كثيرة عن بعضهما البعض.

UTF-8 هو معيار Unicode الذي تم إنشاؤه بواسطة Ken Thompson و Rob Pike في العام 1992 في سبتمبر. إنه تنسيق Unicode الأكثر قبولًا على نطاق واسع ، وقد تم تصميم جميع صفحات الويب بشكل أساسي بناءً على نظام تشفير UTF-8.

في المقابل ، فإن UTF-16 هو تنسيق ترميز آخر. حجم ملف UTF-16 هو ضعف حجم UTF-8. أيضًا ، نظرًا لحجم الملف الكبير ، تكون كفاءة UTF-16 أقل. كما أنه غير متوافق مع أحرف ASCII.

مراجع

  1. https://dl.acm.org/doi/abs/10.1145/1345206.1345222
  2. https://www.hjp.at/doc/rfc/rfc3629.html
  3. https://www.proquest.com/openview/75078d4ece0a06f8cddd6cc9a719e8f9/1؟pq-origsite=gscholar&cbl=2030006
  4. https://www.hjp.at/doc/rfc/rfc2781.html

الفرق بين UTF-8 و UTF-16 (مع الجدول)