یونیکد
یونیکُد[۱] (به انگلیسی: Unicode) یک کدبندی نویسه و نمایش و پردازش متن به اکثر زبانهای دنیا[۲] است. هر زبان یک قالب یونیکد دارد. این استاندارد هماهنگ با مجموعه جهانی نویسهها تألیف شدهاست و به صورت کتابی به نام 'The Unicode Standard' منتشر شدهاست. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعهای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعهای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعهای از مرجع فایلهای دادههای کامپیوتر و تعدادی موارد مربوط مانند جزئیات نویسه، برابری یونی کد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپتهای سمت چپ به راست) میباشد. تا تاریخ مارس ۲۰۱۹، آخرین ویرایش، یونیکد ۱۲٫۰ است. موفقیت یونیکد در یکی کردن کد بندی نویسهها سبب استفاده گسترده اش در جهانیسازی و بومیسازی نرمافزارها شدهاست. این استاندارد در بسیاری از فناوریهای اخیر پیاده شدهاست از جمله: اکس ام ال، زبان برنامهنویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عاملهای مدرن. یونیکد میتواند توسط کدبندیهای مختلفی پیادهسازی شود. پرکاربردترین رمز نگاریها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16. کدبندی UTF-8 برای کدبندیهای موجود در استاندارد اسکی تنها ۱ بایت استفاده میکند. کد نویسههای موجود در رمز نگاری اسکی، در هر دو کدبندی یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده میکند.UCS-2 برای تمام نویسهها از ۲ بایت استفاده میکند بنابراین نمیتواند تمام نویسههای موجود در استاندارد فعلی یونیکد را کدبندی کند. UTF-16 کدبندی UCS-2 را گسترش میدهد و برای نویسههای باقیمانده از ۴ بایت استفاده میکند. تاریخچه و توسعههدف یونیکد رفع محدودیتهای موجود در کدبندی نویسههای قدیمی است، مانند کدبندیهایی که بر پایه استاندارد ISO 8859 تعریف شدهاند، که استفاده گستردهای در کشورهای مختلف پیدا کردهاند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندیهای قدیمی این مشکل مشترک را دارند که امکان پردازش متنهای دوزبانه (معمولا به وسیله نویسههای لاتین و نمادهای محلی) را فراهم میکنند، ولی پردازش بیش از دو زبان را ممکن نمیکنند. نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارائه میکند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارائه میکند و کار ساخت تصویر (شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرمافزار دیگری مانند مرورگر وب یا واژهپرداز میگذارد. نسخههایونیکد در کنار سازمان بینالمللی استاندارد توسعه یافتهاست و کارنامه کاراکتری خود را تحت ISO / IEC 10646 با دیگران به اشتراک میگذارد: مجموعه کاراکتر جهانی. یونیکد و ISO / IEC 10646 در کنار یکدیگر و همسان هم به عنوان رمزگذاری کاراکتر عمل میکنند. اما استاندارد یونیکد حاوی اطلاعات بسیار بیشتری برای پیادهساز است، و جزئیات بیشتری در رابطه از قبیل رمزگذاری بیتی، جمعبندی و رندر کاراکترها را شامل میشود. استاندارد یونیکد تعداد زیادی از خصوصیات کاراکترها را برمیشمارد، من جمله پشتیبانی از جهت نوشتن متن دوسویه است. اصطلاحات مورد استفاده این دو استاندارد از کمی تفاوت برخوردار است. کنسرسیوم یونیکد برای اولین بار Unicode Standard را در سال ۱۹۹۱ منتشر کرد (نسخه ۱٫۰)، و از آن زمان نسخههای جدید را بهطور منظم منتشر میکند. آخرین نسخه یونیکد استاندارد، نسخه ۱۳٫۰، در مارس ۲۰۲۰ منتشر شد و با فرمت الکترونیکی از وب سایت کنسرسیوم در دسترس است. آخرین نسخه استانداردی که بهطور کامل در قالب کتاب منتشر شدهاست (شامل نمودارهای کد) نسخه ۵٫۰ در سال ۲۰۰۶ بود، اما از نسخه ۵.2 (2009) مشخصات اصلی استاندارد به عنوان یک شومیز چاپی در صورت تقاضا منتشر شدهاست. کل متن هر نسخه استاندارد از جمله مشخصات اصلی، ضمائم استاندارد و نمودار کد به صورت آزاد در قالب PDF در وب سایت Unicode در دسترس است.[۳] تاکنون نسخههای اصلی و جزئی زیر از استاندارد یونیکد منتشر شدهاست. نسخههای به روز شده، که هیچ تغییری در کارنامه کارکترها را شامل نمیشود، با شماره سوم (به عنوان مثال "نسخه ۴٫۰٫۱") علامت گذاری میشوند و در جدول زیر حذف نمیشوند.[۴]
یونیکد در ویندوزدر ویندوز ایپیآی توابع یونیکد با پسوند W میآیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبانهای برنامهنویسی انواع دادهای که یونیکد را پشتیبانی میکنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته میشود. جستارهای وابستهپیوند به بیرونپانویس
منابع![]() در ویکیانبار پروندههایی دربارهٔ یونیکد موجود است.
Information related to یونیکد |
Portal di Ensiklopedia Dunia