Кодування "юнікод": стандарт кодування сімволів
КОЖЕН користувач інтернету в СПРОБА налаштуваті ту чи іншу его функцію хоча б один раз бачив на дисплеї Написане Латинська літерами слово «Юнікод». Що це таке, ви дізнаєтеся, прочитавши Цю статтю.
визначення
кодування "Юнікод" - Стандарт кодування сімволів. ВІН БУВ запропонованій некомерційною організацією Unicode Inc. в 1991 році. Стандарт розроблення з метою об`єднання якомога більшої кількості різнотіпніх сімволів в одному документі. Сторінка, яка створ на его основе, может містіті в Собі букви и ієрогліфі з різніх мов (від російського до корейського) и математичні знаки. При цьом всі символи в даного кодуванні відображаються без проблем.
причини создания
Колись, Задовго до з`явиться єдиної системи "Юнікод", Кодування Вибирай віходячі з перевага автора документа. З цієї причини нерідко, щоб Прочитати один документ, нужно Було використовуват Різні табліці. Іноді це доводять делать по кілька разів, что істотно ускладнювало життя звичайна корістувачеві. Як Вже Було сказано, решение цієї проблеми в 1991 році Було предложено некомерційною організацією Unicode Inc., яка предложили новий тип кодування сімволів. ВІН МАВ на меті об`єднати морально застарілі и різноманітні стандарти. "Юнікод" - Кодування, яка озволіла добиться неміслімого на тій момент: создать інструмент, Який підтрімує Величезне Кількість сімволів. Результат перевершив много очікувань - з`явилися документи, одночасно містять як англійська, так и російський текст, латина и математичні вирази.
Відео: Програмування для початківців. 12. Зручний Unicode
Альо создания єдиної кодування передувала необходимость Дозволу ряду проблем, Які вініклі через Величезне розмаїття стандартів, Вже існувалі на тій момент. Найпошіреніші з них:
- ельфійські письмена, або «кракозябри»;
- обмеженість набору сімволів;
- проблема превращение кодування;
- дублювання шріфтів.
Невеликий історичний екскурс
Уявіть, что на дворі 80-е. Комп`ютерна техніка ще не так ширше и має вигляд, відмінний від сьогоднішнього. У тій годину Кожна ОС по-своєму унікальна и доопрацьована шкірних ентузіастом під конкретні спожи. Необходимость обміну інформацією превращается в Додаткове доопрацювання Всього на світі. Спроба Прочитати документ, Створений під іншою ОС, часто виводу на екран незрозумілій набір сімволів, и почінаються ігри з кодування. Чи не всегда Вихід сделать це Швидко, и годиною необхідній документ вдається Відкрити через півроку, а то й пізніше. Люди, Які часто обмінюються інформацією, створюють для себе табліці превращение. І ось робота над ними віявляє цікаву деталь: створюваті їх нужно за двома напрямки: «з моєї в твою» и назад. Зробити банально інверсію Обчислення машина не може, для неї в правому стовпчики исходник, а в лівому - результат, но Ніяк не навпаки. Если з`являлася необходимость використовуват будь-які СПЕЦІАЛЬНІ символи в документі, їх необходимо Було спочатку Додати, а потім ще й поясніті партнеру, что Йому нужно сделать, щоб ЦІ символом не превратились в «кракозябри». І Не будемо забуваті, что під шкірного кодування доводи розробляті або впроваджуваті Власні шрифти, что виробляти до создания велічезної кількості дублів в ОС.
Уявіть ще, что на странице шріфтів ві побачим 10 штук ідентічніх Times New Roman з маленькими Позначку: для cp1251, UTF-16, ANSI, UCS-2. Тепер ви розумієте, что розробка універсального стандарту булу Нагальне потребою?
«Батьки-творці»
Витоки создания Unicode слід шукати в 1987 году, коли Джо Беккер з Xerox разом з Лі Коллінзом и Марком Девісом з компании Apple начали дослідження в сфері практичного создания універсального набору сімволів. У серпні 1 988 року Джо Беккер опублікував проект Пропозиції относительно создания 16-бітної міжнародної багатомовної системи кодування.
Через кілька місяців робоча група Unicode булу розшірена за рахунок включення Кена Уістлера и Майка Кернегана з RLG, Гленн Райт з Sun Microsystems и декількох других фахівців, что дозволило Завершити роботи з попередня формирование єдиного стандарту кодування.
Загальний опис
В Основі Unicode лежить Поняття символу. Під ЦІМ визначенням розуміється абстрактне явіще, існуюче в конкретному віді писемності и реалізоване через графеми (свои «портрети»). КОЖЕН символ задається в "Юникоде" унікальнім кодом, что Належить конкретного блоку стандарту. Например, графема B є и в англійській, и в російській алфавітах, но в Unicode їй відповідають 2 різніх символу. До них застосовується превращение в малу літеру, т. е. КОЖЕН з них опісується ключем бази даних, набором властівостей и ПОВНЕ назв.
Преимущества Unicode
Від других сучасніків кодування "Юнікод" відрізнялася Величезне запасом знаків для «шифрування» сімволів. Справа в тому, что его попередники малі 8 біт, тобто підтрімувалі 28 сімволів, а вісь нова розробка мала Вже 216 сімволів, что стало гігантськім кроком вперед. Це дозволило закодуваті практично всі існуючі и пошірені алфавіті.
Відео: Юнікод
З з`явиться "юнікода" відпала потреба використовуват табліці превращение: як єдиний стандарт ВІН просто зводу нанівець їх необходимость. Точно так же канули в Лету и «кракозябри» - єдиний стандарт Зробив їх Неможливо, так само як и виключ необходимость создания дублів шріфтів.
Відео: Подання рядків javascript и Unicode символи. Методи charCodeAt и fromCharCode
розвиток Unicode
Звичайний, прогрес НЕ стоит на місці, и з моменту Першої Презентації минуло Вже 25 років. Однако кодування "Юнікод" вперто утрімує свои позиции в мире. Много в чому це стало можливіть Завдяк того, что ВІН ставши легко впроваджуються и набув Поширення, будучи Визнання розробник пропрієтарного (платного) и відкритого ПЗ.
При цьом НЕ Варто думати, что сегодня нам доступна та ж кодування "Юнікод", Що и чверти століття тому. Сейчас ее версия змінілася на 5.х.х, а Кількість кодованому сімволів Зросла до 231. Від возможности використовуват більшій запас знаків відмовіліся, щоб все ще Зберегти підтрімку для Unicode-16 (кодування, де максимальна їх Кількість обмежувалася цифрою 216). З моменту своєї з`явився и до Версії 2.0.0 "Юнікод-стандарт" збільшів Кількість сімволів, Які в него входили, практично в 2 рази. Зростання можливий чати и в следующие роки. До Версії 4.0.0 Вже з`явилася необходимость збільшити сам стандарт, что и Було Зроблено. В результате "Юнікод" знайшов тієї вид, в якому ми его знаємо сегодня.
Що ще є в Unicode?
Кроме Величезне, Постійно поповнюється кількості сімволів, "Юнікод"-кодування текстової информации має ще одну Корисна рису. Йдет про так званої нормалізації. Замість того щоб перегортаті весь документ символ за символом и підставляті відповідні значки з табліці відповідності, вікорістовується один з існуючіх алгоритмів нормалізації. Про що мова?
Замість того щоб втрачають ресурси обчіслювальної машини на регулярні перевірку одного и того ж символу, Який может буті схожим в різніх алфавітах, вікорістовується Спеціальний алгоритм. ВІН дозволяє вінесті схожі символи окремий граф табліці підстановкі и Звертатися Вже до них, а не раз по раз перевіряті всі дані.
Таких алгоритмів розроблено и впроваджено Чотири. У кожному з них превращение відбувається по строго Певного принципом, что відрізняється від других, тому назваті Якийсь один з них найбільш ефективного НЕ представляється можливіть. КОЖЕН розроблявся для питань комерційної торгівлі потреб, БУВ Впровадження и успешно вікорістовується.
Відео: Як Изменить кодування в Word
Поширення стандарту
За 25 років своєї історії кодування "Юнікод" получила, ймовірно, найбільше Поширення в мире. Під цею стандарт підганяються такоже програми и web-сторінки. Про широту! Застосування может Говорити тієї факт, что Unicode сегодня Використовують прежде 60% інтернет-ресурсів.
Тепер вам відомо, коли з`явився стандарт "Юнікод". Що це таке, ви такоже добре там, де и зможете оцініті всі значення винаходи, зроблений групою фахівців Unicode Inc. более 25 лет назад.