Our website is made possible by displaying online advertisements to our visitors.
Please consider supporting us by disabling your ad blocker.

Responsive image


UTF-8

UTF-8
Производная работа CESU-8
Создатель Роб Пайк и Кен Томпсон
Язык произведения или названия несколько языков
Дата открытия (изобретения) 2 сентября 1992[1]
Размер данных 8 b
Схематичная иллюстрация
Последнее обновление ноябрь 2003
Логотип Викисклада Медиафайлы на Викискладе

UTF-8 (от англ. Unicode Transformation Format, 8-bit — «формат преобразования Юникода, 8-бит») — распространённый стандарт кодирования символов, позволяющий более компактно хранить и передавать символы Юникода, используя переменное количество байт (от 1 до 4), и обеспечивающий полную обратную совместимость с 7-битной кодировкой ASCII. Стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.

Кодировка UTF-8 сейчас является доминирующей в веб-пространстве. Она также нашла широкое применение в UNIX-подобных операционных системах[2].

Формат UTF-8 был разработан 2 сентября 1992 года Кеном Томпсоном и Робом Пайком, и реализован в Plan 9[3]. Идентификатор кодировки в Windows — 65001[4].

UTF-8, по сравнению с UTF-16, наибольший выигрыш в компактности даёт для текстов на латинице, поскольку латинские буквы без диакритических знаков, цифры и наиболее распространённые знаки препинания кодируются в UTF-8 лишь одним байтом, и коды этих символов соответствуют их кодам в ASCII.[5][6]

  1. https://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
  2. Usage Statistics of Character Encodings for Websites, June 2011 (англ.)
  3. Архивированная копия. Дата обращения: 27 февраля 2007. Архивировано из оригинала 1 марта 2011 года. (англ.)
  4. Code Page Identifiers — Windows applications | Microsoft Docs. Дата обращения: 14 июля 2018. Архивировано 16 июня 2019 года.
  5. Well, I'm Back. String Theory (англ.). Robert O'Callahan (1 марта 2008). Дата обращения: 1 марта 2008. Архивировано 23 августа 2011 года.
  6. Ростислав Чебыкин. Всем кодировкам кодировка. UTF‑8: современно, грамотно, удобно. HTML и CSS. Дата обращения: 22 марта 2009. Архивировано 23 августа 2011 года.

Previous Page Next Page






صيغة التحويل الموحد-8 Arabic UTF-8 AZ UTF-8 Bulgarian ইউটিএফ-৮ Bengali/Bangla UTF-8 BS UTF-8 Catalan UTF-8 Czech UTF-8 CV UTF-8 Danish UTF-8 German

Responsive image

Responsive image