Читать курсовая по информатике, вычислительной технике, телекоммуникациям: "Поняття про WWW та мову програмування HTML" Страница 7

назад (Назад)скачать (Cкачать работу)

Функция "чтения" служит для ознакомления с работой. Разметка, таблицы и картинки документа могут отображаться неверно или не в полном объёме!

Щоб закодувати букви національних алфавітів, в тому числі російського, зберігши при цьому сумісність з таблицею ASCII, необхідно використати коди в діапазоні від 128 до 255. Ось тут-то і починаються складності.

Кодові таблиці для кодування букв російського алфавіта (кирилиця)

Існує досить багато різних кодових таблиць, співпадаючих в діапазоні кодів від 0 до 127 зі стандартом ASCII і використовуючих діапазон кодів від 128 до 255 для спеціальних символів і букв російського алфавіта. Серед них найбільш поширені наступні чотири:

1. Microsoft Windows Cyrillic code page 1251

Відома також як CP-1251 або Windows-1251. Найбільш широко застосовується в «русифікованих» системах Microsoft Windows 3.1, 95, 98 і NT.

2. KOI8-r

Базується на державному стандарті Коду Обміну Інформацією КОІ8 (ГОСТ 19768-74). Застосовується в основному на комп'ютерах з операційною системою UNIX. Прийнята за стандарт кодування російськомовних текстів при обміні по електронній пошті. Більшість WWW-серверів зберігають російськомовні документи в цьому кодуванні. У цей час є набори шрифтів для Microsoft Windows в кодуванні KOI8-r. Вони були розроблені спеціально для мережевих програм, працюючих під Windows.

3. CP-866 Microsoft/IBM code page 866

Відома також як «альтернативне кодування ГОСТа» (в деяких документах її означають Alt-GOST або alt). Застосовується в основному на персональних комп'ютерах IBM PC з операційною системою MS-DOS при роботі в текстовому режимі. Програми перегляду під DOS практично не використовуються (звичайно на IBM-сумісних машинах вони працюють під Microsoft Windows). Однак, ми згадуємо це кодування, оскільки текст WWW-документа можна створювати в текстовому редакторі, працюючому під DOS.

4. ISO-8859-5

Розташування російських букв в ній практично співпадає з так званим «основним кодуванням ГОСТа» (іноді можна зустріти її позначення як Main-GOST). Застосовується рідко, хоч і є міжнародним стандартом кодування російського алфавіта, зареєстрованим International Standards Organization (ISO).

Декілька особняком від вищепереліченого кодування стоїть кодування Unicode, яке, за задумом її розробників, що входять в так званий консорціум Unicode, повинне раз і назавжди вирішити проблему зберігання в текстових файлах символів будь-кого з існуючих на Землі систем писемності. На жаль, поки ще Unicode використовується вельми рідко.

При перенесенні файлів з текстами на російській мові з одного комп'ютера на інший, або навіть з однієї програми в іншу, досить часто виникає необхідність перекодування таких файлів. Для перекодування файлів використовують спеціальні програми.

Для читання документів на російській мові ви повинні встановити в програмі перегляду шрифт, що використовує одну з кодових таблиць, що містять букви російського алфавіта (кирилиця).

Узгодження кодування сервера і програми перегляду

Якщо спробувати прочитати російськомовний WWW-документ, закодований за допомогою однієї кодової таблиці, програмою перегляду, що використовує шрифти, розраховані на іншу таблицю, то російський текст буде виглядати як безглуздий набір знаків. Наприклад, слово Привіт!, вислане сервером в кодуванні KOI8-r, при використанні програмою перегляду шрифту в кодуванні Windows-1251 виглядає на екрані як рТЙЧіФ! Як же примусити сервер і програму перегляду настроїтися на яке-небудь одне кодування?

Іноді турботу про відповідність кодових таблиць сервера


Интересная статья: Основы написания курсовой работы