Pengkodean Windows 1251

Pada awal 90-an, ketika Uni Soviet runtuh dan perbatasan Rusia dibuka, kami mulai menerima produk perangkat lunak produksi Barat. Secara alami, mereka semua berbahasa Inggris. Pada saat yang sama, Internet mulai berkembang. Masalah Russifikasi sumber daya dan program telah menjadi akut. Kemudian penyandian Rusia Windows 1251 ditemukan. Ini memungkinkan Anda untuk menampilkan huruf-huruf alfabet Slavia dengan benar:

  • Rusia;
  • Ukraina;
  • Belarusia;
  • Serbia
  • Bulgaria
  • Makedonia.

Pengembangan dilakukan oleh kantor perwakilan Rusia Microsoft bersama dengan perusahaan "Dialog" dan "Paragraf". Dasarnya diambil pada pengembangan yang dibuat sendiri, yang pada 1990-91 beredar di antara beberapa ideolog TI di Rusia.

Sampai saat ini, cara yang lebih universal untuk menyandikan karakter telah dikembangkan - UTF-8 (Unicode). Ini mewakili hampir 90% dari semua perangkat lunak dan sumber daya web. Windows 1251 digunakan dalam 1,6% kasus. (Informasi Riset Survei Teknologi Web)

Pengkodean utf 8 atau Windows 1251?

Untuk menjawab pertanyaan ini, Anda perlu memahami sedikit apa itu pengkodean dan bagaimana perbedaannya. Informasi teks, dan juga yang lainnya, disimpan di komputer dalam bentuk yang disandikan. Lebih mudah bagi kita untuk menggambarkannya sebagai angka. Setiap karakter dapat menempati satu atau lebih byte. Windows 1251 adalah pengodean byte tunggal, dan UTF-8 adalah delapan byte. Ini berarti bahwa di Windows 1251, hanya 256 karakter yang dapat dikodekan..
Karena semuanya turun ke sistem biner, dan byte adalah 8 bit (0 dan 1), jumlah kombinasi maksimum adalah 28 = 256. Unicode memungkinkan Anda untuk mewakili jumlah karakter yang jauh lebih besar, dan ukuran yang lebih besar dapat dialokasikan untuk masing-masing.

Dari sini keuntungan Unicode mengikuti:

  1. Di header situs harus menunjukkan pengkodean yang digunakan. Kalau tidak, alih-alih karakter, "buaya" akan ditampilkan. Dan Unicode adalah standar untuk semua browser - mereka menangkapnya dengan cepat sebagai default.
  2. Simbol situs akan tetap sama, terlepas dari negara mana sumber daya itu dimuat. Ini tidak tergantung pada lokasi geografis dari server, tetapi pada bahasa perangkat lunak dari workstation klien. Seorang penduduk Portugal jelas menggunakan keyboard dan semua perangkat lunak, termasuk sistem operasi, dalam bahasa aslinya. Kemungkinan besar, tidak ada Windows 1251 di komputernya. Dan jika demikian, maka situs-situs berbahasa Rusia tidak akan terbuka dengan benar. Unicode, pada gilirannya, "kabel" ke OS apa pun dalam bahasa apa pun.
  3. UTF-8 memungkinkan Anda untuk menyandikan lebih banyak karakter. Saat ini 6 byte dari 8 digunakan, dan karakter Rusia dikodekan dalam dua byte.
    Itulah mengapa lebih disukai menggunakan pengkodean universal, daripada sangat terspesialisasi, yang hanya digunakan di negara-negara Slavik.

Tabel Pengodean Windows 1251

Untuk programmer dan pengembang situs web, mungkin perlu mengetahui nomor karakter. Untuk ini, tabel penyandian khusus digunakan. Di bawah ini adalah tabel untuk Windows 1251.

Apa yang harus dilakukan jika pengkodean baris perintah telah terbang?

Kadang-kadang Anda mungkin menghadapi situasi di mana karakter yang tidak dapat dimengerti ditampilkan pada baris perintah alih-alih Rusia. Ini berarti bahwa ada masalah dengan pengkodean baris perintah Windows 7. Mengapa 7? Karena, dimulai dengan versi ke-8, UTF-8 digunakan, dan di tujuh Windows 1251.
Perintah chcp 866 dapat membantu menyelesaikan masalah pada saat yang bersamaan. Sesi saat ini akan bekerja dengan benar. Tetapi untuk memperbaiki kesalahan secara dramatis, Anda memerlukan registri.

  1. Tekan Win + R dan ketik regedit. Ini akan memungkinkan Anda untuk masuk ke editor registri..
  2. Buka cabang HKEY_CURRENT_USER \ Console dan lihat berapa nilai CodePage. Kemungkinan besar, Anda akan melihat sesuatu selain 866 (opsi yang benar).
  3. Benar di 866 dalam Desimal.
  4. Tutup dan buka kembali baris perintah. Situasi harus diperbaiki.

Semoga harimu menyenangkan!