Ondalık sistemde Koi kodu tablosu 8. Lyubokhonskaya okulu. Bilişim dersi "Metin bilgilerinin kodlanması"

90'ların sonunda, bir karaktere bir değil iki bayt atayan yeni bir uluslararası Unicode standardı ortaya çıktı ve bu nedenle 256 değil 65536 farklı karakteri kodlamak için kullanılabilir. Unicode standardının eksiksiz belirtimi, dünyadaki tüm mevcut, tükenmiş ve yapay olarak oluşturulmuş alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.

Kodlama tablolarına dayalı olarak çeşitli kodlamalarda "bilgisayar" kelimesi için ondalık kod dizileri:

KOI8-R 252 247 237
CP1251 221 194 204
CP866 157 130 140
Mac 157 130 140
ISO 205 178 188

Açıklama sırasında kod tabloları projektör aracılığıyla gösterilir.

2. Karakter kodları MS Word kullanılarak da bulunabilir. (Ekle - Simge ... ) . Birkaç sayısal kod bulun ve anlamlarını CP1251 kod tablosundaki değerle karşılaştırın.


3. Not Defteri'ni açıyorum ve CP866 ve CP1251 tablolarını kodluyorum. Öğrenciler herhangi bir kısa kelimeyi adlandırır ve bu kelime, tuşa basarken CP866 ve CP1251 kodlarını kullanarak Not Defteri'ne yazılır. alternatif birinde, sonra başka bir kodlamada. Kodlar öğrenciler tarafından kod tablosunda aranarak aranır (CP866 kodlamasında kod yazılır, CP1251 kodlamasında kodun önüne sıfır yazılır, örneğin "Ж" - 198 kodu. Tuşa basıldığında alternatif 0198'i çevirin). Harfler her zaman kodsuz girilebilir, ancak Notepad gibi bir metin düzenleyicide bir tablo almanız gerekirse, kodsuz yapamazsınız. Tablonun öğeleri tablo kodunda mevcuttur.CP866. Bir örnek gösteriyorum. Ancak burada bir yazı tipi seçmek önemlidir. Tablonun altında listelenmiştir.

4. Herhangi bir Web sayfasını veya Rusça siteyi, örneğin bir okul sitesini açarım. Kodlamaları değiştiririm, sayfanın görünümünü karşılaştırırım.

IV. demirleme

Bilgisayardaki görevlere başlamadan önce, monitör ekranından gözlere olan mesafenin ne kadar olması gerektiğini hatırlayalım. (60-70cm). nasıl önlenir zararlı etki monitörden mi (Monitör ekranı temiz olmalıdır. Parmaklarınızla dokunmayın)

Sorular ve görevler:

1. Unicode kodlamadan (kodlama tablosu 65536 karakter içerir) Windows CP1251 kodlamaya (kodlama tablosu 256 karakter içerir) dönüştürüldüğünde, bir metin sayfasının bilgi hacmi kaç kez azalır? (2 kez)

2. 8 bitlik kodlamada BİLİŞİM kelimesini içeren metnin bilgi hacmi nedir? 16 bit kodlamada? (11 bayt, 22 bayt)

3. Ondalık kodla verilen aşağıdaki metinlerin kodunu çözün:
a) 087 111 114 100; (Kelime)
b) 068 079 083; (DOS)
c) 080 097 105 110 116 098 114 117 115 104. (boya fırçası)

4. CP1251 kodlamasında yazılan "disk" kelimesi diğer kodlamalarda nasıl görünecek?
(KOI8-R : DHYAY; CP866 : fshё; Mac : disk; ISO: fshёb)

5. Metin modunda, ekran genellikle her satırı 80 karakterden oluşan 25 satıra bölünür. Hacmi belirle metin bilgisi bu, monitörün tüm ekranını doldurur. (25 x 80 = 2000 bayt)

Ödevlerin metinleri her öğrencinin bilgisayarında "Coding. Assignments.doc" dosyasında bulunmaktadır.

Bunlara ek olarak. Not Defteri'nde herhangi bir tablo oluşturun. Yazı Tipi Lucida Konsolu.

V. Dersi özetlemek .

Alfabenin unsurları ve bunların yardımıyla elde edilen kelimelerin kelime uzunlukları kesin olarak tanımlanmışsa, tüm kodların sayısı hesaplanabilir ve bu nedenle bunların bir listesi bir kod tablosu şeklinde derlenebilir.

Böylece, kod tablosunda belirli sayıda satır ve yalnızca iki sütun bulunur:

  • bir sütun dijital (bizim durumumuzda ikili) kodlar içerir - alfabenin öğelerinin belirli bir sırayla düzenlenmiş kombinasyonları olarak "sözcükler";
  • başka bir sütunda - değerleri (dijital olmayan anlam, yani kod değerleri).

Tanım

kod tablosu bir dizi dijital (ikili) kod ve değerleridir.

Şimdiye kadar sayılar ve bu sayılardan elde edilen sayılarla konumsal bir notasyon sistemi kullanarak işlem yaptığımız gerçeğine dikkat etmekte fayda var. Şimdi bunun aslında kod tablosunun sadece yarısı olduğu ortaya çıktı. Aşağıdaki kod tablosunun ikinci yarısından bahsedeceğiz.

Kod tablosunun değerleri hakkında bilgi için bkz. Bu bölümün "Kod Tablosu Değerleri".

Bu arada bir kod tablosu oluşturmaktan bahsedelim.

Çözmemiz gereken ilk problem, satır sayısını nasıl belirleyeceğimizdir, yani önceki bölümde öğrendiğimiz gibi, önce basamak sayısını belirlememiz gerekir. Ancak şu soru ortaya çıkıyor: Bu nasıl belirlenir, hangi zorunluluk tarafından?

Öncelikle kodlamamız gereken değer sayısı hakkında ön bilgi sahibi olmamız gerekir. Sadece iki değeri kodlayacak olsaydık, örneğin "evet" ve "hayır" veya "siyah" ve "beyaz" (bu arada, çok gerçek bir görev), yani iki mesajdan oluşan bu tür bilgiler, o zaman sadece bir bit gereklidir (bir bit) ve karşılık gelen kod tablosu (Tablo 5.4) iki satırdan oluşacaktır.

Tablo 5.4. İki değer için kod tablosu.

ikili kodlar Kod Anlamları
0 "Evet!"
1 "HAYIR!"

Bu tablonun sadeliği, içinde yalnızca kod alfabesinin öğelerinin kullanılmasıyla belirlenir. Kodlanacak değerlerin ikiden fazla olduğu ortaya çıkarsa, bu durumda alfabenin öğeleri, uzunluğu bit derinliği ile belirlenen "kelimeler" halinde derlenir.

Örneğin, kodlama, genellikle "Bilmiyorum!" anketlerinde bulunan bir değerin eklenmesini gerektiriyorsa, bir rakam yeterli olmayacaktır. Bu durumu zaten tartıştık ve iki deşarj kullanmanın gerekli olduğunu biliyoruz (Tablo 5.5).

Kod sayısının hesaplanması hakkında bilgi için, bkz. Bu bölümün "Kod sayısının hesaplanması".

Tablo 5.5. Üç değer için kod tablosu.

metafor örneği

İkili rakamları "kutu" kelimesinin bir parçası olan hücreler biçiminde temsil edebilirsiniz. Bu hücreler boş olamaz, bir değer almaları gerekir, bu durumda "0" veya "1".

"11" kodu, bu durumda kullanılmasa da tabloda mutlaka mevcuttur, ancak kim bilir, belki bu kod başka bir durumda değerli bir uygulama bulacaktır.

Örnek

Bu tablonun devam etmesi gerekiyorsa, örneğin üç değer yerine (potansiyel olarak dört), altı değere ihtiyaç duyulacaktır, o zaman bu sadece basamak sayısını artırarak yapılabilir, çünkü belirli bir basamak sayısı ile (iki hane), kod tablosu yeni değer eklenmesine izin vermez. Ancak kaç rakam eklenmelidir? Bunu hesaplamak kolaydır: iki basamak yeterli değilse, o zaman üç koyarız. Üç basamak, sekiz satırlık bir tablo uzunluğu sağlar, yani gereğinden fazla. Yeni bir tablo oluşturuyoruz: içindeki ilk değer "000", son - "111" olacaktır.

Önemli Düşünce

Kod tablosunun uzunluğu, kodlama gerektiren bilgi miktarı tarafından belirlendiği için isteğe bağlı olabilir, ancak teknik uygulama olanaklarıyla sınırlandırılabilir.

Kod tablosunun uzunluğunun hesaplanması, tüm yapım prosedürünün neredeyse yarısıdır. Şimdi, her bir kodun anlamını belirleyen kod tablosunun ikinci kısmına daha fazla dikkat edilmelidir.

Yorum
Bununla birlikte, standart kod tabloları uzun süredir geliştirildiğinden, hazır teknolojileri (yazılım uygulamaları, genel kabul görmüş formatlar ve modlar) kullanan kullanıcıların bu tür hesaplamalarla uğraşmak zorunda kalmadıklarını belirtmek gerekir. Aynı zamanda, sınırlamaları, kural olarak, bilgisayar teknolojisinin altında yatan mantığın özelliklerine aşina olmayan insanlar arasında reddedilmeye neden olur. Örneğin, bir sanatçı için bilgisayar teknolojisinde neden 256 ton derecelendirmesi kabul edilirken, örneğin 7 veya 100 değil, tamamen anlaşılmaz olabilir.
.

Dosya biçimleri hakkında daha fazla bilgi için Bölüm III'e bakın.

Klavyede herhangi bir alfasayısal tuşa basmak, bilgisayara şu şekilde bir sinyal gönderilmesine neden olur: ikili numara, kod tablosu değerlerinden biridir.

kod tablosu bilgisayardaki karakterlerin dahili temsilidir.

\(I\)bilgisel \(I\)interchange için \(ASCII \)(\(A\)merican \(S\)standart \(C\)ode tablosu - Amerikan Standart Bilgi Değişim Kodu).

depo için ikili kod\(1\) bayt \(=\)\(8\)bit bir karakter için ayrılır. Her bitin \(1\) veya \(0\) değerini aldığı göz önüne alındığında, birler ve sıfırların olası kombinasyonlarının sayısı 2 8 = 256'dır.

Böylece \(1\) bayt kullanarak \(256\) farklı ikili kod birleşimleri elde edebilir ve bunları \(256\) farklı karakterleri görüntülemek için kullanabilirsiniz.

Bu kodlar \(ASCII\) tablosunu oluşturur.

Bu karakter kodlarının tablodaki gösterimini ve kullanım kolaylığını azaltmak için \(16\) karakter - \(10\\) rakam ve \(6\) Latin harflerinden oluşan onaltılık bir sayı sistemi kullanılmıştır:\ (A \), \ (B \ ), \(C\), \(D\), \(E\), \(F\). Karakterleri kodlarken, önce sütun basamağı, ardından verilen karakterin kesiştiği satırlar yazılır.

ASCII kodları

Örneğin, latin harf\(ASCII\) tablosundaki \(S\), onaltılık kod - \(53\) ile temsil edilir. \(S\) harfli bir tuşa bastığınızda, \(53\) onaltılı sayının ikili karşılığı olan \(01010011\) kodu bilgisayarın belleğine yazılır. Bu kod, her onaltılık basamağın ikili temsiliyle değiştirilmesiyle elde edilebilir. Bu durumda, \(5\) sayısı \(0101\) koduyla ve 3 sayısı \(0011\) koduyla değiştirilir. Ekranda \(S\) harfi görüntülendiğinde, bilgisayar kod çözme işlemini gerçekleştirir: bu ikili koda göre, karakterin bir görüntüsü oluşturulur.

Dikkat etmek!

\(ASCII\) tablosundaki herhangi bir karakter, \(8\) ikili basamaklarla veya \(2\) onaltılık basamaklarla kodlanır.

\(ASCII\) standardı, \(0\) ile \(127\) arasındaki ilk \(128 \) karakterleri kodlar: sayılar, Latin harfleri, kontrol karakterleri. Yukarıdaki tablo karakter kodlamasını onaltılık olarak gösterir.

İlk \(32\) karakterler kontrol karakterleridir ve esas olarak kontrol komutlarını iletmek için tasarlanmıştır. Amaçları, yazılım ve donanıma bağlı olarak değişebilir. Kod tablosunun ikinci yarısı (\(128\)'den \(255\)'e) Amerikan standardı tarafından tanımlanmamıştır ve ulusal alfabelerin sembolleri, sözde ve bazı matematiksel semboller için tasarlanmıştır. Farklı ülkeler, kod tablosunun ikinci yarısının farklı sürümlerini kullanabilir.

Karşılaştırma için, iki kodlama seçeneği için \(45\) sayısını dikkate alın.

Metinde kullanıldığında, bu sayı gösterimi için \(2\) bayt gerektirecektir, çünkü her basamak \(ASCII\) tablosuna göre kendi koduyla temsil edilecektir. Onaltılık sistemde kod \(3435\), ikili sistemde - \(00110100 00110101\) gibi görünecektir.

Hesaplamalarda kullanıldığında, bu sayının kodu özel çeviri kurallarına göre elde edilecek ve \(1\) bayt gerektirecek \(8\)-haneli ikili sayı \(00101101\) olarak sunulacaktır.

\(Unicode\) kodu artık yaygın olarak kullanılmaktadır. Bu kodlama çoğu tarafından desteklenir işletim sistemleri, tüm modern tarayıcılarda ve birçok programda.

\(Unicode\) standardı bir işbirliğiydi Uluslararası Standardizasyon Örgütü(\(ISO\)) önde gelen bilgisayar ve yazılım üreticileriyle. Dünyada \(6700\) yaşayan dil vardır, ancak bunların yalnızca \(50\) tanesi eyaletlerin resmi dilidir. Kullanılan betikler \(25\) civarındadır, bu da evrensel bir standart oluşturmayı mümkün kılar.

Bu komut dosyalarını kodlamak için \(16\)-bit aralığı (\(2\) karakter başına bayt), yani \(0000\) ila \(FFFF\) arası bir aralık yeterlidir. \(ASCII\) standardı, \(0000\) ila \(00FF\) aralığındaki kod alanında onurlu yerini alır.

Her komut dosyasının kendi kod bloğu vardır. Bugüne kadar, yaşayan tüm resmi komut dosyalarının kodlamasının tamamlanmış olduğu kabul edilir: olası \(65535\) konumdan yaklaşık \(29000\) konum dağıtılır.

Unicode kod tablosu

Son zamanlarda, \(Unicode\) konsorsiyumu, gezegenimizin herhangi bir ilgi alanına giren geri kalan betiklerini kodlamaya başladı: modern kullanımdan düşmüş ölü dillerin betikleri, Çince karakterler, yapay olarak oluşturulmuş alfabeler , vesaire.

\(16\)-bit kodlama artık bu kadar çeşitli dilleri temsil etmek için yeterli değildir ve bugün \(Unicode\) \(21\)-bit kod alanında (\(000000\)-\) uzmanlaşmaya başlamıştır. (10FFFF\)), düzlemler olarak adlandırılan \(16\) bölgelere ayrılmıştır.

benzer makaleler

2023 dvezhizni.ru. Tıbbi portal.