Koi tablica kodova 8 u decimalnom sistemu. Lyubhonskaya škola. Čas informatike "Kodiranje tekstualnih informacija"

Krajem 90-ih pojavio se novi međunarodni Unicode standard, koji dodjeljuje ne jedan bajt, već dva, jednom znaku, te se stoga može koristiti za kodiranje ne 256, već 65536 različitih znakova. Kompletna specifikacija Unicode standarda uključuje sve postojeće, izumrle i umjetno stvorene alfabete svijeta, kao i mnoge matematičke, muzičke, hemijske i druge simbole.

Nizovi decimalnih kodova za riječ "računalo" u različitim kodovima na osnovu tablica kodiranja:

KOI8-R 252 247 237
CP1251 221 194 204
CP866 157 130 140
Mac 157 130 140
ISO 205 178 188

Tablice kodova se prikazuju kroz projektor tokom objašnjenja.

2. Kodovi znakova se također mogu pronaći pomoću MS Worda. (Insert - Simbol ... ) . Pronađite nekoliko numeričkih kodova i uporedite njihovo značenje sa vrijednošću u tablici kodova CP1251.


3. Otvaram Notepad i tablice kodova CP866 i CP1251. Učenici imenuju bilo koju kratku riječ i ova riječ se upisuje u Notepad koristeći kodove CP866 i CP1251 dok pritiskaju tipku alt u jednom, pa u drugom kodiranju. Kodove pozivaju učenici, tražeći ih u tablici kodova (u CP866 kodiranju se upisuje kod, u CP1251 kodiranju se upisuje nula ispred koda, na primjer, kod "Ž" - 198. Kada se pritisne tipka alt pozovite 0198). Slova se uvijek mogu unositi bez kodova, ali ako trebate dobiti tabelu u uređivaču teksta kao što je Notepad, onda ne možete bez kodova. Elementi tabele dostupni su u tablici kodova.CP866. Pokazujem primjer. Ali ovdje je važno odabrati font. Naveden je ispod tabele.

4. Otvaram bilo koju web stranicu ili web stranicu na ruskom, na primjer, školsku stranicu. Mijenjam kodiranja, uporedim izgled stranice.

IV. Sidrenje

Prije nego započnemo zadatke na računaru, sjetimo se kolika bi trebala biti udaljenost od ekrana monitora do očiju. (60-70 cm). Kako izbjeći štetnog uticaja sa monitora? (Ekran monitora mora biti čist. Ne dirajte ga prstima)

Pitanja i zadaci:

1. Koliko puta će se smanjiti količina informacija stranice teksta kada se konvertuje iz Unicode kodiranja (tabela kodiranja sadrži 65536 znakova) u Windows CP1251 kodiranje (tabela kodiranja sadrži 256 znakova)? (2 puta)

2. Koliki je obim informacija teksta koji sadrži riječ INFORMATIKA u 8-bitnom kodiranju? u 16-bitnom kodiranju? (11 bajtova, 22 bajta)

3. Dešifrirajte sljedeće tekstove date u decimalnom kodu:
a) 087 111 114 100; (riječ)
b) 068 079 083; (DOS)
c) 080 097 105 110 116 098 114 117 115 104. (kist)

4. Kako će riječ "disk" napisana u CP1251 kodiranju izgledati u drugim kodovima?
(KOI8-R : DHYAY; CP866 : fshë; Mac : disk; ISO: fshëb)

5. U tekstualnom režimu, ekran je obično podeljen na 25 redova od 80 karaktera po redu. Odredite jačinu zvuka tekstualne informacije koji ispunjava ceo ekran monitora. (25 x 80 = 2000 bajtova)

Tekstovi zadataka dostupni su na računaru svakog studenta u datoteci "Kodiranje. Zadaci.doc"

Dodatno. Kreirajte bilo koju tabelu u Notepadu. Font Lucida Console.

V. Sumiranje lekcije .

Ako su elementi abecede i dužina riječi dobivenih uz njihovu pomoć strogo definirani, tada se može izračunati broj svih kodova, pa se stoga njihova lista može sastaviti u obliku tablice kodova.

Dakle, tabela kodova ima određeni broj redaka i samo dva stupca:

  • jedna kolona sadrži digitalne (u našem slučaju binarne) kodove - "riječi", kao kombinacije elemenata abecede, raspoređenih u određenom nizu;
  • u drugoj koloni - njihove vrijednosti (nedigitalno značenje, tj. vrijednosti koda).

Definicija

tablica kodova je skup digitalnih (binarnih) kodova i njihovih vrijednosti.

Vrijedi obratiti pažnju na činjenicu da smo do sada radili s brojevima i brojevima dobivenim iz ovih brojeva korištenjem sistema pozicijskih notacija. Sada se pokazalo da je to zapravo samo polovina tablice kodova. U nastavku ćemo govoriti o drugoj polovini tablice kodova.

Za informacije o vrijednostima tablice kodova, pogledajte odjeljak. "Vrijednosti tablice kodova" ovog poglavlja.

U međuvremenu, hajde da pričamo o izradi tablice kodova.

Prvi problem koji moramo riješiti je kako odrediti broj redova, odnosno prvo trebamo odrediti broj cifara, kao što smo saznali u prethodnom dijelu. Ali postavlja se sljedeće pitanje: kako se to određuje, kojom nužnošću?

Prije svega, moramo imati preliminarne informacije o broju vrijednosti koje moramo kodirati. Ako bismo kodirali samo dvije vrijednosti, na primjer, "da" i "ne" ili "crno" i "bijelo" (usput, vrlo stvaran zadatak), odnosno takvu informaciju koja se sastoji od dvije poruke, onda samo potreban je jedan bit (jedan bit), a odgovarajuća kodna tabela (tabela 5.4) će se sastojati od dva reda.

Tabela 5.4. Tabela kodova za dvije vrijednosti.

Binarni kodovi Značenja koda
0 "Da!"
1 "Ne!"

Jednostavnost ove tabele određena je činjenicom da se u njoj koriste samo elementi kodne abecede. Ako se ispostavi da su vrijednosti koje treba kodirati više od dvije, tada se u ovom slučaju elementi abecede sastavljaju u "riječi", čija je dužina određena dubinom bita.

Na primjer, ako kodiranje zahtijeva dodavanje vrijednosti koja je obično prisutna u upitnicima "Ne znam!", tada jedna cifra neće biti dovoljna. O ovoj situaciji smo već govorili i znamo da je potrebno koristiti dva pražnjenja (tabela 5.5).

Za informacije o izračunavanju broja kodova, pogledajte odjeljak. "Izračunavanje broja kodova" ovog poglavlja.

Tabela 5.5. Tabela kodova za tri vrijednosti.

primjer metafore

Možete predstaviti binarne cifre u obliku ćelija koje su dio riječi-"kutije". Ove ćelije ne mogu biti prazne, moraju primiti neku vrijednost, u ovom slučaju "0" ili "1".

Šifra "11" je nužno prisutna u tabeli, iako se u ovom slučaju ne koristi, ali ko zna, možda će ovaj kod u nekoj drugoj situaciji naći dostojnu primjenu.

Primjer

Ako treba nastaviti ovu tabelu, na primjer, umjesto tri vrijednosti (potencijalno četiri), bit će potrebno šest vrijednosti, onda se to može učiniti samo povećanjem broja znamenki, jer sa datim brojem znamenki (dvije cifre), tabela kodova ne dozvoljava dodavanje novih vrijednosti. Ali koliko cifara treba dodati? Ovo je lako izračunati: ako dvije cifre nisu dovoljne, onda stavljamo tri. Tri cifre daju dužinu tabele od osam redova, odnosno više nego što je potrebno. Gradimo novu tabelu: prva vrijednost u njoj će biti "000", posljednja - "111".

Važna misao

Dužina tablice kodova može biti proizvoljna, jer je određena količinom informacija koje zahtijeva kodiranje, ali može biti ograničena mogućnostima tehničke implementacije.

Proračun dužine tablice kodova je skoro polovina cjelokupne procedure za njenu konstrukciju. Sada više pažnje treba posvetiti drugom dijelu tablice kodova, koji određuje značenje svakog koda.

Komentar
Međutim, treba napomenuti da korisnici koji koriste gotove tehnologije (softverske aplikacije, općeprihvaćeni formati i modovi) ne moraju se baviti takvim proračunima, budući da su standardne tablice kodova odavno razvijene. Istovremeno, njihova ograničenja, po pravilu, izazivaju odbijanje kod ljudi koji nisu upoznati sa posebnostima logike koja leži u osnovi računarske tehnologije. Na primjer, umjetniku može biti potpuno neshvatljivo zašto je u kompjuterskoj tehnologiji prihvaćeno 256 gradacija tonova, a ne 7 ili 100
.

Pogledajte dio III za više informacija o formatima datoteka.

Pritiskom na bilo koji alfanumerički taster na tastaturi se računaru šalje signal u obliku binarni broj, što je jedna od vrijednosti kodne tablice.

tablica kodova je interni prikaz znakova u računaru.

Tabela \(ASCII \)(\(A\)američka \(S\)standardna \(C\)oda za \(I\)nformacionu \(I\)nterpromenu - Američki standardni kod za razmjenu informacija).

za skladištenje binarni kod\(1\) bajtova \(=\)\(8\)bitova su dodijeljeni za jedan znak. S obzirom da svaki bit ima vrijednost \(1\) ili \(0\), broj mogućih kombinacija jedinica i nula je 2 8 = 256 .

Dakle, koristeći \(1\) bajtova, možete dobiti \(256\) različite kombinacije binarnog koda i koristiti ih za prikaz \(256\) različitih znakova.

Ovi kodovi čine \(ASCII\) tabelu.

Da bi se smanjila notacija i jednostavnost upotrebe ovih znakovnih kodova u tabeli, koristi se heksadecimalni brojevni sistem koji se sastoji od \ (16 \) znakova - \ (10 ​​\) znamenki i \ (6 \) latiničnih slova: \ (A \), \ (B \ ), \(C\), \(D\), \(E\), \(F\). Prilikom kodiranja znakova prvo se upisuje cifra kolone, a zatim linije na čijem se presjeku nalazi dati znak.

ASCII kodovi

Na primjer, latinično pismo\(S\) u \(ASCII\) tabeli je predstavljen heksadecimalnim kodom - \(53\). Kada pritisnete tipku sa slovom \(S\), kod \(01010011\), koji je binarni ekvivalent heksadecimalnom broju \(53\), upisuje se u memoriju računara. Ovaj kod se može dobiti zamjenom svake heksadecimalne cifre svojim binarnim prikazom. U ovom slučaju, broj \(5\) je zamijenjen kodom \(0101\), a broj 3 je zamijenjen kodom \(0011\). Kada je slovo \(S\) prikazano na ekranu, računar vrši dekodiranje: na osnovu ovog binarnog koda gradi se slika karaktera.

Obrati pažnju!

Svaki znak u \(ASCII\) tabeli je kodiran sa \(8\) binarnim znamenkama ili \(2\) heksadecimalnim znamenkama.

Standard \(ASCII\) kodira prvih \(128 \) znakova od \(0\) do \(127\): brojeve, latinična slova, kontrolne znakove. Gornja tabela prikazuje heksadecimalno kodiranje znakova.

Prvi \(32\) znakovi su kontrolni znakovi i namijenjeni su uglavnom za prijenos kontrolnih naredbi. Njihova svrha može varirati ovisno o softveru i hardveru. Druga polovina kodne tabele (od \(128\) do \(255\)) nije definisana američkim standardom i namenjena je simbolima nacionalnih abeceda, pseudografskim i nekim matematičkim simbolima. Različite zemlje mogu koristiti različite verzije druge polovine tablice kodova.

Za poređenje, razmotrite broj \(45\) za dvije opcije kodiranja.

Kada se koristi u tekstu, ovaj broj će zahtijevati \(2\) bajta za svoju reprezentaciju, jer će svaka cifra biti predstavljena svojim kodom u skladu sa \(ASCII\) tablicom. U heksadecimalnom sistemu, kod će izgledati kao \(3435\), u binarnom sistemu - \(00110100 00110101\).

Kada se koristi u proračunima, kod ovog broja će biti dobijen prema posebnim pravilima prevođenja i predstavljen kao \(8\)-cifreni binarni broj \(00101101\), koji će zahtijevati \(1\) bajtova.

Kod \(Unicode\) se sada široko koristi. Ovo kodiranje podržava većina operativni sistemi, u svim modernim pretraživačima i mnogim programima.

Standard \(Unicode\) je bio saradnja Internacionalna Organizacija za Standardizaciju(\(ISO\)) sa vodećim proizvođačima računara i softvera. U svijetu postoji \(6700\) živih jezika, ali samo \(50\) su službeni jezici država. Korištene skripte su oko \(25\), što omogućava stvaranje univerzalnog standarda.

Za kodiranje ovih skripti dovoljan je \(16\)-bitni opseg (\(2\) bajta po karakteru), odnosno raspon od \(0000\) do \(FFFF\). Standard \(ASCII\) zauzima svoje počasno mjesto u kodnom prostoru u rasponu od \(0000\) do \(00FF\).

Svaka skripta ima svoj blok kodova. Do danas se kodiranje svih živih službenih skripti smatra završenim: distribuirano je oko \(29000\) pozicija od \(65535\) mogućih.

Unicode tablica kodova

Nedavno je konzorcij \(Unicode\) počeo s kodiranjem ostatka pisama naše planete koja su od bilo kakvog interesa: pisma mrtvih jezika koja su izašla iz moderne upotrebe, kineska slova, umjetno stvorena pisma , itd.

\(16\)-bitno kodiranje više nije dovoljno za predstavljanje takve raznolikosti jezika, a danas je \(Unicode\) već počeo da ovlada \(21\)-bitnim prostorom koda (\(000000\)-\ (10FFFF\)), koja je podijeljena na \(16\) zona, koje se nazivaju ravni.

Slični članci

2023 dvezhizni.ru. Medicinski portal.