Ascii tablični binarni kod. ASCII kodiranje

Kada je formiran ASCII, kontrolni znakovi svojstveni teletipovima i pisaćim mašinama bili su uključeni na početku kodiranja, a s vremenom su se tamo čvrsto osušili, iako se praktički ne koriste u 21. stoljeću.

Evo nekih detalja o ASCII kodiranju:

ASCII(engleski) A merican s tandard c haljina za i informacije i nterchange, [ˈæs.ki]) je naziv tabele (kodiranja, skupa) u kojoj su numerički kodovi dodijeljeni nekim uobičajenim štampanim znakovima i znakovima koji se ne mogu ispisati. Tabela je razvijena i standardizovana u SAD 1963. godine. Naziv "ASCII" na ruskom se često izgovara kao [ pitati(e) i].

ASCII tabela definiše kodove za znakove:

  • decimalne cifre;
  • latinica;
  • nacionalno pismo;
  • znakovi interpunkcije;
  • kontrolni znakovi.

Priča

U početku (1963.) ASCII je razvijen za kodiranje znakova čiji se kodovi uklapaju u 7 bitova (128 karaktera; 27 = 128), dok je najznačajniji 7. bit (numeracija od nule) korišten za kontrolu grešaka koje su se dogodile tokom prijenosa podataka.

Vremenom je kodiranje prošireno na 256 karaktera (28=256); kodovi prvih 128 znakova nisu promijenjeni. ASCII je počeo da se doživljava kao polovina 8-bitnog kodiranja, a "prošireni ASCII" je nazvan ASCII sa uključenim 8. bitom (na primer, KOI-8).

Preklapanje simbola

Koristeći backspace (BS) znak (backspace) na štampaču, možete odštampati jedan znak iznad drugog. U ASCII-u možete dodati dijakritičke znakove slovima na isti način, na primjer:

  • a BS' → a
  • a BS ` → a
  • a BS ^ → â
  • o BS / → ø
  • c BS , → ç
  • n BS ~ → ñ

Bilješka: u starijim fontovima, apostrof "'" je nacrtan koso ulijevo (uporedi "`" i "´"), a tilda "~" je pomaknuta prema gore (uporedi "~" i "˜"), tako da su taman za uloge likova akutni "´" i "tilda iznad".

Ako dvaput odštampate isti znak na istoj poziciji, dobićete podebljani znak. Ako upišete znak na jednoj poziciji, a zatim donju crtu "_", dobićete podvučeni znak.

  • a BS a → a
  • a BS _ → a

Ova tehnika se još uvijek koristi, na primjer, u sistemu pomoći za čovjeka.

Nacionalne varijante ASCII-a

Standard ISO 646 (ECMA-6) predviđa mogućnost postavljanja nacionalnih znakova u ASCII. Da biste to učinili, predlaže se zamijeniti znakove "@", "[", "\", "]", "^", "`", "(", "Okomita traka", ")", "~ ". Takođe, umjesto znaka funte "#" može se staviti simbol funte "£", a na mjesto simbola dolara "$" - znak valute "¤". Ovaj sistem je vrlo pogodan za evropske jezike, jer koriste latinične znakove i samo nekoliko dodatnih znakova. Varijanta ASCII-a koja ne sadrži nacionalne znakove naziva se "US-ASCII" ili "međunarodna referentna verzija".

Za neke jezike s nelatinskim pismom (ruski, grčki, arapski, hebrejski) postojale su radikalnije modifikacije ASCII. U jednoj od ovih modifikacija, umjesto malih latiničnih slova, postavljeni su nacionalni simboli (za ruski i grčki - velika slova). Još jedna modifikacija predviđena za prebacivanje između US-ASCII i nacionalne varijante; prebacivanje je izvršeno "u hodu" - pomoću znakova SO (eng. s hift o ut) i SI (eng. s hift i n); u ovom slučaju, u nacionalnoj verziji, bilo je moguće potpuno zamijeniti pisma na nacionalne simbole. Vidi također: KOI-7.

Nakon toga se pokazalo prikladnijim za korištenje 8-bitnih kodiranja (kodnih stranica), u kojima donju polovicu kodne tablice (0-127) zauzimaju US-ASCII znakovi, a gornju polovinu (128-255 ) zauzimaju dodatni znakovi, uključujući nacionalni skup znakova.

Dakle, gornja polovina ASCII tabele, pre širokog usvajanja Unicode-a, bila je u velikoj meri korišćena za predstavljanje lokalizovanih znakova, slova lokalnog jezika.

Nedostatak jedinstvenog standarda za postavljanje ćiriličkih znakova u ASCII tablicu uzrokovao je mnoge probleme sa kodiranjem (KOI-8, Windows-1251, itd.). Drugi jezici s nelatinskim pismom također su patili zbog prisustva nekoliko različitih kodiranja.

Prvih 128 znakova Unicode standarda su isti kao i odgovarajući US-ASCII znakovi.

ASCII tabela

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
0. NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1. DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ITD FS GS RS US
2. ! « # $ % & ( ) * + , - . /
3. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4. @ A B C D E F G H I J K L M N O
5. P Q R S T U V W X Y Z [ \ ] ^ _
6. ` a b c d e f g h i j k l m n o
7. str q r s t u v w x y z { | } ~ DEL

U prvoj verziji ASCII standarda (1963.), pozicije 0x5e (94) i 0x5f (95) korišćene su za znakove strelice nagore i nalevo. Standard ECMA-6 (1965.) ih je zamijenio znakom za umetanje (koji se također koristi kao cirkumfleksni znak "^") i znakom donje crte "_", respektivno.

Kontrolni znakovi

ASCII tabela je kreirana za razmjenu informacija preko teletipa. Set je uključivao znakove koji se ne mogu štampati i koji se koriste kao komande za kontrolu teletip uređaja. Slične komande korišćene su iu drugim predračunarskim alatima za razmenu poruka (Morzeov kod, semaforska abeceda), uzimajući u obzir specifičnosti uređaja.

  • NUL, 00 - null, prazno. Null karakter je uvijek bio zanemaren. Na bušenim trakama, broj "1" je bio označen rupom, a broj "0" bio je označen odsustvom rupe. Dijelovi bušene trake na kojima nisu zabilježeni podaci nisu sadržavali rupe, odnosno sadržavali su nulte znakove; takvi dijelovi su se nalazili na početku i na kraju trake. Null karakter se i danas koristi u mnogim programskim jezicima kao znak kraja reda, a označava se sa "\0". (Izraz "string" odnosi se na niz znakova.) Na nekim operativnim sistemima, null je posljednji znak bilo koje tekstualne datoteke.

Poruke koje se prenose komunikacijskim kanalom podijeljene su u dva dijela:

  • "naslov";
  • "tekst".

"Zaglavlje" je sadržavalo adrese pošiljaoca i primaoca, kontrolnu sumu, itd., moglo se postaviti prije "teksta" ili poslije. Termin "tekst" bio je dio poruke namijenjen za štampanje.

  • SOH, 01 - s tart o f h eading, početak "zaglavlja".
  • STX, 02 - s tart of t e x t, početak "teksta". Simbol je korišten kao naredba za uključivanje teletip štampača. Tekst za štampanje nalazio se između znakova STX i ETX.
  • ETX, 03 - e nd of t e x t, kraj "teksta". Simbol je korišten za isključivanje teletip štampača. Ovih dana, kod 03 se koristi za slanje SIGINT signala procesu. sig nal int break) i može se poslati pritiskom na kombinaciju tipki Ctrl + C. Po prijemu takvog signala, proces mora izaći.
  • EOT, 04 - e nd o f t prijenos, kraj prijenosa. Simbol koriste emulatori terminala za označavanje kraja datoteke (EOF). e nd o f f ile) i može se poslati pritiskom na kombinaciju tipki Ctrl + D. Nakon što primi takav znak, emulator terminala će otkriti proces koji se trenutno izvodi na terminalu i postaviti oznaku kraja datoteke (EOF) na standardni ulaz (stdin). st andar d in stavi stream) ovog procesa. Kao rezultat, proces će prestati čitati stdin i početi obraditi pročitane podatke.
  • ENQ, 05 - enqžica. "Molim potvrdite."
  • ACK, 06 - ack sada ledge. "Potvrđujem." Simbol NAK znači suprotno - "ne potvrdi".
  • BEL, 07 - Bel Ja, zvono, bip. Znak se često predstavlja kao "\a" i koristi se za zvučni signal. U modernom računaru zvuk se reprodukuje preko ugrađenog zvučnika. Na primjer, sljedeće komande mogu reproducirati zvuk: echo -e "\a" ili echo -e "\007" (bash); echo ^G (cmd.exe ; pritisnite Ctrl + G da otkucate ^G), printf("\a"); (kod u C programskom jeziku).
  • BS, 08 - b ack s tempo, vrati jedan znak. Tipka ← Backspace se koristi za brisanje prethodnog znaka.
  • TAB, 09 - t ab, horizontalni jezičak. Označeno kao "\t". Ponekad se naziva HT sa engleskog. h horizontalno t abulacija.
  • LF, 0A - l ine f eed, red feed. Naredba za spuštanje nosača pisača jedan red dolje. Znak se koristi za označavanje kraja reda u tekstualnoj datoteci u UNIX-u. Niz znakova CR LF označava kraj reda u tekstualnoj datoteci u Windowsu. Simbol u mnogim programskim jezicima označen je kao "\n". Pritiskom na tipku ↵ Enter dok se prikazuje tekst rezultira prijelom reda.
  • VT, 0B - v vertikalno t ab, vertikalni jezičak.
  • FF, 0C - f orm f eed, stranica feed, nova stranica. Komanda za štampač je da nastavi štampanje od početka sledećeg lista.
  • CR, 0D - c arriage r povratak, povratak kočije. Naredba za pisač: nastavi s ispisom od početka tekućeg reda (ne iz novog reda). U mnogim programskim jezicima, CR karakter je označen kao "\r". Na Mac OS-u, CR znak označava kraj reda u tekstualnoj datoteci. Sa tastature, CR znak se može uneti pritiskom na kombinaciju tastera Ctrl + M.
  • SO, 0E - s hift o u, prebacite na drugu traku. Druga traka je obično bila obojena crvenom bojom. U budućnosti je simbol korišten za prebacivanje na nacionalno kodiranje.
  • SI, 0F - s hift i n. Naredba za izvođenje obrnute radnje SO: prebacivanje na izvornu traku ili prebacivanje na izvorno kodiranje.
  • DLE, 10 - d ata l mastilo e scape, oslobađajući kanal podataka. Svi znakovi koji slijede DLE trebaju se tretirati kao podaci, a ne kontrolni znakovi.
  • DC1, 11 - d evice c kontrolu 1 , 1. kontrolni znak uređaja. Naredba: uključite čitač bušene trake.
  • DC2, 12 - d evice c kontrolu 2 , 2. kontrolni znak uređaja. Naredba: uključite bušilicu.
  • DC3, 13 - d evice c kontrolu 3 , 3. kontrolni znak uređaja. Naredba: isključite čitač bušene trake.
  • DC4, 14 - d evice c kontrolu 4 , 4. kontrolni znak uređaja. Naredba: isključite puncher.
  • NAK, 15 - n negativan a c k saznanja, ne potvrđujem. Obrnuti znak ACK .
  • SYN, 16 - sin kronizacija. Ovaj znak je poslan kada je nešto trebalo poslati na sinhronizaciju.
  • ETB, 17 - e nd of t lok b zaključavanje, kraj tekstualnog bloka. Ponekad je tekst bio podijeljen na blokove iz tehničkih razloga.
  • CAN, 18 - mogu cel, poništiti (ono što je prije prošlo).
  • EM, 19 - e nd of m edijum, kraj medija (od bušene trake, papira, itd.)
  • SUB, 1A- sub zamena, zamena. Simbol se stavlja na mjesto simbola čije je značenje izgubljeno ili oštećeno tokom prijenosa. Ili, znak se stavlja ispred znaka čija interpretacija zahtijeva prebacivanje na dodatni skup znakova. Ili se znak stavlja ispred znaka koji treba odštampati u drugoj boji. Trenutno se znak ubacuje pritiskom na kombinaciju tastera Ctrl + Z i koristi se za označavanje kraja datoteke u DOS-u i Windows-u.
  • ITD, 1B- itd majmun. Znak koji slijedi nakon ESC znaka ima neko drugo značenje od onog definiranog u ASCII-u. Escape znakovi obično slijede ESC znak. U DOS-u ih implementira drajver ANSI.SYS

Podržano je razdvajanje podataka na 4 nivoa:

  • poruka bi se mogla sastojati od fajlova;
  • fajlovi se mogu sastojati od grupa;
  • grupe se mogu sastojati od unosa;
  • evidencija bi se mogla sastojati od jedinica.
  • FS, 1C- f ile s separator, separator fajlova.
  • GS, 1D - g red s separator, separator grupa.
  • RS, 1E- r ecord s separator, separator zapisa.
  • US, 1F- u nit s separator, separator jedinice.
  • DEL, 7F- del ete, obrišite zadnji znak. Simbol DEL, koji se sastoji od binarnog koda svih jedinica, mogao bi "zakucati" bilo koji simbol. Uređaji i programi su ignorisali DEL kao i NUL. Kod ovog znaka dolazi od prvih procesora teksta sa memorijom na bušenoj traci: kod njih je do brisanja znaka dolazilo tako što se njegov kod „zabija“ rupama (što označava logičke jedinice).

Strukturna svojstva stola

  • Kodovi znakova brojeva "0" - "9" u binarnom brojevnom sistemu počinju sa 00112, a završavaju se binarnim vrijednostima brojeva. Na primjer, 01012 je broj 5, a 0011 01012 je znak "5". Znajući ovo, možete pretvoriti binarne decimalne (BCD) brojeve u ASCII niz jednostavnim dodavanjem 00112 lijevo od svakog BCD grickanja.
  • Slova "A" - "Z" velikih i malih slova razlikuju se u svom predstavljanju za samo jedan bit, što pojednostavljuje konverziju velikih i malih slova i provjeru da li kod pripada rasponu vrijednosti. Slova su predstavljena njihovim serijskim brojevima u abecedi, napisanim kao pet cifara u binarnom sistemu, kojima prethodi 0102 (za velika slova) ili 0112 (za mala slova).

Kompjutersko predstavljanje ASCII-a

Na velikoj većini modernih računara, minimalna adresabilna jedinica memorije je 8-bitni bajt. Stoga se ovdje koriste 8-bitni umjesto 7-bitni znakovi. Obično ASCII znak proširiti na 8 bita jednostavnim dodavanjem jednog bita nula kao najznačajnijeg.

ASCII kodovi se koriste u programiranju kao međuplatformski kodovi za pritiskanje tipki (za razliku od IBM PC kodova za skeniranje i drugih internih kodova).

Za raspored QWERTY tastature, tabela kodova izgleda kao ona prikazana u sljedećoj tabeli:

Bijeg F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 Print Screen scroll lock Pauza
1 2 3 4 5 6 7 8 9 0 - =+ back space Insert Dom Page Up Num Lock / dodati. * dodati. + dodaj.
Tab Q W E R T Y U I O P [ ] Izbriši kraj Page Down 7 dodatnih 8 extra 9 statista
cap lock A S D F G H J K L ;i „e Enter 4 dodatna 5 dodatnih 6 dodatnih Unesite add.
Shift Z X C V B N M ,< .> / Shift \| Gore 1 extra 2 dodatna 3 dodatna
ctrl pobijediti alt Space Bar alt pobijediti lista ctrl lijevo Dole U redu Ins/0 Del/.

46/110

Na ovom rasporedu tastature nema ruskih slova, a ima i nekih netačnosti, ali se glavne karakteristike odražavaju.

Pozivam sve da govore

KODIRANJE TEKSTNIH INFORMACIJA. ASCII ENCODING. GLAVNA KORIŠTENA ĆIRILIČNA KODIRANJA

Svaki tekst je niz znakova neke abecede. Ako je svaki znak korištene abecede kodiran kao broj, tada će tekst biti predstavljen kao niz brojeva. Prilikom obrade teksta, kompjuter koristi binarni prikaz brojeva.

Da biste ispravno protumačili kodirani tekst, morate znati gdje se nalazi binarni kod počinje jedan znak izvorne abecede i binarni kod drugog. Moguće je kodirati svaki znak nizom od 8 bita - jedan bajt.

U osam bitova možete napisati 28 = 256 različitih cijelih brojeva binarni brojevi- od 000000002 do 111111112 . Ovo je dovoljno da uskladi svako veliko i malo slovo engleske i ruske abecede, sve arapske brojeve, interpunkcijske znakove, neke druge potrebne znakove, kao i servisne kodove za prijenos podataka, sa jedinstvenom (neponovljivom) osmobitnom oznakom .

Radi praktičnosti digitalnog kodiranja i naknadnog dekodiranja, sastavljaju se tablice kodova. On različite vrste računari sa različitim operativnim sistemima koriste različite tablice kodova. Jedan od standarda za kodiranje znakova kompjuterske tastature sa 8-bitnim brojevima je ASCII (Američki standardni kod za razmenu informacija) kodna tabela. Njegova prva polovina (šifre 0-127), koja sadrži znakove interpunkcije, arapske brojeve i engleske znakove, po konvenciji je općenito prihvaćena u cijelom svijetu. Kodovi 128 - 255 ASCII tabele (prošireni ASCII - kodovi) koriste se uglavnom za nacionalna pisma.

Tabelu kodova možete reproducirati upisivanjem željenog broja od 0 do 255 na malu numeričku tastaturu dok pritiskate taster Alt. Slika 1 prikazuje tabelu kodova dobijenu na ovaj način.

♫ ☼ ◄ ↕

← ∟ ↔

M N O P R S T U V

T W W W Y Y L E Y

Slika 1 - Tabela kodova

Kod se formira od broja reda i broja kolone. Na primjer, kod 50 odgovara broju 2, kod 134 odgovara slovu Zh. Kodovi od 0 do 32 su servisni kodovi.

Prisutnost mnogih varijanti kodnih tablica, orijentiranih na upotrebu alfabeta različitih nacionalnih jezika, samo po sebi predstavlja veliku neugodnost. Za naručivanje, stolovima su se počeli dodeljivati ​​posebni nazivi, brojevi (npr.

KOI-8), ali to nije riješilo problem stvaranja jedinstvenog kodnog sistema koji kombinuje različita nacionalna pisma.

Otklanjanje ovih neugodnosti i ograničenja postalo je moguće zahvaljujući novom međunarodnom standardu Unicode, podržanom najnovijim verzijama. operativni sistem Microsoft Windows. Trenutno, ovaj standard za kodiranje karaktera dodjeljuje dva bajta po karakteru. Ovo kodiranje vam omogućava da predstavite 216 = 65,536 različitih znakova u binarnoj abecedi. Kodovi prvih 128 znakova su isti kao ASCII.

OBIM INFORMACIJA PORUKA

IZAZOVI SA REŠENJAMA

Zadatak. Pretpostavimo da je svaki znak kodiran sa 1 bajtom (KOI-8). Procijenite količinu informacija poruke

Znam pravila za sabiranje binarnih brojeva.

Poruka sadrži 39 znakova, tako da je za kodiranje potreban 1 bajt/znak *39 znakova = 39 bajtova,

ili 8 bita/bajt * 39 bajtova = 312 bita.

1 . U poruci iz prethodnog primjera riječ "binarni" zamijenjena je riječju "decimalno". Kako se promijenio obim informacija poruke u bitovima i bajtovima?

Odgovor: količina informacija poruke je povećana za 2 bajta, za 16 bita.

2. Pretpostavimo da je svaki znak kodiran sa 1 bajtom (KOI-8). Procijenite količinu informacija poruke

Mogu procijeniti informativni obim poruke.

Odgovor: količina informacija poruke je 48 bajtova.

3 . Pretpostavimo da je svaki znak kodiran u 2 bajta (Unicode). Procijenite količinu informacija poruke

Znam da je takvo kodiranje COI-8.

Odgovor: količina informacija poruke je 68 bajtova.

4 . Pretpostavimo da je svaki znak kodiran u 2 bajta (Unicode). Procijenite količinu informacija poruke

Algoritam se može napisati na prirodnom jeziku.

Odgovor: količina informacija poruke je 92 bajta.

5 . Informativna poruka na ruskom jeziku, prvobitno napisana u 16-bitnom Unicode kodu, prekodirana je u 8-bitno KOI-8 kodiranje. U ovom slučaju, informativna poruka se smanjila za 480 bita. Kolika je dužina poruke u znakovima?

Odgovor: Dužina poruke je 60 karaktera.

6. Informativna poruka na ruskom jeziku, prvobitno napisana u 8-bitnom KOI-8 kodu, prekodirana je u 16-bitni Unicode kodiranje. Istovremeno, volumen informativne poruke je povećan za 568 bita. Kolika je dužina poruke u znakovima?

Odgovor: Dužina poruke je 71 karakter.

7. Informativna poruka na ruskom jeziku, prvobitno napisana u 8-bitnom KOI-8 kodu, prekodirana je u 16-bitni Unicode kodiranje. Kako se promijenio sadržaj poruke?

Odgovor: volumen informativne poruke je povećan za 2 puta.

8 . Koliko znakova sadrži poruka, čiji je obim informacija u Unicode-u 200 bita?

Odgovor: Poruka sadrži 25 karaktera.

9 . Koliko znakova sadrži poruka, čiji je obim informacija u KOI-8 kodiranju 240 bita?

Odgovor: Poruka sadrži 30 karaktera.


KODIRANJE I DEKODIRANJE INFORMACIJA

IZAZOVI SA REŠENJAMA

1. Za kodiranje slova A, B, C, G koristite četverobitne binarne kodove od 1000 do 1011, respektivno. Za niz znakova B, D, C, A, napišite binarni kod, predstavite rezultat kodiranja u oktalnom kodu.

Kodovi znakova su predstavljeni u tabeli 1: Tabela 1

Odgovarajući binarni kod sadrži 16 znamenki: 1001101110101000, zgodnije je napisati ovaj broj za konverziju u oktalni kod razbijen na trijade: 1 001 101 110 101 000. Jasno je da odgovarajući oktalni broj11 ima sljedeći oblik: 501 .

Za pretvaranje broja predstavljenog u binarnom obliku u heksadecimalni, zgodno je razbiti binarni zapis u tetrade (grupe od 4 znamenke), počevši s desne strane.

2. Za 5 slova ruske abecede dati su njihovi binarni kodovi koji mogu sadržavati 2 ili 3 cifre. Šifre su zapisane u tabeli 3:

1) 110100000100110111

2) 101010000010010011

3) 110100001001100111

4) 110110000100110010.

Hajdemo sekvencijalno dekodirati svaku od četiri poruke, dijeleći je na grupe cifara u skladu sa tablicom 3:

1) 11 01 000 001 001 10 111 Znak se ne može uskladiti sa posljednjom grupom cifara

prema tabeli 3. Poruka sadrži grešku.

2) 10 10 10 000 01 001 001 1 Poruka sadrži grešku.

3) 11 01 000 01 001 10 01 11

Poruka se može dekodirati. 4) 11 01 10 000 10 01 10 010 Poruka sadrži grešku.

Odgovor: 3) 110100001001100111

ZADACI ZA SAMOSTALNO RJEŠENJE

1. Za kodiranje slova M, N, P, Q koriste se četverobitni binarni kodovi od 1000 do 1011. Za niz znakova N, Q, P, M, napišite binarni kod, predstavite rezultat kodiranja u oktalnom kodu.

Odgovor: binarni kod 1001101110101000, oktalni kod 115650.

2. Za kodiranje slova A, B, C, G koristite četverobitne binarne kodove od 1000 do 1011, respektivno. Za niz znakova B, D, C, A, napišite binarni kod, predstavite rezultat kodiranja u heksadecimalnom kodu.

Odgovor: binarni kod 1001 1011 1010 1000, heksadecimalni kod 9BA9.

3. Za kodiranje slova M, N, O, P koriste se trocifreni binarni kodovi od 000 do 111. Za niz znakova O, N, M, P, napišite binarni kod, predstavite rezultat kodiranja u oktalnom kodu.

Odgovor: binarni kod 110 101 100 111, oktalni kod 6547.

4. Za kodiranje slova M, N, O, P koriste se trocifreni binarni kodovi od 100 do 111. Za niz znakova O, N, M, P, napišite binarni kod, predstavite rezultat kodiranja u heksadecimalnom kodu.

Odgovor: binarni kod 1101 0110 0111, heksadecimalni kod B67.

Druga cifra ne može biti 3.

6. Za sastavljanje četvorocifrenih brojeva koriste se brojevi 1, 2, 3, 4, 5, a potrebna su sledeća pravila:

jedan od brojeva 1, 3, 4 može biti na prvom mjestu;

u zapisu broja izmjenjuju se parne i neparne cifre;

Treća cifra ne može biti 4.

Zapišite sve moguće brojeve sastavljene prema ovim pravilima.

7. Za sastavljanje četvorocifrenih brojeva koriste se brojevi 1, 2, 3, 4, 5, a moraju se poštovati sledeća pravila:

jedan od brojeva 2, 4, 5 može biti na prvom mjestu;

u zapisu broja izmjenjuju se parne i neparne cifre;

druga i zadnja cifra ne mogu biti iste. Zapišite sve moguće brojeve sastavljene prema ovim pravilima.

8. Za 5 slova ruske abecede daju se njihovi binarni kodovi, koji mogu sadržavati 2 ili 3 znamenke. Šifre su upisane u tabeli:


Od četiri poruke u ovom kodiranju, samo jedna je prošla bez grešaka, samo se može ispravno dekodirati. Pronađite ovu poruku sa liste:

1) 110100000100110011

2) 111010000010010011

3) 110100001001100111

4) 110110000100110010. Odgovor: 110100001001100111

9. Za 5 slova ruske abecede dati su njihovi binarni kodovi koji mogu sadržavati 2 ili 3 cifre. Šifre su upisane u tabeli:

Kodirajte sekvencu BITKE, unesite grešku u kod koja neće dozvoliti da se poruka ispravno dekodira.

TEST OBUKE

2 Pretpostavimo da je svaki znak kodiran 1 1) 384 bita po bajtu(KOI-8). Brzina informacija 2) 192 bita

dužina riječi od 24 znaka u ovoj

kodiranje.

3 Proizvedeno

rekodiranje

informativnu poruku

jezik originalno napisan u 8-

bitni kod KOI-8, u 16-bitno kodiranje

Unicode. Istovremeno, količina informacija

poruke povećane za 336 bita. Šta je

dužina poruke u znakovima?

4 Koliko znakova ima

poruka,

informativni

što je u KOI-8 kodiranju 240

5 Koliko znakova ima

poruka,

informativni

što je u Unicodeu

6 Za kodiranje slova A, B, C, D

koristiti trocifrene binarne kodove

Tačno

Materijal za samostalno učenje na temu Predavanje 2

ASCII tablica kodiranja (ASCII - Američki standardni kod za razmjenu informacija - Američki standardni kod za razmjenu informacija).

Ukupno, koristeći ASCII tablicu kodiranja (Slika 1), može se kodirati 256 različitih znakova. Ova tabela je podeljena na dva dela: glavni (sa kodovima od OOh do 7Fh) i dodatni (od 80h do FFh, gde slovo h označava da kod pripada heksadecimalnom sistemu brojeva).

Slika 1

Za kodiranje jednog znaka iz tabele, dodeljuje se 8 bitova (1 bajt). Prilikom obrade tekstualne informacije jedan bajt može sadržati šifru nekog znaka - slovo, broj, interpunkcijski znak, karakter akcije itd. Svaki znak ima svoj kod u obliku cijelog broja. U ovom slučaju, svi kodovi se skupljaju u posebne tabele, koje se nazivaju tabele kodiranja. Uz njihovu pomoć, kod karaktera se pretvara u svoj vidljivi prikaz na ekranu monitora. Kao rezultat, svaki tekst u memoriji računara je predstavljen kao niz bajtova sa kodovima znakova.

Na primjer, riječ zdravo! će biti kodiran na sljedeći način (Tabela 1).

Tabela 1

Slika 1 prikazuje znakove uključene u standardno (englesko) i prošireno (rusko) ASCII kodiranje.

Prva polovina ASCII tabele je standardizovana. Sadrži kontrolne kodove (od 00h do 20h i 77h). Ovi kodovi su uklonjeni iz tabele jer se ne odnose na tekstualne elemente. Znakovi interpunkcije i matematički znaci se takođe postavljaju ovde: 2lh - !, 26h - &, 28h - (, 2Bh -+, ..., velika i mala latinična slova: 41h - A, 61h - a.

Druga polovina tabele sadrži nacionalne fontove, pseudografske simbole od kojih se mogu graditi tabele, posebne matematičke simbole. donji dio tablice kodiranja mogu se zamijeniti korištenjem odgovarajućih drajvera - pomoćnih upravljačkih programa. Ova tehnika vam omogućava da koristite više fontova i njihovih slova.

Displej za svaki kod karaktera treba da prikazuje sliku znaka – ne samo digitalni kod, već i sliku koja mu odgovara, jer svaki znak ima svoj oblik. Opis oblika svakog znaka pohranjen je u posebnoj displej memoriji - generatoru znakova. Isticanje znaka na ekranu IBM PC-a, na primjer, vrši se pomoću tačaka koje formiraju matricu znakova. Svaki piksel u takvoj matrici je element slike i može biti svijetao ili taman. tamna tačka je kodiran brojem 0, svijetli (svijetli) - 1. Ako tamne piksele u matričnom polju znaka predstavljate tačkom, a svijetle piksele zvjezdicom, tada možete grafički prikazati oblik simbola.

Ljudi u različitim zemljama koriste simbole za pisanje riječi svog maternjeg jezika. Većina aplikacija ovih dana, uključujući sisteme e-pošte i web pretraživače, su čiste 8-bitne, što znači da mogu prikazati i ispravno čitati samo 8-bitne znakove, prema ISO-8859-1 standardu.

U svijetu postoji preko 256 znakova (uključujući ćirilicu, arapski, kineski, japanski, korejski i tajlandski) i dodaje se sve više znakova. I to stvara sljedeće praznine za mnoge korisnike:

Nije moguće koristiti znakove iz različitih skupova kodiranja u istom dokumentu. Budući da svaki tekstualni dokument koristi vlastiti skup kodiranja, postoje velike poteškoće s automatskim prepoznavanjem teksta.

Pojavljuju se novi simboli (na primjer: Euro), kao rezultat toga ISO razvija novi standard, ISO-8859-15, koji je vrlo sličan ISO-8859-1. Razlika je sljedeća: simboli za stare valute koje se trenutno ne koriste uklonjeni su iz tablice kodiranja starog ISO-8859-1 standarda kako bi se napravio prostor za novonastale simbole (kao što je euro). Kao rezultat, korisnici mogu imati iste dokumente na svojim diskovima, ali u različitim kodovima. Rješenje ovih problema je usvajanje jedinstvenog međunarodnog skupa kodiranja, koji se naziva univerzalno kodiranje ili Unicode.

Slični članci

2023 dvezhizni.ru. Medicinski portal.