Kiek informacijos koduoja dvi galimas būsenas. Kas yra kodavimas ir dekodavimas? Pavyzdžiai. Skaitmeninės, tekstinės ir grafinės informacijos kodavimo ir iškodavimo metodai

Informatikos moksle daug informacijos procesų vyksta naudojant duomenų kodavimas. Todėl šio proceso supratimas yra labai svarbus suvokiant šio mokslo pagrindus. Pagal informacijos kodavimą suprantamas simbolių, parašytų įvairiomis natūraliomis kalbomis (rusų, Anglų kalba ir tt) į skaitinį pavadinimą.





Tai reiškia, kad koduojant tekstą kiekvienam simboliui priskiriama konkreti reikšmė nulių ir vienetų pavidalu - .

Kodėl koduoti informaciją?

Pirmiausia turite atsakyti į klausimą kam koduoti informaciją? Faktas yra tas, kad kompiuteris gali apdoroti ir saugoti tik vieno tipo duomenų atvaizdavimą - skaitmeninį. Todėl bet kokia joje esanti informacija turi būti išversta į skaitmeninis vaizdas.

Teksto kodavimo standartai

Kad visi kompiuteriai vienareikšmiškai suprastų tam tikrą tekstą, būtina naudoti visuotinai priimtą teksto kodavimo standartai. Kitais atvejais reikės papildomo perkodavimo arba duomenų nesuderinamumo.




ASCII

Pats pirmasis kompiuterio simbolių kodavimo standartas buvo ASCII (pilnas pavadinimas – American Standard Code for Information Interchange). Bet kuriam simboliui jame užkoduoti buvo naudojami tik 7 bitai. Kaip prisimenate, naudojant 7 bitus galima užkoduoti tik 27 simbolius arba 128 simbolius. To pakanka, kad būtų užkoduotos lotyniškos abėcėlės didžiosios ir mažosios raidės, arabiški skaitmenys, skyrybos ženklai, taip pat tam tikras specialiųjų simbolių rinkinys, pavyzdžiui, dolerio ženklas - "$". Tačiau norint užkoduoti kitų tautų abėcėlės simbolius (taip pat ir rusiškos abėcėlės simbolius), kodą reikėjo papildyti iki 8 bitų (28=256 simboliai). Tuo pačiu metu kiekvienai kalbai buvo naudojamas atskiras kodavimas.

UNIKODAS

Reikėjo gelbėti situaciją suderinamumo požiūriu kodavimo lenteles. Todėl laikui bėgant buvo sukurti nauji atnaujinti standartai. Šiuo metu populiariausias kodavimas vadinamas UNIKODAS. Jame kiekvienas simbolis užkoduotas naudojant 2 baitus, kurie atitinka 216=62536 skirtingus kodus.




Grafikos kodavimo standartai

Vaizdui užkoduoti reikia daug daugiau baitų, nei užkoduoti simbolius. Dauguma kompiuterio atmintyje saugomų sukurtų ir apdorotų vaizdų skirstomi į dvi pagrindines grupes:

  • rastrinės grafikos vaizdai;
  • vektorinės grafikos vaizdai.

Rastrinė grafika

Rastrinėje grafikoje vaizdas vaizduojamas spalvotų taškų rinkiniu. Tokie taškai vadinami pikseliais. Padidinus vaizdą tokie taškai virsta kvadratais.


Norint užkoduoti nespalvotą vaizdą, kiekvienas pikselis yra užkoduotas vienu bitu. Pavyzdžiui, juoda yra 0, o balta yra 1)


Mūsų ankstesnis vaizdas gali būti užkoduotas taip:

Koduojant nespalvotus vaizdus, ​​dažniausiai naudojama 256 pilkų atspalvių paletė – nuo ​​baltos iki juodos. Todėl tokiai gradacijai užkoduoti pakanka vieno baito (28=256).


Koduojant spalvotus vaizdus, ​​naudojamos kelios spalvų schemos.





Praktiškai dažniau RGB spalvų modelis, kur atitinkamai naudojamos trys pagrindinės spalvos: raudona, žalia ir mėlyna. Likę spalvų atspalviai gaunami maišant šias pagrindines spalvas.


Taigi, norint užkoduoti modelį iš trijų spalvų 256 tonais išgaunama per 16,5 milijono skirtingų spalvų atspalvių. Tai yra, kodavimui naudojami 3⋅8=24 bitai, kurie atitinka 3 baitus.


Natūralu, kad galite naudoti minimali suma bitą spalvotiems vaizdams koduoti, tačiau tada gali būti suformuotas mažesnis spalvų tonų skaičius, dėl kurio vaizdo kokybė žymiai sumažės.


Norėdami nustatyti vaizdo dydį, pločio pikselių skaičių turite padauginti iš pikselių skaičiaus ilgio ir vėl padauginti iš paties pikselio dydžio baitais.


  • A- pikselių pločio skaičius;
  • b- ilgio pikselių skaičius;
  • – vieno pikselio dydis baitais.

Pavyzdžiui, 800⋅600 pikselių spalvotas vaizdas yra 60 000 baitų.

Vektorinė grafika

Vektorinės grafikos objektai užkoduojami visiškai kitaip. Čia vaizdas susideda iš linijų, kurios gali turėti savo kreivumo koeficientus.




Garso kodavimo standartai

Garsai, kuriuos žmogus girdi, yra oro virpesiai. Garso virpesiai yra bangų sklidimo procesas.

Garsas turi dvi pagrindines savybes:

  • virpesių amplitudė – nustato garso stiprumą;
  • virpesių dažnis – nustato garso toną.



Garsas gali būti konvertuojamas į elektrinį signalą naudojant mikrofoną. Garsas yra užkoduotas tam tikru, iš anksto nustatytu laiko intervalu. Šiuo atveju išmatuojamas elektrinio signalo dydis ir priskiriama dvejetainė vertė. Kuo dažniau atliekami šie matavimai, tuo aukštesnė garso kokybė.





700 MB kompaktiniame diske telpa apie 80 minučių CD kokybės garso.

Vaizdo įrašų kodavimo standartai

Kaip žinote, vaizdo įrašų seka susideda iš greitai besikeičiančių fragmentų. Kadrai keičiasi 24–60 kadrų per sekundę greičiu.

Filmuotos medžiagos dydis baitais nustatomas pagal kadro dydį (pikselių skaičių ekrane aukštyje ir plotyje), naudojamų spalvų skaičių ir kadrų skaičių per sekundę. Tačiau kartu su tuo gali būti ir garso takelis.

Susipažinome su skaičių sistemomis – skaičių kodavimo būdais. Skaičiai pateikia informaciją apie prekių skaičių. Ši informacija turi būti užkoduota, pateikta tam tikra skaičių sistema. Kurį iš žinomų metodų pasirinkti, priklauso nuo sprendžiamos problemos.
Iki šiol kompiuteriai daugiausia apdorodavo skaitmeninę ir tekstinę informaciją. Tačiau didžiąją dalį informacijos apie išorinį pasaulį žmogus gauna vaizdų ir garsų pavidalu. Šiuo atveju vaizdas yra svarbesnis. Prisiminkite patarlę: „Geriau vieną kartą pamatyti, nei šimtą kartų išgirsti“. Todėl šiandien kompiuteriai vis aktyviau pradeda dirbti su vaizdu ir garsu. Mes būtinai apsvarstysime būdus, kaip užkoduoti tokią informaciją.

Dvejetainis kodavimas skaitmeninis ir tekstinė informacija.

Bet kokia informacija kompiuteryje užkoduojama naudojant dviejų skaitmenų – 0 ir 1 – sekas. Kompiuteris informaciją saugo ir apdoroja elektrinių signalų derinio pavidalu: 0,4 V – 0,6 V įtampa atitinka loginį nulį, o įtampa. 2.4V-2.7V atitinka loginį vienetą. Vadinamos 0 ir 1 sekos dvejetainiai kodai , o skaičiai 0 ir 1 - bitai (dvejetainiai skaitmenys). Toks informacijos kodavimas kompiuteryje vadinamas dvejetainis kodavimas . Taigi dvejetainis kodavimas – tai kodavimas su kuo mažesniu elementariųjų simbolių skaičiumi, kodavimas pačiomis paprasčiausiomis priemonėmis. Dėl to jis yra nuostabus teoriniu požiūriu.
Dvejetainis informacijos kodavimas inžinierius vilioja tuo, kad jį lengva įgyvendinti techniškai. Elektroninės grandinės apdoroti dvejetainius kodus turi būti tik vienoje iš dviejų būsenų: yra signalas / nėra signalo arba aukšta įtampa / žema įtampa .
Kompiuteriai savo darbe veikia su realiais ir sveikaisiais skaičiais, vaizduojamais dviem, keturiais, aštuoniais ir net dešimt baitų. Skaičiuojant skaičiaus ženklui pavaizduoti naudojamas papildomas simbolis. ženklas bitas , kuris paprastai dedamas prieš skaitmeninius skaitmenis. Teigiamų skaičių ženklo bito reikšmė yra 0, o neigiamų – 1. Norėdami parašyti neigiamo sveikojo skaičiaus (-N) vidinį vaizdą, turite:
1) gaukite papildomą skaičiaus N kodą, pakeisdami 0 į 1 ir 1 į 0;
2) prie gauto skaičiaus pridėkite 1.

Kadangi šiam skaičiui pavaizduoti neužtenka vieno baito, jis vaizduojamas kaip 2 baitai arba 16 bitų, jo komplemento kodas yra 1111101111000101, taigi -1082=1111101111000110.
Jei kompiuteris galėtų apdoroti tik vienus baitus, tai būtų mažai naudos. Iš tikrųjų kompiuteris veikia su skaičiais, kurie parašyti dviem, keturiais, aštuoniais ir net dešimčia baitų.
Nuo šeštojo dešimtmečio pabaigos kompiuteriai vis dažniau naudojami tekstinei informacijai apdoroti. Tekstinei informacijai pavaizduoti dažniausiai naudojami 256 skirtingi simboliai, pavyzdžiui, didžiosios ir mažosios lotyniškos abėcėlės raidės, skaičiai, skyrybos ženklai ir kt. Daugumoje šiuolaikinių kompiuterių kiekvienas simbolis atitinka aštuonių nulių ir vienetų seką, vadinamą baitas .
Baitas yra aštuonių bitų nulių ir vienetų derinys.
Koduojant informaciją šiuose elektroniniuose kompiuteriuose naudojamos 256 skirtingos 8 nulių ir vienetų sekos, todėl galima užkoduoti 256 simbolius. Pavyzdžiui, didelė rusiška raidė „M“ turi kodą 11101101, raidė „I“ – 11101001, raidė „R“ – 11110010. Taigi žodis „MIR“ yra užkoduotas 24 bitų seka. arba 3 baitai: 111011011110100111110010.
Bitų skaičius pranešime vadinamas pranešimo informacijos dydžiu. Tai įdomu!

Iš pradžių kompiuteriuose buvo naudojama tik lotyniška abėcėlė. Jame yra 26 raidės. Taigi kiekvienam pažymėti pakaktų penkių impulsų (bitų). Tačiau tekste yra skyrybos ženklų, dešimtainių skaitmenų ir kt. Todėl pirmuosiuose kompiuteriuose anglų kalba baitas – mašininis skiemuo – apėmė šešis bitus. Tada septyni – ne tik atskirti dideles raides nuo mažų, bet ir padidinti spausdintuvų, signalinių lempučių ir kitos įrangos valdymo kodų skaičių. 1964 metais pasirodė galingas IBM-360, kuriame baitas pagaliau tapo lygus aštuoniems bitams. Paskutinis aštuntas bitas buvo reikalingas pseudografiniams simboliams.
Tam tikro dvejetainio kodo priskyrimas simboliui yra susitarimo reikalas, kuris fiksuojamas kodų lentelėje. Deja, yra penkios skirtingos rusiškų raidžių koduotės, todėl tekstai, sukurti viena koduote, nebus teisingai atspindėti kitoje.
Chronologiškai vienas pirmųjų rusiškų raidžių kodavimo kompiuteriuose standartų buvo KOI8 („Informacijos mainų kodas, 8 bitai“). Labiausiai paplitusi koduotė yra standartinė Microsoft Windows kirilicos koduotė, sutrumpinta kaip СР1251 ("СР" reiškia "Code Page" arba "code page"). „Apple“ sukūrė savo rusiškų raidžių kodavimą („Mac“), skirtą „Macintosh“ kompiuteriams. Tarptautinė standartų organizacija (ISO) patvirtino ISO 8859-5 kodavimą kaip rusų kalbos standartą. Pagaliau atsirado naujas tarptautinis Unicode standartas, kuris kiekvienam simboliui priskiria ne po vieną baitą, o po du, todėl juo galima užkoduoti ne 256 simbolius, o net 65536.
Visos šios koduotės yra ASCII (American Standard Code for Information Interchange) kodų lentelės, kuri koduoja 128 simbolius, tęsinys.

ASCII simbolių lentelė:

kodas simbolis kodas simbolis kodas simbolis kodas simbolis kodas simbolis kodas simbolis
32 Erdvė 48 . 64 @ 80 P 96 " 112 p
33 ! 49 0 65 A 81 K 97 a 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 u
38 & 54 5 70 F 86 V 102 f 118 v
39 " 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 X 104 h 120 x
41 ) 57 8 73 89 Y 105 i 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 l 124 |
45 - 61 < 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127 DEL

Dvejetainis teksto kodavimas vyksta taip: paspaudus klavišą į kompiuterį perduodama tam tikra elektrinių impulsų seka, o kiekvienas simbolis turi savo elektrinių impulsų seką (mašinų kalba nuliai ir vienetai). Klaviatūros ir ekrano tvarkyklės programa nustato simbolį iš kodų lentelės ir sukuria jo vaizdą ekrane. Taigi tekstai ir skaičiai išsaugomi kompiuterio atmintyje dvejetainiu kodu ir programiškai konvertuojami į vaizdus ekrane.

Dvejetainis kodavimas grafinę informaciją.

Nuo devintojo dešimtmečio grafinės informacijos apdorojimo kompiuteryje technologija sparčiai vystėsi. Kompiuterinė grafika plačiai naudojama kompiuteriniame modeliavime moksliniuose tyrimuose, kompiuteriniuose simuliatoriuose, kompiuterinėje animacijoje, verslo grafikoje, žaidimuose ir kt.
Ekrano grafinė informacija pateikiama vaizdo, suformuoto iš taškų (pikselių), pavidalu. Atidžiai pažiūrėkite į laikraščio nuotrauką ir pamatysite, kad ją taip pat sudaro smulkūs taškeliai. Jei tai tik juodi ir balti taškai, kiekvienas iš jų gali būti užkoduotas 1 bitu. Bet jei nuotraukoje yra atspalvių, tada du bitai leidžia užkoduoti 4 taškų atspalvius: 00 - balta spalva, 01 - šviesiai pilka, 10 - tamsiai pilka, 11 - juoda. Trys bitai leidžia užkoduoti 8 atspalvius ir kt.
Bitų skaičius, reikalingas vienam spalvos atspalviui užkoduoti, vadinamas spalvos gyliu.

Šiuolaikiniuose kompiuteriuose rezoliucija (taškų skaičius ekrane), taip pat spalvų skaičius priklauso nuo vaizdo adapterio ir gali būti keičiamas programiškai.
Spalvoti vaizdai gali turėti skirtingus režimus: 16 spalvų, 256 spalvų, 65536 spalvų ( aukšta spalva), 16777216 spalvų ( tikra spalva). Vienas taškas už režimą aukšta spalva Reikia 16 bitų arba 2 baitų.
Dažniausia ekrano skiriamoji geba yra 800 x 600 pikselių, t.y. 480 000 taškų. Paskaičiuokime vaizdo atminties kiekį, reikalingą aukštos spalvos režimui: 2 baitai *480000=960000 baitų.
Informacijos kiekiui matuoti taip pat naudojami didesni vienetai:



Todėl 960 000 baitų yra maždaug lygus 937,5 KB. Jeigu žmogus be pertraukos kalba aštuonias valandas per dieną, tai per 70 gyvenimo metų jis pasakys apie 10 gigabaitų informacijos (tai 5 milijonai puslapių – 500 metrų aukščio popieriaus šūsnis).
Informacijos perdavimo sparta yra bitų, perduodamų per 1 sekundę, skaičius. 1 bito per sekundę perdavimo greitis vadinamas 1 bodu.

Kompiuterio vaizdo atmintyje saugomas bitmap, kuris yra dvejetainis vaizdo kodas, iš kurio jį nuskaito procesorius (ne mažiau kaip 50 kartų per sekundę) ir rodomas ekrane.



Garsinės informacijos dvejetainis kodavimas.

Nuo 90-ųjų pradžios asmeniniai kompiuteriai galėjo dirbti su garso informacija. Kiekvienas kompiuteris su garso plokšte gali išsaugoti kaip failus ( failas yra tam tikras informacijos kiekis, saugomas diske ir turintis pavadinimą ) ir paleisti garso informaciją. Specialių programinių įrankių (garso failų redaktorių) pagalba atsiveria puikios galimybės kurti, redaguoti ir klausytis garso failų. Sukuriamos kalbos atpažinimo programos, atsiranda galimybė valdyti kompiuterį balsu.
Būtent garso plokštė (kortelė) paverčia analoginį signalą į atskirą fonogramą ir atvirkščiai, „skaitmenizuotą“ garsą į analoginį (nepertraukiamą) signalą, kuris tiekiamas į garsiakalbio įvestį.



Analoginio garso signalo dvejetainio kodavimo atveju ištisinis signalas yra atrinktas, t.y. pakeičiama jo atskirų pavyzdžių serija – rodmenimis. Kokybė dvejetainis kodavimas priklauso nuo dviejų parametrų: diskrečiųjų signalų lygių skaičiaus ir mėginių skaičiaus per sekundę. Pavyzdžių skaičius arba atrankos dažnis garso adapteriuose skiriasi: 11 kHz, 22 kHz, 44,1 kHz ir tt Jei lygių skaičius yra 65536, tai vienam garso signalui skaičiuojama 16 bitų (216). 16 bitų garso adapteris užkoduoja ir atkuria garsą tiksliau nei 8 bitų.
Bitų skaičius, reikalingas vienam garso lygiui užkoduoti, vadinamas garso gyliu.
Mono garso failo garsumas (baitais) nustatomas pagal formulę:



Naudojant stereofoninį garsą, garso failo garsumas padvigubinamas, o esant kvadratiniam – keturis kartus.
Programoms vis sudėtingėjant ir didėjant jų funkcijoms, taip pat atsirandant multimedijos programoms, didėja programų ir duomenų funkcinis kiekis. Jei devintojo dešimtmečio viduryje įprasta programų ir duomenų apimtis buvo dešimtys ir tik kartais šimtai kilobaitų, tai 90-ųjų viduryje ji pradėjo siekti dešimtis megabaitų. Atitinkamai, RAM kiekis didėja.


Duomenų apdorojimo elektroninių kompiuterių veikimas tapo svarbiu žingsniu tobulinant valdymo ir planavimo sistemas. Tačiau šis informacijos rinkimo ir apdorojimo būdas kiek skiriasi nuo įprasto, todėl jį reikia transformuoti į kompiuteriui suprantamą simbolių sistemą.

Kas yra informacijos kodavimas?

Duomenų kodavimas yra privalomas informacijos rinkimo ir apdorojimo proceso etapas.

Paprastai kodas reiškia simbolių derinį, atitinkantį perduodamus duomenis arba kai kurias jų kokybines charakteristikas. O kodavimas yra šifruoto derinio sudarymas santrumpų ar specialiųjų simbolių sąrašo forma, visiškai perteikiantis pradinę pranešimo prasmę. Šifravimas kartais dar vadinamas šifravimu, tačiau verta žinoti, kad pastaroji procedūra apima duomenų apsaugą nuo įsilaužimo ir trečiųjų šalių nuskaitymo.

Kodavimo tikslas – pateikti informaciją patogiu ir glaustu formatu, kad būtų lengviau perduoti ir apdoroti kompiuteriniuose įrenginiuose. Kompiuteriai veikia tik naudodami tam tikros formos informaciją, todėl svarbu tai atsiminti, kad išvengtumėte problemų. Duomenų apdorojimo sąvoka apima paiešką, rūšiavimą ir rikiavimą, o kodavimas jame vyksta informacijos įvedimo kodo forma etape.

Kas yra informacijos dekodavimas?

Klausimas, kas yra kodavimas ir dekodavimas, asmeninio kompiuterio vartotojui gali kilti dėl įvairių priežasčių, tačiau bet kuriuo atveju svarbu perteikti teisingą informaciją, kuri leis vartotojui sėkmingai judėti į priekį informacinių technologijų sraute. Kaip suprantate, po duomenų apdorojimo proceso gaunamas išvesties kodas. Jei toks fragmentas iššifruojamas, susidaro pirminė informacija. Tai yra, dekodavimas yra atvirkštinis šifravimo procesas.

Jei koduojant duomenys įgauna simbolinių signalų formą, visiškai atitinkančią perduodamą objektą, tai dekoduojant perduodama informacija ar kai kurios jos charakteristikos iš kodo pašalinamos.

Užkoduotų pranešimų gavėjai gali būti keli, tačiau labai svarbu, kad informacija patektų į jų rankas ir anksčiau nebūtų atskleista trečiųjų šalių. Todėl verta išstudijuoti informacijos kodavimo ir dekodavimo procesus. Jie padeda keistis konfidencialia informacija tarp pašnekovų grupės.

Teksto informacijos kodavimas ir dekodavimas

Kai paspaudžiate klaviatūros klavišą, kompiuteris gauna formos signalą dvejetainis skaičius, kurio dekodavimą galima rasti kodų lentelėje – vidinis simbolių atvaizdavimas asmeniniame kompiuteryje. ASCII lentelė laikoma pasauliniu standartu.

Tačiau neužtenka žinoti, kas yra kodavimas ir dekodavimas, reikia suprasti ir kaip duomenys yra kompiuteryje. Pavyzdžiui, vienam dvejetainio kodo simboliui išsaugoti elektroninis kompiuteris skiria 1 baitą, tai yra 8 bitus. Šis langelis gali turėti tik dvi reikšmes: 0 ir 1. Pasirodo, vienas baitas leidžia užšifruoti 256 skirtingus simbolius, nes tiek kombinacijų galima padaryti. Šios kombinacijos yra raktas ASCII lentelės. Pavyzdžiui, raidė S užkoduota kaip 01010011. Ją paspaudus klaviatūroje, duomenys užkoduojami ir iškoduojami, o ekrane gauname laukiamą rezultatą.

Pusėje ASCII standartų lentelės yra kodai skaitmenims, valdymo simboliams ir lotyniškos raidės. Kita dalis užpildyta tautiniais ženklais, pseudografiniais ženklais ir simboliais, kurie nesusiję su matematika. Akivaizdu, kad skirtingose ​​šalyse ši lentelės dalis skirsis. Skaičiai taip pat konvertuojami į dvejetainius, kai jie įvedami, pagal standartinę suvestinę.

Skaičių kodavimas

Panašus vaizdo taškų kodavimo būdas naudojamas ir spausdinimo pramonėje. Tik čia įprasta naudoti ketvirtą spalvą – juodą. Dėl šios priežasties konversijos spausdinimo sistema sutrumpinta kaip CMYK. Ši sistema vaizdams pavaizduoti naudoja net trisdešimt du bitus.


Informacijos kodavimo ir dekodavimo metodai apima įvairių technologijų naudojimą, priklausomai nuo įvesties duomenų tipo. Pavyzdžiui, grafinių vaizdų šifravimo šešiolikos bitų dvejetainiais kodais metodas vadinamas High Color. Ši technologija leidžia į ekraną perkelti net du šimtus penkiasdešimt šešis atspalvius. Sumažinus dalyvaujančių bitų, naudojamų taškams užšifruoti, skaičių grafinis vaizdas, automatiškai sumažinate vietos, reikalingos laikinam informacijos saugojimui, kiekį. Šis duomenų kodavimo būdas vadinamas indeksu.

Garso kodavimas

Dabar, kai pažvelgėme į tai, kas yra kodavimas ir dekodavimas, ir šio proceso pagrindu veikiančius metodus, verta pasilikti ties tokiu klausimu kaip garso duomenų kodavimas.

Garso informaciją galima pavaizduoti kaip elementarius vienetus ir pauzes tarp kiekvienos jų poros. Kiekvienas signalas konvertuojamas ir saugomas kompiuterio atmintyje. Garsai išvedami naudojant užšifruotus derinius, saugomus kompiuterio atmintyje.

Kalbant apie žmogaus kalbą, ją užkoduoti yra daug sunkiau, nes ji turi įvairių atspalvių, o kompiuteris turi palyginti kiekvieną frazę su anksčiau į atmintį įrašytu standartu. Atpažinimas įvyks tik tada, kai ištartas žodis bus rastas žodyne.

Informacijos kodavimas dvejetainiu kodu

Yra įvairių metodų, kaip įgyvendinti tokią procedūrą kaip skaitmeninės, tekstinės ir grafinės informacijos kodavimas. Duomenų dekodavimas dažniausiai vyksta naudojant atvirkštinę technologiją.

Koduojant skaičius atsižvelgiama net į tai, kokiu tikslu skaičius buvo įvestas į sistemą: aritmetiniams skaičiavimams ar tiesiog išvedimui. Visi dvejetainėje sistemoje užkoduoti duomenys yra užšifruojami naudojant vienetus ir nulius. Šie simboliai taip pat vadinami bitais. Šis kodavimo būdas yra populiariausias, nes jį lengviausia organizuoti technologiniu požiūriu: signalo buvimas yra 1, nebuvimas yra 0. Dvejetainis šifravimas turi tik vieną trūkumą – tai simbolių kombinacijų ilgis. Tačiau techniniu požiūriu lengviau valdyti krūvą paprastų, vienodų komponentų nei nedidelį skaičių sudėtingesnių.

Dvejetainio kodavimo privalumai

  • Tai tinka įvairiems jo tipams.
  • Duomenų perdavimo metu klaidų nebūna.
  • Tokiu būdu užkoduotus duomenis kompiuteriu apdoroti daug lengviau.
  • Reikia dviejų būsenų įrenginių.

Dvejetainio kodavimo trūkumai

  • Didelis kodų ilgis, kuris šiek tiek sulėtina jų apdorojimą.
  • Asmens, neturinčio specialaus išsilavinimo ar išsilavinimo, dvejetainių derinių suvokimo sudėtingumas.


Išvada

Perskaitę šį straipsnį galėjote sužinoti, kas yra kodavimas ir dekodavimas ir kam jis naudojamas. Galima daryti išvadą, kad naudojami duomenų konvertavimo būdai visiškai priklauso nuo informacijos tipo. Tai gali būti ne tik tekstas, bet ir skaičiai, vaizdai ir garsas.

Įvairios informacijos kodavimas leidžia suvienodinti jos pateikimo formą, tai yra padaryti ją tokio paties tipo, o tai žymiai pagreitina duomenų apdorojimą ir automatizavimą tolesniam naudojimui.

Elektroniniuose kompiuteriuose dažniausiai naudojami standartinio dvejetainio kodavimo principai, kurie paverčia pirminę informacijos vaizdavimo formą į patogesnį saugojimui ir tolesniam apdorojimui formatą. Dekoduojant visi procesai vyksta atvirkštine tvarka.

Turinys

I. Informacijos kodavimo istorija…………………………………..3

II. Kodavimo informacija……………………………………………4

III. Tekstinės informacijos kodavimas……………………………….4

IV. Kodavimo lentelių tipai…………………………………………………6

V. Tekstinės informacijos kiekio apskaičiavimas…………………………14

Naudotos literatūros sąrašas…………………………………..16

. Informacijos kodavimo istorija

Žmonija naudoja teksto šifravimą (kodavimą) nuo pat tos akimirkos, kai pasirodė pirmoji slapta informacija. Štai keletas teksto kodavimo būdų, kurie buvo išrasti įvairiais žmogaus mąstymo vystymosi etapais:

Kriptografija – tai kriptografija, rašto keitimo sistema, siekiant, kad tekstas būtų nesuprantamas nežinantiems asmenims;

Morzės kodas arba nevienodas telegrafo kodas, kuriame kiekviena raidė ar simbolis vaizduojamas atskiru trumpų elementarių siuntinių deriniu elektros srovė(taškai) ir trigubos trukmės elementarieji sklypai (brūkšneliai);


Gestų kalba yra gestų kalba, kurią vartoja klausos negalią turintys žmonės.

Vienas iš seniausių žinomų šifravimo metodų pavadintas Romos imperatoriaus Julijaus Cezario (I a. pr. Kr.) vardu. Šis metodas pagrįstas kiekvienos šifruoto teksto raidės pakeitimu kita, perkeliant abėcėlę nuo pradinės raidės fiksuotu simbolių skaičiumi, o abėcėlė skaitoma apskritime, tai yra, po raidės i, atsižvelgiama į a. Taigi žodis „baitas“, perkeltas dviem simboliais į dešinę, yra užkoduotas žodžiu „gvlf“. Atvirkštinis duoto žodžio iššifravimo procesas yra pakeisti kiekvieną užšifruotą raidę antrąja, esančia jos kairėje.

II. Informacijos kodavimas

Kodas yra tam tikrų iš anksto nustatytų sąvokų įrašymo (arba perdavimo) susitarimų (arba signalų) rinkinys.

Informacijos kodavimas yra tam tikro informacijos atvaizdavimo formavimo procesas. Siauresne prasme terminas „kodavimas“ dažnai suprantamas kaip perėjimas nuo vienos informacijos pateikimo formos prie kitos, patogesnės saugoti, perduoti ar apdoroti.

Paprastai kiekvienas vaizdas, kai jis yra užkoduotas (kartais sakoma – užšifruotas), atvaizduojamas atskiru simboliu.

Ženklas yra baigtinės atskirų elementų rinkinio elementas.

Siauresne prasme terminas „kodavimas“ dažnai suprantamas kaip perėjimas nuo vienos informacijos pateikimo formos prie kitos, patogesnės saugoti, perduoti ar apdoroti.

Kompiuteris gali apdoroti tekstinę informaciją. Įvedant į kompiuterį kiekviena raidė užkoduojama tam tikru skaičiumi, o išvedant į išorinius įrenginius (ekraną ar spausdinimą), žmogaus suvokimui, naudojant šiuos skaičius statomi raidžių vaizdai. Raidžių ir skaičių aibės atitikimas vadinamas simbolių kodavimu.

Paprastai visi skaičiai kompiuteryje pateikiami nuliais ir vienetais (o ne dešimčia skaitmenų, kaip įprasta žmonėms). Kitaip tariant, kompiuteriai dažniausiai dirba dvejetainėje sistemoje, nes jų apdorojimo įrenginiai yra daug paprastesni. Skaičių įvedimas į kompiuterį ir išvedimas žmogaus skaitymui gali būti atliekamas įprasta dešimtaine forma, o visas reikalingas konversijas atlieka kompiuteryje veikiančios programos.

III. Tekstinės informacijos kodavimas

Ta pati informacija gali būti pateikta (užkoduota) keliomis formomis. Atsiradus kompiuteriams, tapo būtina užkoduoti visų tipų informaciją, su kuria susiduria ir individas, ir visa žmonija. Tačiau žmonija pradėjo spręsti informacijos kodavimo problemą dar gerokai prieš kompiuterių atsiradimą. Grandioziniai žmonijos pasiekimai – rašymas ir aritmetika – yra ne kas kita, kaip kalbos ir skaitmeninės informacijos kodavimo sistema. Informacija niekada nepasirodo gryna forma, jis visada kažkaip pavaizduotas, kažkaip užkoduotas.

Dvejetainis kodavimas yra vienas iš labiausiai paplitusių informacijos pateikimo būdų. Kompiuteriuose, robotuose ir staklėse su skaitmeniniu valdymu, kaip taisyklė, visa informacija, su kuria įrenginys susiduria, yra užkoduota dvejetainės abėcėlės žodžių forma.

Nuo septintojo dešimtmečio pabaigos kompiuteriai vis dažniau naudojami tekstų apdorojimui, o dabar didžioji dalis pasaulio asmeninių kompiuterių (ir dauguma laikas) yra užsiėmęs tekstinės informacijos apdorojimu. Visi šie informacijos tipai kompiuteryje pateikiami dvejetainiu kodu, t.y. naudojama abėcėlė, kurios galia yra dvi (tik du simboliai 0 ir 1). Taip yra dėl to, kad informaciją patogu pavaizduoti elektrinių impulsų sekos forma: impulso nėra (0), yra impulsas (1).

Toks kodavimas dažniausiai vadinamas dvejetainiu, o pačios loginės nulių ir vienetų sekos – mašinine kalba.

Kompiuterio požiūriu tekstas susideda iš atskirų simbolių. Simboliai apima ne tik raides (didžiąsias arba mažąsias, lotyniškas ar rusiškas), bet ir skaičius, skyrybos ženklus, specialiuosius simbolius, pvz., "=", "(", "&" ir kt.) ir net (atkreipkite ypatingą dėmesį!) tarpus tarp žodžių. .

Tekstai į kompiuterio atmintį įvedami klaviatūra. Klavišai rašomi mums pažįstamomis raidėmis, skaičiais, skyrybos ženklais ir kitais simboliais. Jie įveda RAM dvejetainiu kodu. Tai reiškia, kad kiekvienas simbolis yra vaizduojamas 8 bitų dvejetainiu kodu.

Tradiciškai vienam simboliui koduoti naudojamas informacijos kiekis, lygus 1 baitui, t.y. I \u003d 1 baitas \u003d 8 bitai. Naudodami formulę, kuri susieja galimų įvykių skaičių K ir informacijos kiekį I, galite apskaičiuoti, kiek skirtingų simbolių galima užkoduoti (darant prielaidą, kad simboliai yra galimi įvykiai): K = 2 I = 2 8 = 256, t.y. Pateikiant tekstinę informaciją, galite naudoti abėcėlę, kurios talpa yra 256 simboliai.

Šio simbolių skaičiaus visiškai pakanka, kad būtų galima pateikti tekstinę informaciją, įskaitant didžiąsias ir mažąsias rusiškų ir lotyniškų abėcėlių raides, skaičius, ženklus, grafinius simbolius ir kt.

Kodavimas reiškia, kad kiekvienam simboliui priskiriamas unikalus dešimtainis kodas nuo 0 iki 255 arba atitinkamas dvejetainis kodas nuo 00000000 iki 11111111. Taigi žmogus skiria simbolius pagal stilių, o kompiuteris – pagal kodą.

Simbolių kodavimo baitas po baito patogumas yra akivaizdus, ​​nes baitas yra mažiausia adresuojama atminties dalis, todėl procesorius, apdorodamas tekstą, gali pasiekti kiekvieną simbolį atskirai. Kita vertus, 256 simbolių visiškai pakanka, kad būtų galima pateikti įvairią simbolių informaciją.

Kai simbolis rodomas kompiuterio ekrane, atliekamas atvirkštinis procesas - dekodavimas, tai yra simbolio kodo konvertavimas į jo vaizdą. Svarbu, kad konkretaus kodo priskyrimas simboliui būtų susitarimo dalykas, kuris fiksuojamas kodų lentelėje.

Dabar kyla klausimas, kurį aštuonių bitų dvejetainį kodą įdėti į kiekvieną simbolį. Aišku, kad tai sąlyginis reikalas, kodavimo būdų galima sugalvoti daug.

Visi kompiuterio abėcėlės simboliai sunumeruoti nuo 0 iki 255. Kiekvienas skaičius atitinka aštuonių bitų dvejetainį kodą nuo 00000000 iki 11111111. Šis kodas yra tiesiog simbolio eilės numeris dvejetainėje skaičių sistemoje.

IV . Kodavimo lentelių tipai

Lentelė, kurioje visiems kompiuterio abėcėlės simboliams priskirti serijos numeriai, vadinama kodavimo lentele.

Dėl skirtingi tipai Kompiuteris naudoja įvairias kodavimo lenteles.

ASCII (American Standard Code for Information Interchange) kodų lentelė priimta kaip tarptautinis standartas, pirmąją simbolių pusę užkoduojanti skaitiniais kodais nuo 0 iki 127 (kodai nuo 0 iki 32 priskiriami ne simboliams, o funkciniams klavišams).

ASCII kodų lentelė yra padalinta į dvi dalis.

Tik pirmoji lentelės pusė yra tarptautinis standartas, t.y. simboliai su skaičiais nuo 0 (00000000) iki 127 (01111111).

ASCII kodavimo lentelės struktūra

Serijos numeris Kodas Simbolis
0 - 31 00000000 - 00011111

Simboliai su skaičiais nuo 0 iki 31 vadinami valdymo simboliais.

Jų funkcija yra valdyti teksto rodymo ekrane ar spausdinimo procesą, garso signalo davimą, teksto žymėjimą ir kt.

32 - 127 0100000 - 01111111

Standartinė lentelės dalis (anglų k.). Tai apima mažąsias ir didžiąsias lotyniškos abėcėlės raides, dešimtainius skaitmenis, skyrybos ženklus, visų rūšių skliaustus, komercinius ir kitus simbolius.

32 simbolis yra tarpas, t.y. tuščia vieta tekste.

Visa kita atspindi tam tikri ženklai.

128 - 255 10000000 - 11111111

Alternatyvi lentelės dalis (rusų kalba).

Antroji ASCII kodų lentelės pusė, vadinama kodų puslapiu (128 kodai, pradedant 10000000 ir baigiant 11111111), gali turėti skirtingas parinktis, kiekviena parinktis turi savo numerį.

Kodų puslapis pirmiausia naudojamas nacionaliniams rašmenims, išskyrus lotyniškus, įrašyti. Rusijos nacionalinėse koduotėse rusiškos abėcėlės simboliai dedami šioje lentelės dalyje.


Pirmoji ASCII kodų lentelės pusė

Atkreipiamas dėmesys į tai, kad kodavimo lentelėje raidės (didžiosios ir mažosios) išdėstytos abėcėlės tvarka, o skaičiai – didėjančia tvarka. Toks leksikografinės tvarkos laikymasis ženklų išdėstyme vadinamas nuoseklaus abėcėlės kodavimo principu.

Rusų abėcėlės raidėms taip pat laikomasi nuoseklaus kodavimo principo.

Antroji ASCII kodų lentelės pusė


Deja, šiuo metu yra penkios skirtingos kirilicos koduotės (KOI8-R, Windows. MS-DOS, Macintosh ir ISO). Dėl šios priežasties dažnai kyla problemų perkeliant rusišką tekstą iš vieno kompiuterio į kitą, iš vienos programinės įrangos sistemos į kitą.

Chronologiškai vienas pirmųjų rusiškų raidžių kodavimo kompiuteriuose standartų buvo KOI8 („Informacijos mainų kodas, 8 bitų“). Ši koduotė buvo naudojama dar aštuntajame dešimtmetyje EC serijos kompiuteriuose, o nuo devintojo dešimtmečio vidurio pradėta naudoti pirmosiose rusintose UNIX operacinės sistemos versijose.


Nuo 90-ųjų pradžios, MS DOS operacinės sistemos dominavimo meto, kodavimas išlieka CP866 („CP“ reiškia „Code Page“, „code page“).


„Apple“ kompiuteriai, kuriuose veikia „Mac OS“ operacinė sistema, naudoja savo „Mac“ kodavimą.


Be to, Tarptautinė standartizacijos organizacija (Tarptautinė standartų organizacija, ISO) patvirtino kitą kodavimą, vadinamą ISO 8859-5, kaip rusų kalbos standartą.


Šiuo metu dažniausiai naudojama koduotė yra „Microsoft Windows“, sutrumpintai vadinama CP1251. Pristatė Microsoft; atsižvelgiant į plačiai paplitęs Operacinės sistemos(OS) ir kiti šios įmonės programinės įrangos produktai Rusijos Federacija ji tapo plačiai paplitusi.


Nuo 90-ųjų pabaigos simbolių kodavimo standartizavimo problema buvo išspręsta įvedus naują tarptautinį standartą, pavadintą Unicode.


Tai 16 bitų kodavimas, t.y. jame yra 2 baitai atminties vienam simboliui. Žinoma, tokiu atveju užimtos atminties kiekis padidėja 2 kartus. Tačiau tokia kodų lentelė leidžia įtraukti iki 65536 simbolių. Pilna Unicode standarto specifikacija apima visas egzistuojančias, išnykusias ir dirbtinai sukurtas pasaulio abėcėles, taip pat daugybę matematinių, muzikinių, cheminių ir kitų simbolių.

Vidinis žodžių vaizdavimas kompiuterio atmintyje

naudojant ASCII lentelę

Kartais nutinka taip, kad teksto, susidedančio iš rusiškos abėcėlės raidžių, gauto iš kito kompiuterio, nepavyksta perskaityti – monitoriaus ekrane matosi kažkokia „abrakadabra“. Taip yra dėl to, kad kompiuteriai naudoja skirtingas rusų kalbos simbolių koduotas.


Taigi kiekviena koduotė nurodoma savo kodų lentele. Kaip matyti iš lentelės, tas pats dvejetainis kodas įvairios koduotės priskiriami skirtingi simboliai.


Pavyzdžiui, skaitinių kodų 221, 194, 204 seka CP1251 koduotėje sudaro žodį „kompiuteris“, o kitose koduotėse tai bus beprasmis simbolių rinkinys.

Laimei, daugeliu atvejų vartotojui nereikia rūpintis tekstinių dokumentų perkodavimu, nes tai atlieka specialios keitiklių programos, įmontuotos programose.

V . Tekstinės informacijos kiekio apskaičiavimas

1 užduotis: Užkoduokite žodį „Roma“ naudodami KOI8-R ir CP1251 kodavimo lenteles.

Sprendimas:


2 užduotis: Darant prielaidą, kad kiekvienas simbolis yra užkoduotas vienu baitu, įvertinkite šio sakinio informacijos kiekį:

„Mano sąžiningiausių taisyklių dėdė,

Kai rimtai susirgau,

Jis privertė save gerbti

Ir aš negalėjau sugalvoti geresnio."

Sprendimas:Šioje frazėje yra 108 simboliai, įskaitant skyrybos ženklus, kabutes ir tarpus. Šį skaičių padauginame iš 8 bitų. Gauname 108*8=864 bitus.

3 užduotis: Abiejuose tekstuose yra tiek pat simbolių. Pirmasis tekstas parašytas rusų kalba, o antrasis – Naguri genties kalba, kurios abėcėlė susideda iš 16 simbolių. Kieno tekste pateikiama daugiau informacijos?

Sprendimas:

1) I \u003d K * a (teksto informacijos apimtis yra lygi simbolių skaičiaus ir vieno simbolio informacijos svorio sandaugai).

2) Nes abu tekstai turi vienodą simbolių skaičių (K), tada skirtumas priklauso nuo vieno abėcėlės simbolio informacijos turinio (a).

3) 2 a1 = 32, t.y. a 1 = 5 bitai, 2 a2 = 16, t.y. ir 2 = 4 bitai.

4) I 1 = K * 5 bitai, I 2 = K * 4 bitai.

5) Tai reiškia, kad rusų kalba parašytame tekste yra 5/4 kartų daugiau informacijos.

4 užduotis: Pranešimo apimtis, kurią sudaro 2048 simboliai, buvo 1/512 MB. Nustatykite abėcėlės galią.

Sprendimas:

1) I = 1/512 * 1024 * 1024 * 8 = 16384 bitai – pranešimo informacijos apimtis buvo konvertuota į bitus.

2) a \u003d I / K \u003d 16384 / 1024 \u003d 16 bitų - patenka į vieną abėcėlės ženklą.

3) 2*16*2048 = 65536 simboliai – naudojamos abėcėlės galia.

5 užduotis: Canon LBP lazerinis spausdintuvas spausdina vidutiniu 6,3 Kbps greičiu. Kiek laiko užtruks atspausdinti 8 puslapių dokumentą, jei žinoma, kad viename puslapyje yra vidutiniškai 45 eilutės, 70 simbolių eilutėje (1 simbolis – 1 baitas)?

Sprendimas:

1) Raskite informacijos kiekį 1 puslapyje: 45 * 70 * 8 bitai = 25200 bitų

2) Raskite informacijos kiekį 8 puslapiuose: 25200 * 8 = 201600 bitų

3) Mes nustatome vienodus matavimo vienetus. Norėdami tai padaryti, verčiame Mbps į bitus: 6,3 * 1024 = 6451,2 bps.

4) Raskite spausdinimo laiką: 201600: 6451,2 = 31 sekundė.

Bibliografija

1. Agejevas V.M. Informacijos ir kodavimo teorija: matavimo informacijos diskretizavimas ir kodavimas. - M.: MAI, 1977 m.

2. Kuzminas I.V., Kedrus V.A. Informacijos teorijos ir kodavimo pagrindai. - Kijevas, Viščos mokykla, 1986 m.

3. Paprasčiausi teksto šifravimo būdai / D.M. Zlatopolskis. - M.: Chistye Prudy, 2007 - 32 p.

4. Ugrinovičius N.D. Informatika ir informacinės technologijos. Vadovėlis 10-11 klasei / N.D. Ugrinovičius. – M.: BINOM. Žinių laboratorija, 2003. - 512 p.

5. http://school497.spb.edu.ru/uchint002/les10/les.html#n

KODAVIMO INFORMACIJA

KODAVIMO INFORMACIJA

Korespondencijos tarp pranešimo elementų ir signalų nustatymas, kurio pagalba jie gali būti fiksuojami.

Leisti IN, , - daug elementų žinutės, a abėcėlė su simboliais , Tegul vadinama baigtinė simbolių seka. žodis šioje abėcėlėje. Daug žodžių abėcėlėje A paskambino kodas, jei jis yra vienas su vienu korespondencija su rinkiniu IN. Kiekvienas žodis, įtrauktas į kodą, vadinamas. kodinis žodis. Iškviečiamas kodo žodžio simbolių skaičius. žodžio ilgis. Kodiniai žodžiai gali būti vienodi arba skirtingi. ilgio. Pagal šį kodą vadinamas. vienodas arba nelygus.

K. ir . tikslai: įvesties informacijos pateikimas, informacijos šaltinių derinimas su perdavimo kanalu, duomenų perdavimo ir apdorojimo klaidų aptikimas ir taisymas, pranešimo prasmės slėpimas (kriptografija) ir kt. objekto savybės, kaip taisyklė, yra tokios, kad kodą būtų galima pateikti ekonomiškiausiu būdu. Šaltinio koduotuvas išsprendžia šią problemą pašalindamas pranešimų perteklių. Tolesniems duomenų perdavimo etapams – perdavimui perdavimo kanalu ir (ar) saugojimui atminties įrenginiuose – reikia aptikti ir (ar) ištaisyti juose dėl trukdžių atsirandančias klaidas. Šie tikslai pasiekiami korekciniu kodavimu, kurį atlieka kanalo autorius. Galiausiai informacija apie iškraipymus apdorojant kompiuteriu atliekama naudojant aritmetiką. kodai.

Vertės kodavimas. Natūralusis skaičius N pavaizduota pozicinėje svorio reikšmių skaičių sistemoje, jei ryšys vyksta

kur yra skaitmeninė abėcėlė su P skaitmenys, " - skaitmenų svoriai, - skaitmenų skaičiai. Sąvoka "padėtis" reiškia, kad kode pateikiamas skaičius (arba tik kodas), išreikštas sąlygine lygybe

kiekybinis ekvivalentas, susietas su paveikslu a l, priklauso nuo jo vietos kode. Sąvoka „reikšminga“ reiškia, kad kiekvienas skaitmuo turi pl. Mažas užsakymo svoris 0 p skaitmeninių matavimų technologijoje jis tapatinamas su konvertavimo iš analoginio į skaitmeninį skiriamąją gebą. Abėcėlės pasirinkimas A ir svėrimo sistemos R nurodoma pozicinių skaičių sistemų klasifikacija (reikšmių kodavimas). Natūraliose sistemose

ir jeigu n- skaičių sistemos pagrindas - natūralusis skaičius, bet koks skaičius X galima pateikti kaip

Perkeltos abėcėlės pasirinkimas: A= (0, 1, . . ., P-1), A=(-p- 1, . . ., 1, 0) arba simetriškai: A = (-p- 1, . . ., -1, 0, 1, . . ., P- 1) leidžia pavaizduoti atitinkamai teigiamus, neigiamus arba bet kokius skaičius. Simetrinė sistema turi turėti nelyginį pagrindą.

Kompiuteris beveik išimtinai naudoja dvejetainę padėties poslinkio sistemą (n = 2) su skaičiais (0, 1) ir natūraliu svorių santykiu, vaizduojančiu skaičių seką.

Pavyzdžiui, galima naudoti kitą skaičių rinkinį. (-1, 1), suteikiantys tam tikrų specifinių pranašumų.

Vystosi dvejetainės sistemos, kurių skaitmenų svoriai yra ne natūraliuoju (2), o sudėtingesniu santykiu, sudarydami, pavyzdžiui, Fibonačio eilutę (arba „auksinį santykį“). Skaičius N Fibonačio kode pavaizduotas koeficientu

kur yra Fibonačio skaičiai, susiję su ryšiu

Dekompozicijos (4) skaičius N dviprasmiškai. Bet kam N yra kodas, kuriame nėra dviejų iš eilės einančių nulių, taip pat kodas, kuriame vienetai neegzistuoja. Dėl šių, kaip ir kitų struktūrinių Fibonačio kodų bei „auksinių“ kodų ypatybių, patogu kurti savaime koreguojančius keitiklius, kurie saugo ir skaičiuoja. prietaisai, skaitmeniniu būdu valdomos servo pavaros ir kt.

Trinarės skaičių sistemos naib. yra ekonomiški ta prasme, kad def. Simbolių skaičius gali išreikšti didžiausią skaičių įvairovę. Yra pagrindo manyti, kad ateityje būtent dėl ​​šios savybės bus atsižvelgta į trijų dalių simetrinę kodavimo sistemą su skaičiais (-1, 0, 1). dominuoja technologija. Problema išlieka elementų, įgyvendinančių pagrindines funkcijas trinarėje logikoje, sukūrimas: trinarinis keitiklis ir trejais NAND arba trejais NOR (žr. logika),

Specializuotuose matavimuose naudojami ne padėties kodai. ir paskaičiuoti. prietaisai . Paprasčiausias iš nepozicinių – vienetinį kodą galima gauti įdėjus (2) n=1 ir 0 p=1. Jis turi numerį N pasirodo kaip N=n+l - nuosekliai sumuojami vienetai. Pavyzdžiui, taip veikia impulsų skaitikliai.

Tarp nepozicinio kodavimo sistemų išsiskiria skaičių sistema liekamosiose klasėse (RNS). Skaičius N RNS yra vaizduojamas kaip sutvarkytas likučių (likučių) rinkinys koprime pagrindu p1, . . ., r p;, kur yra mažiausias likutis N modulo R. Pamatų sistema 1 p, 2 p, . . ., r p apibrėžia skaičių vaizdavimo diapazoną P = p 1 , p 2 , . . ., r p SOK aritmetikoje. operacijos atliekamos atskirai kiekvienam pagrindui, ir tai leidžia žymiai padidinti jų našumą. RNS patogu valdyti operacijas, nes klaidos yra lokalizuotos bazėse. Apskaičiuokite konkrečiai. Įrenginiai, veikiantys SOC, yra lentelės aritmetikos naudojimas: skaičiuojamos funkcijos reikšmės įvedamos į lentelę iš anksto, o tada gaunamos, kai gaunamos operandų reikšmės.

Efektyviu informacijos šaltinio kodavimu siekiama suderinti informacijos šaltinio (IS) informacijos savybes su perdavimo kanalu. AI turėtų išvesti , susidedanti iš raidžių m- raidžių abėcėlė

be to, raidžių išvaizda yra statistiškai nepriklausoma ir priklauso nuo pasiskirstymo

Šaltiniui būdinga entropija vienam simboliui

Entropija reiškia netikrumą dėl kito veikėjo pasirodymo AI išvestyje. Lygybė H(P)=0 pasiekiamas su išsigimusiu pasiskirstymu R, nes žinutė

nors jis yra deterministinis; lygybė pasiekiamas su lygiaverčiu įvykiu – didžiausio neapibrėžtumo situacija. Su m=2 ir vienoda raidžių išvaizda a 1 Ir a 2 entropija yra maksimali ir H(P) = 1.Ši reikšmė – neapibrėžtis su vienodai tikėtinu dviejų alternatyvų pasirinkimu – naudojama kaip entropijos vienetas – 1 .

Kiekvienam kodavimo būdui būdinga žr. numerį L (P) išvesties abėcėlės raidės vienai įvesties abėcėlės raidei Ir t. Dėl abėcėlinis kodavimas - žodžio ilgis abėcėlėje Į r. Jei kodavimas yra vienas su vienu, tada

Vertė Aš (P) = L(P)-H r (P) paskambino kodavimo perteklius paskirstyme R. Problema ta, kad tam tikroje „vienas su vienu“ kodavimo klasėje reikia rasti kodavimą, turintį min. dydžio I (P). Minimalumo egzistavimą ir jo reikšmę nustato Šenono teorema kanalui be triukšmo, kuri sako, kad šaltiniui su baigtine abėcėle A t su entropija H(P) šaltinio raidėms galima priskirti kodinius žodžius taip, kad plg. kodinio žodžio ilgis L (P) atitiks sąlygas

Optimalus kodas yra toks, kad joks kitas kodas nesuteiks mažesnės reikšmės L(P).

Konstruktyvi procedūra ieškant optimalaus. kodą tam tikram pranešimų rinkiniui koduoti 1952 metais pasiūlė D. R. Huffmanas. Idėja yra ta, kad abėcėlės raidės A t yra surikiuoti pagal ir trumpesni kodiniai žodžiai priskiriami labiau tikėtiniems. Huffmano kodas turi . savybės: žodis, atitinkantis mažiausiai tikėtiną pranešimą, turi didžiausią ilgį; du mažiausiai tikėtini pranešimai yra užkoduoti vienodo ilgio žodžiais, kurių vienas baigiasi nuliu, o kitas – vienu (r=2).

Optimalus vienodas kodavimas. Tegul šaltinis yra dviejų raidžių abėcėlė ir generuojami ilgio žodžiai l. Kalbant apie visą 2 rinkinį lžodžių (šaltinio žodynas) yra teiginys, kad už ir pakankamai didelis lšaltinio žodynas skirstomas į du pogrupius: lygiaverčių žodžių grupę (darbinis šaltinio žodynas) ir žodžių grupę, kurių bendra tikimybė artima nuliui ("netipinės" sekos). Čia H(R) – entropija vienam šaltinio simboliui. Darbo žodyne žodžių dalis yra labai maža ir didėja l linkęs į nulį. Vienodo arba blokinio kodavimo idėja yra ta, kad kodavimo įrenginys, gaudamas šaltinio žodžius kaip įvestį, kodinius žodžius suderina tik su žodžiais iš darbo žodyno, o likusius užkoduoja vienu žodžiu, turinčiu klaidos reikšmę. Klaidos tikimybę galima savavališkai sumažinti padidinus šaltinio žodžio ilgį. Šiuo atveju užkoduotų žodžių apimtis reikalauja kodinio žodžio simbolių. Kadangi darbinio žodyno žodžiai yra beveik vienodai tikėtini, kodiniai žodžiai bus vienodai tikėtini, o kodinio žodžio simbolio entropija bus artima 1 bitui. Todėl koduotuvas sukuria ilgio žodžius, taupydamas dėl to, kad „įkelia“ kiekvieną simbolį iki didžiausios galimos 1 bito informacijos apkrovos.

Šaltinio kodavimas įgauna naują prasmę dėl būtinybės „suspausti“ informacijos masyvus duomenų bazėse ir duomenų bankuose. Masyvai organizacinių, ekonominių, matavimo. informacija turi tokį didelį dubliavimą, kad leidžia iki 80–85 proc. Sukurtos duomenų bazių valdymo sistemos (DBVS) turi specialias. programos (priemonės), skirtos tekstui analizuoti, glaudinti ir atkurti, veikiančios aukščiau nurodytais principais.

Korekcinis informacijos kodavimas. Jo tikslas – aptikti ir (ar) ištaisyti kodinių žodžių klaidas, atsiradusias perduodant informaciją triukšmingu kanalu. Iškraipymą galima koreguoti įvedant perteklinę perdavimo sistemą. Šiuo atveju iš viso kanalo kodavimo priemonės žodžių rinkinio N0 tik N atitiks perduotus pranešimus (leistinus žodžius). Teoriškai šiuo atveju aptiktų klaidų dalis neviršys 1-N/N 0 .

Daroma prielaida, kad informacinis žodis U= (u 1, . . ., u n), kur u j=0, 1, tiekiamas į kanalo kodavimo įrenginio (toliau – kodavimo įrenginys) įvestį, kuris jam priskiria kodinį žodį X (x 1 , . .., xl), , Taigi koduotuvas prideda pagal apibrėžimą. žodžio taisyklė U grupė k=l-n pertekliniai (korekciniai) bitai. Kodinis žodis X patenka į triukšmingą kanalą, kur trukdžiai iškraipo kai kuriuos simbolius x i . Kanalo išvestyje gautas žodis Y= (1 val., . . ., y 2) patenka į dekoderį, kuris atkuria (su tono aproksimacija) žodį x. Kodo žodžiai yra naudojami kaip vektoriai linijinėje vektorių erdvėje su Hamingo metrika, kuri nurodo atstumą tarp vektorių

Šenono teorema dėl triukšmingų kanalų, teigianti, kad tinkamų kodų pagalba galima perduoti informaciją taip, kad paklaidos tikimybė po dekodavimo būtų savavališkai maža, su sąlyga, kad perdavimo sparta neviršija ryšio kanalo pralaidumo, nėra konstruktyvi: tai nenurodo kodo konstravimo būdo. Konstruojant kodą lemiamą reikšmę turi perduodamo žodžio klaidų atsiradimo modelio pasirinkimas.

Naibas. plačiai paplitęs simetrinio kanalo modelis su vienodai tikėtinomis paklaidomis decomp. tipai – perėjimai, pavyzdžiui, simbolis 0 į 1 ir 1 į 0.

Kanalo modelis „su trynimu“ yra specifinis. Tokio kanalo išvesties abėcėlėje yra specialus. trynimo simbolis, į kurį įvykus tokio tipo klaidai perkeliami įvesties abėcėlės simboliai.

Išplėstas skirtumas. prielaidos dėl klaidų pasiskirstymo perduodamoje simbolių sekoje (kodinis žodis). Nepriklausomų klaidų modelis (kanalas be atminties), sugrupuotų klaidų modelis (klaidų pliūpsniai), klaidų, esančių konkrečiame atstumas vienas nuo kito ir tt Egzistuoja plačiai paplitusios prielaidos apie kodinių žodžių klaidų daugumą.

Remiantis pastarąja prielaida, kodo koregavimo gebėjimas įvertinamas pagal jo pagalba aptiktų ir (ar) ištaisytų klaidų skaičių kodiniuose žodžiuose. Daroma prielaida, kad kanale su X simbolis po simbolio sumuojamas (mod 2) triukšmo vektorius Z, formuojant žodį. Gautos paklaidos daugiklis yra toks pat kaip vienetų skaičius (Hammingo svoris). Z. Vektoryje nuo l elementų ne daugiau kaip r vienetai gali būti išdėstyti būdais.

Tai yra įvairių klaidų, kurios gali atsirasti perdavimo metu.

Pagrindinė kodo charakteristika, kuri lemia jo gebėjimą taisyti nepriklausomas klaidas, yra kodo atstumas. Kodo atstumas yra mažiausias Hamingo atstumas tarp visų galimų žodžių = ( , . . ., ) ir kodo. Kad kodas aptiktų visus derinius s klaidų ir ištaisė visus derinius t klaidų, būtina ir pakanka, kad kodo atstumas būtų lygus s+t+1.

Plati simetrinio kanalo kodų klasė yra linijiniai (grupiniai) kodai, pavyzdžiui, Hamingo kodai, kurie plačiai naudojami pagrindinėje kompiuterio atmintyje esančiai informacijai apsaugoti. Hamingo kodas turi kodo atstumą d=3, ištaiso pavienes klaidas ir aptinka dvigubas klaidas. Jame yra kontroliniai skaitmenys, esantys 2°, 2, 2 2, . . . Linijinis kodas pateikiamas matricų pora: generuojantis , , ir check . Generuojančios matricos eilutės yra tiesiškai nepriklausomi vektoriai, kurie sudaro erdvės, kurioje yra 2 n elementų – kodo žodžių, pagrindą. Kiekviena tikrinimo matricos eilutė yra stačiakampė eilutėms , ir

Linijinio kodo koduotuvas generuoja kodo žodžius pagal taisyklę X T = U T G. Iškraipymo modelis daro prielaidą, kad kanale su X simbolis po simbolio sumuojamas triukšmo vektorius Z, formuojant žodį Y=X+Z.

Dekodavimo idėja yra sukurti produktą S T \u003d Y T H T, vadinamas sindromu. Lygybė S= 0 reiškia tai Z=0, arba klaida neaptinkama. Sindromas turi 2 k -1 nenulinės realizacijos, kurių kiekviena gali būti naudojama norint nurodyti įvykusią klaidą.

Ciklinis. kodai yra įtraukti kaip poklasis į grupių kodus. Juose kartu su žodžiu X ir visas jo ciklas-lich įeina. permutacijas. Kodiniai žodžiai sudaromi kaip dviejų daugianario sandauga: U (E) laipsnis P- 1, koeficientas to-rogo sudaro informacinį žodį tu, ir generatyvinis g (E) laipsnis l-p, neredukuojamas ir dalijantis be liekanos dvinario (1+ E l). Dekodavimas susideda iš gauto žodžio (polinomo) padalijimo iš g(E). Ne nulinės liekanos buvimas rodo klaidos buvimą. Ciklinis. kodai dažniausiai būna nesistemingi.

specialistas. cikliškas kodai yra skirti aptikti ir ištaisyti klaidų serijas, pavyzdžiui, gaisro kodai, apibrėžiami generuojant formos polinomus g(E) = =p(E)(E c +1), Kur p(E) – neredukuojamas daugianaris ir kiekis Su nustatomas pagal ištaisytų ir aptiktų klaidų pliūpsnių ilgį.

Klaidų krūvos būdingos magnetiniams saugojimo įrenginiams. laikikliai, ypač magnetinėms pavaroms. diskai (NMD) modernūs. kompiuteris (žr įrenginio atmintis). Siekiant apsaugoti duomenis NMD, todėl K. ir yra plačiai naudojamas. cikliškas aparatinės įrangos įdiegtus kodus.

Aritmetiniai kodai skirtas aptikti klaidas, atsiradusias atliekant aritmetiką. kompiuterinės operacijos. Aritmetikos teorijoje. koduojant, pristatomos svorio, atstumo ir paklaidos sąvokos, kurios skiriasi nuo Hamingo. Aritmetika skaičiaus svoris apibrėžiamas kaip min. terminų skaičius, atvaizduojantis skaičių formoje , . Klaidos, dėl kurių skaičiaus dydis pasikeičia, r "= 0, 1, 2, ..., vadinamos aritmetinėmis. Aritmetinis atstumas tarp N 1 Ir N 2 - aritmetika skirtumo svoris yra lygus paklaidos, kuri verčia skaičių, daugybei N 1 V N2, ir nustato taisomųjų gebėjimų aritmetiką. kodas yra panašus į Hamingo atstumą.

Bendrai AN- numerio kodavimas N- operandas - atliekamas padauginus jį iš specialiai parinkto koeficiento A. Taigi, 3A kodas, kurio kodo atstumas yra 2, aptinka pavienes klaidas, padalijus sumą iš 3. Klaidos aptinkamos su ne nuline liekana: aritmetine reikšme. klaidų 2 i net nesidalija iš 3. Be pavienių klaidų, esant A=3, taip pat randama dalis dvigubų klaidų – tų, kurių teisingas ir klaidingas rezultatas turi nesutampančius likučius padalijus iš 3.

Kriptografija atliekama pakeitimo būdu, kai kiekvienai šifruoto pranešimo raidei priskiriama konkreti raidė. simbolis (pvz., kita raidė) arba permutacija, kai sukeičiamos raidės dirbtiniuose teksto blokuose, arba šių metodų derinys. Šenonas parodė, kad galimos kriptogramos, kurių negalima iššifruoti, kad būtų priimtina.

Lit.: 1) Stachovas A.P., Įvadas į algoritminę matavimo teoriją, M., 1977; jo paties „Auksinio santykio kodai“, M., 1984 m. 2) Akushsky I., Yuditsky D., Mašinų aritmetika liekamosiose klasėse, Maskva, 1968; 3) Gal-lager R., Informacijos ir patikimos komunikacijos teorija, vert. iš anglų k., M., 1974; 4) Dadaev Yu. G., Aritmetinių kodų teorija, M., 1981; 5) Aršinovas M. N., Sadovskis L. E., Kodai ir matematika, Maskva, 1983. L. N. Efimovas.

Fizinė enciklopedija. 5 tomuose. - M.: Tarybinė enciklopedija. Vyriausiasis redaktorius A. M. Prokhorovas. 1988 .


Pažiūrėkite, kas yra "INFORMACIJOS KODAVIMAS" kituose žodynuose:

    informacijos kodavimas- Duomenų transformavimo ir (ar) pateikimo procesas. [GOST 7.0 99] Temos informacija bibliotekos veikla EN informacijos kodavimas FR kodas de l'information ... Techninis vertėjo vadovas

Panašūs straipsniai

2023 dvezhizni.ru. Medicinos portalas.