Çeşitli Kiril kodlamaları

Ders konusu: "Metin bilgilerini kodlama"

1. Bir kişi, sembolleri stillerine ve bir bilgisayarı - kodlara göre ayırt eder. Her karaktere benzersiz bir kod atanır. Geleneksel kodlamalar, bir karakteri kodlamak için 8 bit kullanır. Bu 8 bitlik kod, 256 farklı karakteri kodlamanıza izin verir.

Bir sembole belirli bir sayısal kod atamak bir gelenek meselesidir. Kod, uluslararası bir standart olarak kabul edilmiştir. ASCII tablosu(Bilgi Değişimi için Amerikan Standart Kodu), karakterlerin ilk yarısını 0'dan 127'ye kadar sayısal kodlarla kodlar (0'dan 32'ye kadar olan kodlar karakterlere değil işlev tuşlarına atanır).

Uluslararası ASCII kodlaması

Ulusal kodlama tabloları standartları, kod tablosunun uluslararası bölümünü değiştirmeden içerir ve ikinci yarısında ulusal alfabelerin kodlarını, sözde sembolleri ve bazı matematiksel işaretleri içerir.

Ne yazık ki, şu anda Rusça belgelerle çalışırken ek zorluklara neden olan beş farklı Kiril kodlaması (KOI8-R, Windows, MS-DOS, Macintosh ve ISO) bulunmaktadır.
Kronolojik olarak, bilgisayarlarda Rus harflerini kodlamak için ilk standartlardan biri KOI8 ("Bilgi Değişim Kodu, 8 bit") idi. Bu kodlama 70'lerde EC serisi bilgisayarların bilgisayarlarında kullanıldı ve 80'lerin ortalarından itibaren UNIX işletim sisteminin ilk Ruslaştırılmış sürümlerinde kullanılmaya başlandı.

90'lı yılların başından beri, MS DOS işletim sisteminin hakimiyeti döneminde, CP866 kodlaması kalmıştır.

Uluslararası Standardizasyon Örgütü (Uluslararası Standartlar Örgütü, ISO), ISO 8859-5 adlı başka bir kodlamayı Rus dili için bir standart olarak onayladı.

Rusça karakter kodlaması ISO 8859-5


90'ların sonunda, bir karaktere bir değil iki bayt atayan yeni bir uluslararası Unicode standardı ortaya çıktı ve bu nedenle 256 değil 65536 farklı karakteri kodlamak için kullanılabilir. Unicode standardının eksiksiz belirtimi, dünyadaki tüm mevcut, tükenmiş ve yapay olarak oluşturulmuş alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.

Kodlama tablolarına dayalı olarak çeşitli kodlamalarda "bilgisayar" kelimesi için ondalık kod dizileri:

Açıklama sırasında kod tabloları projektör aracılığıyla gösterilir.

2. Karakter kodları MS Word kullanılarak da bulunabilir. (Ekle - Simge... ) . Birkaç sayısal kod bulun ve değerlerini kod tablosundaki değerle karşılaştırın.CP1251.


3. Not Defteri'ni açıyorum ve CP866 ve CP1251 tablolarını kodluyorum. Öğrenciler herhangi bir kısa kelimeyi adlandırır ve bu kelime, tuşa basarken CP866 ve CP1251 kodlarını kullanarak Not Defteri'ne yazılır. alternatif birinde, sonra başka bir kodlamada. Kodlar öğrenciler tarafından kod tablosunda aranarak aranır (CP866 kodlamasında kod yazılır, CP1251 kodlamasında kodun önüne sıfır yazılır, örneğin "Ж" - 198 kodu. Tuşa basıldığında alternatif 0198'i çevirin). Harfler her zaman kodsuz girilebilir, ancak Notepad gibi bir metin düzenleyicide bir tablo almanız gerekirse, kodsuz yapamazsınız. Tablonun öğeleri tablo kodunda mevcuttur.CP866. Bir örnek gösteriyorum. Ancak burada bir yazı tipi seçmek önemlidir. Tablonun altında listelenmiştir.

4. Herhangi bir Web sayfasını veya Rusça siteyi, örneğin bir okul sitesini açarım. Kodlamaları değiştiririm, sayfanın görünümünü karşılaştırırım.

IV. demirleme

Bilgisayardaki görevlere başlamadan önce, monitör ekranından gözlere olan mesafenin ne kadar olması gerektiğini hatırlayalım. (60-70cm). nasıl önlenir zararlı etki monitörden mi (Monitör ekranı temiz olmalıdır. Parmaklarınızla dokunmayın)

Sorular ve görevler:
1. Unicode kodlamadan (kodlama tablosu 65536 karakter içerir) Windows CP1251 kodlamaya (kodlama tablosu 256 karakter içerir) dönüştürüldüğünde, bir metin sayfasının bilgi hacmi kaç kez azalır? (2 kez)

2. 8 bitlik kodlamada BİLİŞİM kelimesini içeren metnin bilgi hacmi nedir? 16 bit kodlamada? (11 bayt, 22 bayt)

3. Ondalık kodla verilen aşağıdaki metinlerin kodunu çözün:
a) 087 111 114 100; (Kelime)
b) 068 079 083; (DOS)
c) 080 097 105 110 116 098 114 117 115 104. (boya fırçası)

4. CP1251 kodlamasında yazılan "disk" kelimesi diğer kodlamalarda nasıl görünecek?
(KOI8-R: DHYAY ; CP866: fshё ; Mac: disk ; ISO:fshёb )

5. Metin modunda, ekran genellikle her satırı 80 karakterden oluşan 25 satıra bölünür. Monitörün tüm ekranını kaplayan metin bilgisi miktarını belirleyin. (25 x 80 = 2000 bayt)

Ödevlerin metinleri her öğrencinin bilgisayarında "Coding. Assignments.doc" dosyasında bulunmaktadır.

Bunlara ek olarak. Not Defteri'nde herhangi bir tablo oluşturun. Lucida Konsol yazı tipi.

Şu anda çoğu kullanıcılar bilgisayar yardımıyla karakterlerden oluşan metin bilgilerini işler: harfler, sayılar, noktalama işaretleri vb.

Geleneksel olarak, bir karakteri kodlamak için 1 bayta eşit miktarda bilgi kullanılır, yani. I \u003d 1 bayt \u003d 8 bit. Olası olayların sayısı K ile bilgi miktarı I arasında ilişki kuran bir formül kullanarak, kaç farklı karakterin kodlanabileceğini hesaplayabilirsiniz (karakterlerin olası olaylar olduğunu varsayarak):

K \u003d 2 ben \u003d 2 8 \u003d 256,

yani sunum için metin bilgisi 256 karakter kapasiteli bir alfabe kullanılabilir.

Kodlamanın özü, her karaktere 00000000 ila 11111111 arasında bir ikili kod veya 0 ila 255 arasında karşılık gelen ondalık kod atanmasıdır (genellikle kod ayrıca 00-FF onaltılık biçiminde sunulur).

Genel olarak konuşursak, bir sembol ile kodu arasındaki yazışma oldukça keyfi olarak seçilebilir. Ancak pratikte bir bilgisayarda oluşturulan metni başka bir bilgisayarda okuyabilmek gerekir. Bu nedenle kodlama tabloları standardize edilmeye çalışılmaktadır. Bugün kullanılan hemen hemen tüm tablolar ASCII'ye (Bilgi Değişimi için Amerikan Standart Kodu) dayanmaktadır. Bu standart, kod tablosunun alt yarısı için değerleri tanımlar - ilk 127 kod (32 kontrol kodu, temel noktalama işaretleri ve aritmetik semboller, rakamlar ve edebiyat). Sonuç olarak, belirli bir bilgisayarda hangi kodlama kullanılırsa kullanılsın bu karakterler doğru şekilde görüntülenir. "Ulusal" semboller ve "tipografik" işaretlerle durum daha da kötü. Ve Kiril alfabesini kullanan diller (Rusça, Ukraynaca, Belarusça, Bulgarca vb.) Özellikle şanssızdı. Örneğin, Rus dili için beş kodlama tablosu artık yaygın olarak kullanılmaktadır:

CP1251 (Windows kodlu) - Windows 3.1 ve Windows 9x altında çalışırken PC uyumlu

· KOI-8r, halen kullanımda olan en eski kodlamadır. UNIX çalıştıran bilgisayarlarda kullanılan, İnternet'teki Rusça metinler için fiili standarttır.

· CP866 (DOS alternatifi) - DOS ve OS / 2 işletim sistemleriyle çalışırken PC uyumlu bilgisayarlarda ve amatör uluslararası Fido ağında (Fidonet).

· Macintosh Kiril - adından da anlaşılacağı gibi, Macintosh'taki tüm Kiril dilleriyle çalışacak şekilde tasarlanmıştır (Ukraynaca hariç).

· ISO-8859 - bu kodlama, Kiril metinleri için uluslararası bir standart olarak tasarlanmıştır, ancak pratik olarak Rusya'da kullanılmamaktadır.

Ancak, çoğu durumda, metin belgelerinin kod çevrimiyle ilgilenen kullanıcı değil, özel programlar- uygulamalara yerleşik dönüştürücüler.

1997'den beri Microsoft Windows & Office'in en son sürümleri, her karakter için 2 bayt alan yeni Unicode kodlamayı desteklemektedir ve bu nedenle 256 karakter değil, 65536 farklı karakter kodlamak mümkündür.

İş bitimi -

Bu konu şuna aittir:

Anlatım 1. Giriş. bilişim kavramı

Bilişimin Yapısı... Geniş anlamda, Bilişim, farklılıkların birliğidir... Dar anlamda, Bilişim, teknik araçların birbiriyle ilişkili üç parçasından oluşuyor olarak temsil edilebilir...

Bu konuda ek malzemeye ihtiyacınız varsa veya aradığınızı bulamadıysanız, eser veritabanımızdaki aramayı kullanmanızı öneririz:

Alınan malzeme ile ne yapacağız:

Bu materyalin sizin için yararlı olduğu ortaya çıktıysa, onu sosyal ağlardaki sayfanıza kaydedebilirsiniz:

Bu bölümdeki tüm konular:

bilişim kavramı
Bilişim terimi 1960'larda ortaya çıktı. Fransa'da elektronik bilgisayarlar kullanılarak otomatikleştirilmiş bilgi işleme alanının adı için. Fransızca

Bilgi toplumu
Bilgi kültürü, bilgi ile kasıtlı olarak çalışma ve bilgisayar bilgi teknolojisini, modern teknolojileri kullanma, onu alma, işleme ve iletme yeteneğidir.

Bilgi hizmetleri pazarının gelişim tarihi
50'li yılların ortalarından beri. istikrarlı bir pazar oluşumu başladı bilgi hizmetleri. Bilgi hizmetlerinin ana sağlayıcıları şunlardı: akademik, profesyonel ve bilimsel kuruluşların bilgi hizmetleri.

Anlatım 2. Bilgi, mesajlar, sinyaller
Bilgi, madde ve enerji ile birlikte dünyamızın birincil kavramıdır ve bu nedenle katı bir şekilde tanımlanamaz. Yalnızca ana özelliklerini listeleyebiliriz, örneğin:

Sözdizimsel bilgi ölçüsü
Bilgi miktarının bu ölçüsü, nesneyle anlamsal bir ilişki ifade etmeyen kişisel olmayan bilgilerle çalışır. Sözdizimsel düzeyde, medya türü ve bilginin sunulma şekli dikkate alınır.

Anlamsal bilgi ölçüsü
Bilginin anlamsal içeriğini ölçmek için, yani. anlamsal düzeydeki miktarı, bilginin anlamsal özelliklerini sp ile ilişkilendiren eş anlamlılar ölçüsü

Pragmatik bilgi ölçüsü
Bu ölçü, kullanıcının tedarik edilen zincire ulaşması için bilginin (değerin) kullanışlılığını belirler. Bu ölçü aynı zamanda, bu bilgiyi kullanmanın özelliklerinden dolayı göreceli bir değerdir.

Bilginin nitel özellikleri
Bilgiyi kullanma olasılığı ve etkinliği, temsil edilebilirlik, içerik, yeterli bilgi gibi temel tüketici kalite göstergeleri tarafından belirlenir.

Grafik bilgi kodlaması
Grafik bilgi iki biçimde sunulabilir: analog veya ayrık. Rengi sürekli değişen bir resim,

bit eşlem
Büyüteçle, örneğin bir gazeteden siyah beyaz bir grafik görüntünün aşağıdakilerden oluştuğunu görebilirsiniz. küçük noktalar, belirli bir desen oluşturan - raster. 19. yüzyılda Fransa'da

CMYK modeli
Bu model, eksiltici renk üretimine dayanmaktadır (yansıtıcı nesnelerin özelliği). Ana renklerin her biri ek bir renkle ilişkilendirilir (ana rengi tamamlayan

Grafik Modları
Renkli grafiklerin çeşitli gösterim modları vardır: Tam renkli (Gerçek Renk) - bileşenlerin her birinin parlaklığını kodlamak için 256 değer kullanılır (sekiz ikili basamak

Vektör ve fraktal görüntüler
Bir vektör görüntüsü, temel segmentlerden ve yaylardan oluşan bir grafik nesnedir. Bir görüntünün temel öğesi bir çizgidir. Herhangi bir nesne gibi, sahip olduğu

Ses kodlaması
Kulakla, bir kişi 16 Hz ila 20 kHz (saniyede 1 Hz - 1 salınım) aralığında bir frekansa sahip olan elastik dalgaları algılar. Buna göre herhangi bir ortamdaki frekansları l olan elastik dalgalar

Ses bilgilerinin dijitalden analoğa ve analogdan dijitale dönüştürülmesi
Ses dalgaları, bir mikrofon kullanılarak analog alternatif elektrik sinyaline dönüştürülür. Sinyali dijitale dönüştüren bir cihaz olan analogdan dijitale dönüştürücüye (ADC) girer.

örnekleme parametreleri
Frekans - saniyedeki analog sinyal amplitüd ölçümlerinin sayısı. Örnekleme frekansı, üst kenarın frekansının iki katından fazla değilse

Bilgi sıkıştırma
Kodlama üç büyük gruba ayrılır - sıkıştırma (verimli kodlar), hata düzeltme kodlaması ve kriptografi. Bilgiyi sıkıştırmak için tasarlanan kodlar sırasıyla şu bölümlere ayrılır:

kayıpsız sıkıştırma
En iyilerinden biri basit yollar bilgi sıkıştırma - grup kodlaması. Bu şemaya göre, bir dizi yinelenen değer (örneğin bir sayı) tek bir değerle değiştirilir.

Kayıplı sıkıştırma
paketleme için kullanılır grafik görüntüler. Bu yöntem, insanın görüntü algısının özelliklerine dayanmaktadır. İçin insan gözü parlaklık renk bilgisinden daha önemlidir

Bilgi devrimleri
Medeniyetin gelişim tarihinde, bilgi işleme alanındaki temel değişiklikler nedeniyle sosyal ilişkilerin dönüşümleri olan birkaç bilgi devrimi olmuştur. Bu dönüşümler sonucunda

Bir bilgi sistemi kavramı
Bir sistem, aynı anda hem tek bir bütün olarak hem de belirlenen hedeflere ulaşmak için birleşmiş bir dizi heterojen unsur olarak kabul edilen herhangi bir nesne olarak anlaşılır. Sistemler

Bilgi sistemlerinin gelişim aşamaları
Bilgi sistemlerinin gelişim tarihi ve kullanım amaçları farklı dönemler Tablo 1'de sunulmaktadır: Tablo 1. Bilgi sistemlerinin kullanımına yönelik yaklaşımın değiştirilmesi

IS'deki işlemler
IS'nin herhangi bir değerde çalışmasını sağlayan süreçler, şartlı olarak bir diyagram şeklinde gösterilebilir. IS bloklardan oluşur: harici veya dahili kaynaklardan bilgi girişi;

Bilgi sistemi yapısı
Genel yapı IS, kapsamından bağımsız olarak bir dizi alt sistem olarak düşünülebilir. Böylece, herhangi bir IS'nin yapısı aşağıdaki gibi temsil edilebilir.

BT eskimesi
BT için modası geçmiş olmaları ve yerlerine yenilerinin gelmesi oldukça doğaldır. Örnek. Bilgisayar merkezindeki ana bilgisayardaki programların toplu olarak işlenmesi teknolojisinin yerini teknoloji almıştır.

BT'yi kullanma metodolojisi
Bilgisayar merkezlerinin bilgisayarlarındaki bilgilerin merkezi olarak işlenmesi, tarihsel olarak geliştirilen ilk teknolojiydi. Toplu kullanım için büyük bilgi işlem merkezleri (CC) oluşturuldu

Bir bilgisayarın komut sistemi, bu bilgisayarın yürütebileceği bir dizi komuttur.
Bilgisayar tarafından yürütülmek üzere sunulan komutlar dizisine program denir. Modern bilgisayarların çeşitliliğine rağmen yapıları ortak mantıksal temellere dayanmaktadır.

PC'nin ana blokları ve anlamları
Pirinç. Yapısal şema kişisel bilgisayar Mikroişlemci (MP). merkezi

Genişletme otobüsleri
ISA (Endüstri Standardı Mimarisi) veri yolu - 16 bit veri yolu ve 24 bit adres yolu, çalışma frekansı 16 MHz, ancak

Yerel otobüsler
Yerel veri yolları doğrudan MP veriyoluna bağlanır, MP saat frekansında çalışır ve MP ile ilgili olarak bazı yüksek hızlı harici cihazlarla iletişim sağlar: ana ve harici bellek

MP'nin amacı ve türleri
MP aşağıdaki işlevleri yerine getirir: OP'den gelen komutları okuma ve çözme; OP'den ve VU adaptörlerinin kayıtlarından veri okuma; Bağdaştırıcılardan istek ve komut alma ve işleme

MP yapısı
Mikroişlemciler iki bölümden oluşur: birkaç adres kaydı dışında kontrol ünitesi, ALU ve MPPS'yi içeren ameliyathane; MPP adres kayıtlarını içeren arayüz,

önbellek
Önbellek, RAM ile MP arasında bir tampon görevi gören ve işlemlerin hızını artırmanıza izin veren yüksek hızlı bir bellektir. Önbellek kayıtlarına kullanıcı erişemez; dolayısıyla "önbellek" adı

OP'nin fiziksel yapısı
OP, RAM ve ROM'u, yani RAM ve ROM'u içerir. RAM, PC işleminin mevcut aşamasında doğrudan yer alan bilgileri (programlar ve veriler) depolamak için tasarlanmıştır.

OP'nin mantıksal yapısı
Bir megabayt RAM alanının dağılımı, Şek. 3.4. Tüm OP'nin mantıksal yapısı, Şek. 3.5. Her bellek hücresinin kendine özgü (diğerlerinden farklı) adresi vardır.

Harici bellek disk sürücüleri
Disk depolama aygıtları, doğrudan erişim aygıtları olarak sınıflandırılır. Diskin herhangi bir bölümüne hızlı erişim şu şekilde sağlanır: diskin hızlı dönüşü (esnek - yaklaşık 300 rpm, sert - yakl.

Video terminal cihazları
Video terminali bir video monitöründen (ekran) ve bir video denetleyicisinden (adaptör) oluşur. Video denetleyicileri, PC sistem biriminin bir parçasıdır (anakart yuvasına takılı video kartında bulunurlar).

Yazıcılar
Yazıcılar (baskı cihazları), bilgi ASCII kodlarını karşılık gelen grafik karakterlere (harfler, sayılar, işaretler vb.) Dönüştüren ve e'yi düzelten bir bilgisayardan veri çıkış cihazlarıdır.

tarayıcılar
Tarayıcı, doğrudan bir kağıt belgeden bilgisayara bilgi girmeye yarayan bir aygıttır. Metinler, şemalar, çizimler, grafikler, fotoğraflar ve diğer grafik bilgileri girebilirsiniz. tarayıcı ağırlığı

Süper bilgisayar.
Süper bilgisayarlar, saniyede yüz milyonlarca - saniyede on milyarlarca işlem hızına sahip güçlü çok işlemcili bilgisayarları içerir. 2000 yılının tipik bir süper bilgisayar modeli,

TAŞINABİLİR BİLGİSAYARLAR.
Taşınabilir bilgisayarlar, kişisel bilgisayarların hızla büyüyen bir alt sınıfıdır. Uzmanlara göre, 1998'de kullanıcıların %50'den fazlası taşınabilir makineler kullanacak ve

Bilgi aktarım süreci
Herhangi bir iletişim ağı şu bileşenleri içermelidir: verici, iletim ortamı, alıcı. Verici, veri kaynağı olan bir cihazdır.

Abone bilgisayarlar arasındaki etkileşim biçimleri
Abone bilgisayarları arasında aşağıdaki ana etkileşim biçimleri vardır. 1. Uzak terminal işlemi - abone bilgisayarlarından birinin terminalinden işleme erişim sağlar

Açık Sistem Etkileşim Modeli
VS ağları ve ağ yazılımı üreticilerinin çeşitliliği, farklı mimarilere sahip ağların birleştirilmesi sorununa yol açmıştır. Bunun için açık sistem mimarisi modeli geliştirilmiştir. açık

Bilgisayar ağ protokolleri
Bir ağda bilgi alışverişi yapılırken, açık sistem etkileşim modelinin her seviyesi kendi başlığına tepki verir, yani modelin tek hat seviyeleri arasında farklı şekillerde bir etkileşim vardır.

Yerel bölge ağları
Herhangi bir bilgisayar ağının temel amacı, kendisine bağlı kullanıcılara bilgi ve bilgi işlem kaynaklarının sunulmasıdır. Bu açıdan bakıldığında, LAN bir kepçe olarak kabul edilebilir.

Temel LAN topolojileri
Bir LAN'ın topolojisi, ağ düğümlerinin bağlantılarının ortalama bir geometrik diyagramıdır. VS, bir dizi düğüm olarak düşünülebilir - doğrudan ön tarafa bağlı cihazlar

Fiziksel iletim ortamı LAN
Bir LAN'ın fiziksel iletim ortamı üç türle temsil edilebilir. 1. Bükümlü çift. Birlikte bükülmüş iki yalıtılmış telden oluşur. Telleri bükmek harici etkisini azaltır

Medya Erişim Yöntemleri
Medya erişim yöntemi, hangi ağ düğümlerinin bir ağ kaynağına erişim kazandığına göre bir dizi kuralın uygulanmasını sağlayan bir yöntemdir. İki ana sınıf var

Bir LAN'a katılma yolları
kullanım nedenleri çeşitli yollar LAN ilişkilendirmeleri aşağıdaki gibidir: LAN'ın teknik özellikleri tükenmiştir, yeni kullanıcılar bağlayarak ve onu mevcut bir LAN ile birleştirerek başka bir LAN oluşturmak gerekir.

İnternet küresel ağı
İnternet, bireysel ağları birbirine bağlayan bir ağdır. İnternetin mantıksal yapısı, kendi sanal alanına sahip bir tür sanal ilişkidir. Temel hücre

Sistem yazılımı
Sistem yazılımı, bir bilgisayarın ve bilgisayar ağlarının çalışmasını sağlamak için bir dizi program ve yazılım sistemidir. Sistem yazılımının amacı: bir işletim ortamı yaratmak f

Programlama Teknolojisi Araç Seti
Programlama teknolojisi araç seti, program geliştirme sürecini sağlar ve bir geliştirme aracı olan özel yazılım içerir. Bu sınıfın yazılımı

Uygulama paketleri
Uygulama yazılımı, işlevsel sorunları çözmek için bir yazılım araç seti olarak hizmet eder ve en çok sayıda yazılım sınıfıdır. Bu sınıf, bilgileri işleyen yazılım ürünlerini içerir.

Yazılım Koruması
Yazılım koruması aşağıdaki hedefleri takip eder: · Programlara yetkisiz erişimin veya kasıtlı olarak imha edilmesinin ve çalınmasının kısıtlanması; izinsiz kopyalamanın hariç tutulması

  • Belge oluşturma ve düzenleme

  • Belge Biçimlendirme

  • masalar

  • Bilgisayar sözlükleri ve makine çevirisi sistemleri

  • OCR sistemleri



  • Metin Bilgileri

    • Metin Bilgileri - yazılı olarak doğal ve resmi diller kullanılarak ifade edilen bilgiler

    • Metin şunlardan oluşur:

    • edebiyat ( Rus ve İngiliz alfabelerinin büyük ve küçük harfleri)

    • basamak ( 1, 2, … 9 )

    • işaretler ( ! , @ ? # % ^ & . )

    • matematiksel semboller ( + - * / = )



    ikili işaret sistemi

    • Bir bilgisayarda metinsel bilgileri işlemek için, onu sunmak gerekir. ikili işaret sistemi

    • N=2i , Nerede

    • N karakter sayısıdır;

    • i - bir karakteri kodlamak için ayrılan bilgi miktarı



    • Her karakteri kodlamak için 8 bit bilgi gereklidir (N=28 → N=256)

    • Her karakter, aralıktaki benzersiz bir ikili koda karşılık gelir 00000000'den 11111111'e (ondalık kodda 0 - 255 )



    Kodlar 0 - 32

    • Kodlar 0 - 32 – işlemlere karşılık gelir (satır besleme, boşluk girişi, vb.)

    • Kodlar 33 ila 127 - uluslararası, Latin alfabesinin karakterlerine, sayılara, noktalama işaretlerine ve aritmetik işlemlere karşılık gelir

    • Kodlar 128 ila 255 – ulusal, yani farklı ulusal kodlamalarda, farklı karakterler aynı koda karşılık gelir





    • Rus harfleri için 5 farklı 8 bitlik kod tablosu vardır: Windows, MS-DOS, KOI-8, Mac, ISO



    Unicode

    • Unicode - her karakter için 2 bayt (16 bit) tahsis eden metin karakterlerini kodlamak için yeni bir uluslararası standart

    • Bu standart 65.536 karakteri kodlayabilir (N=216 → N= 65.536)

    • Unicode tablosu, Rus ve Latin alfabelerini, sayıları, işaretleri ve matematiksel sembolleri, Yunanca, Arapça, İbranice ve diğer alfabeleri içerir.



    • Metin modunda, bilgisayar monitör ekranı genellikle her satırı 80 karakterden oluşan 25 satıra bölünür. Unicode kodlamada tüm monitör ekranını kaplayan metin bilgisi miktarını belirleme

    • Klavyeden bilgi girme konusunda bilgili bir bilgisayar kullanıcısı dakikada 100 karakter girebilir. Windows kodlamada bir kullanıcı bir dakikada ne kadar bilgi girebilir? Unicode kodlama?



    • Görevi tamamlamak için şunu kullanın:

    • Açık Ofis Yazarı

    • Program Hesaplayıcı

    • Dosyayı klasörünüze "Rus harflerini kodlama" adı altında kaydedin.





    Hangi Hafıza ASCII?

    • Hangi Hafıza bir kodlama tablosu kullandığı biliniyorsa aşağıdaki metni alacaktır ASCII?

    • Yeni Yılınız Kutlu Olsun sevgili dostlar!

    • Kaç tane karakterler tabloyu kullanarak metinde yer alan ASCII 24.576 bit bellek kapladığı biliniyorsa?



    malzemeler

    • malzemeler

    • → Semakin

    • → 8. sınıf

    • → 13. Bilgisayar belleğindeki metinlerin sunumu

    • → 89. İnteraktif soru kitabı

    • → Antrenman





    metin editörleri

    • metin editörleri – Aşağıdakilere izin veren genel amaçlı uygulamalar:

    • yaratmak,

    • düzenlemek,

    • biçim,

    • kale,

    • belgeleri yazdırın.



    Basit metin editörleri

    • Basit metin editörleri - metni düzenlemenize ve yazı tipini biçimlendirmenize izin verir (Not Defteri);

    • Kelime işlemcileri - listeler ve tablolar, formüller eklemenize, yazım denetimi yapmanıza, grafiklerle çalışmanıza izin verir (MS Word, OpenOffice Writer);





    • Masaüstü yayıncılık sistemleri - kitap, dergi ve gazete basımları için mizanpajlar oluşturmanıza izin veren güçlü kelime işlemci programları (Microsoft Publisher, Adobe PageMaker);

    • Web editörleri - Web sayfalarını ve Web sitelerini İnternette yayınlanmak üzere hazırlamak için kullanılır (Microsoft Publisher, Microsoft FrontPage).





    Ustanın yardımıyla

    • Ustanın yardımıyla – karmaşık yapıya sahip belgeler (mektuplar, özgeçmişler, fakslar, takvimler, vb.) oluşturmak için;

    • sihirbaz kullanılarak bir belgenin geliştirilmesi, art arda görünen diyalog panellerine gerekli verilerin girilmesiyle yapılır.



    Şablonları Kullanma

    • Şablonları Kullanma - boş boşluklar kullanılır;

    • şablonlar, kullanıcının doldurduğu belgenin yapısını tanımlar (kartvizit, faks, mektup vb.).



    3. Yeni Belge Oluşturma

    • 3. Yeni Belge Oluşturma - kullanıcı, kendi takdirine bağlı olarak içerikle doldurduğu boş bir şablon kullanır.



    Sayfa Biçimi - boyutunu belirler:

    • Sayfa Biçimi - boyutunu belirler:

    • A3 (42 × 29,7 cm) - duyurular, posterler için;

    • A4 (21 × 29,7 cm) - özetler, mektuplar, başvurular için;

    • A5 (21 × 14,8 cm) - referanslar vb. için.

    • Sayfa yönlendirmesi – metnin konumunu ve sayfanın monitör ekranındaki görünümünü ayarlar:

    • dikey yönlendirme– sıradan metinler için;

    • yatay yönlendirme- çok sayıda sütun içeren tablolar için.

    • alanlar - sayfanın kenarlarından metnin kenarlarına olan mesafeyi belirleyin



    Üstbilgiler ve altbilgiler

    • Üstbilgiler ve altbilgiler - aynı metni belgenin her sayfasında görüntülemek için kullanılır (sayfa numarası, yazar adı, belge başlığı vb.)



    metin , Görüntüler , formüller , masalar Ve diyagramlar , ses Ve video dosyaları .

    • Çağdaş belgeler şunları içerebilir: metin , Görüntüler , formüller , masalar Ve diyagramlar , ses Ve video dosyaları .



    • Düzenleme, karakterler veya metin parçalarıyla yapılan bu tür işlemleri içerir, örneğin:

    • kopyalama;

    • hareketli;

    • kaldırma.



    Dosya - Kaydet

    • Belgeyi kaydetmek için komutu kullanmanız gerekir. Dosya - Kaydet, beliren iletişim kutusunda seçin sürücü ve klasör, dosya adı ve dosya formatı



    .txt

    • .txt - evrensel metin formatı, dosyaların küçük bir bilgi hacmi vardır ve çeşitli uygulamalar tarafından okunabilir, metin formatı kaydedilmez;

    • .rtf - evrensel genişletilmiş metin formatı, biçimlendirme sonuçları kaydedilir, büyük hacimli dosya bilgileri;



    .doc

    • .doc - Word metin düzenleyicisinin tüm metin düzenleyicileri tarafından anlaşılan orijinal biçimi;

    • .htm (.html ) - Web sayfalarını bilgisayar ağlarında depolamak için kullanılan web sayfası formatı.



    • Belge yazdırma - metin bilgilerinin kağıda çıktısı

    • Yazdırma Seçenekleri : Sayfa numaralarını, kopya sayısını vb. yazdırın.

    • Belgeyi önizlemeniz önerilir



    • Gelecek ay için bir takvim oluşturmak üzere Sihirbazı kullanın.

    • Özgeçmişinizi oluşturmak için Şablonu kullanın.

    • Oluşturulan belgeleri Metin Belgeleri klasörünüze kaydedin





    keyfi metin parçası

    • keyfi metin parçası - fare işaretçisini parçanın başına getirin ve LK'ye basıldığında, metni harf harf vurgulayarak metinde hareket ettirin;

    • bir kelime - kelime başına 2 LK;

    • bir cümle – Ctrl tuşuna basıldığında teklif başına 1 LK;

    • Tek çizgi - İstenen satırın karşısındaki seçim çubuğunda 1 LC (belgenin sol kenar boşluğunda, fare imleci 'dır);

    • paragraf – seçim şeridinde 2 LC;

    • tüm belge – Ctrl tuşuna basıldığında seçim çubuğunda 1 LC;

    • dikey metin parçası – LK basılıyken ve Alt tuşu basılıyken, fare işaretçisini aşağı ve sağa hareket ettirin.



    Egzersiz yapmak:

    • Egzersiz yapmak:

    • Bir metin dosyası oluşturun ve formülü içine yapıştırın

    • Dosyayı klasörünüze odt biçiminde şu adla kaydedin: "Belgeye formülleri ekle"







    biçimlendirme biçim .

    • biçimlendirme - bir belgenin veya tek tek nesnelerinin görünümünü gerekli şekilde sunma süreci biçim .





    • Karakter biçimlendirme seçenekleri:

    • yazı tipi;

    • boyut;

    • stil;

    • renk.



    • yazı tipi, belirli bir çizim için eksiksiz bir karakter kümesidir:

      • yazı tipi adı (Times New Roman, Arial, Courier New);
      • gösterim yöntemi (raster, vektör);
      • karakter genişliği (tek aralıklı yazı tipleri);
      • serif ve sans serif yazı tipleri (Times New Roman, Arial).


    ölçülen paragraflar(1 puan (Cum) = 0,376 mm), 1 - 1638 nokta

    • ölçülen paragraflar(1 puan (Cum) = 0,376 mm), 1 - 1638 nokta



    Karakter taslağı:

    • Karakter taslağı:

      • - olağan; - el yazısı;
      • - gözü pek; - Kalın italik;


    Paragraf

    • Paragraf tam bir düşünceyi temsil eden bir metin bölümünü vurgular

    • Paragraf formatı:

    • hizalama;

    • ilk satır girintisi;

    • sol ve sağ girintiler;

    • satır aralığı.



    • Numaralı, madde işaretli ve çok düzeyli listeler - bir belgeye çeşitli listeler yerleştirmek için kullanılır



    "Belge Biçimlendirme"

    • "Belge Biçimlendirme"

    • (Malzeme →Pratik çalışma)





    veri

    • Aşağıdakileri içeren metin belgeleri oluşturulurken tablolar kullanılır: çok sayıda benzer isimler (ders programı), sayısal veri (periyodik tablo), metin başlıklı resimler (primerdeki alfabe).



    • Tablolar, hücrelerin oluşturulduğu kesişme noktalarında satır ve sütunlardan oluşur.



    • Sayılarla ilgili işlemler formüller kullanılarak gerçekleştirilir.



    • Tablo oluşturma sırası:

    • Tablonun daha fazla değiştirilmesiyle aşağıdaki seçenekler kullanılabilir:

    • satırları, sütunları, hücreleri ekleyin ve silin;

    • sütunların genişliğini, satırların yüksekliğini değiştirme (fareyi kullanarak veya tam değerlerini santimetre veya yüzde olarak ayarlayarak);

    • tek tek hücreleri yeniden boyutlandırmak, birkaç hücreye bölmek veya komşu olanlarla birleştirmek.



    Temel hücre parametreleri:

    • Temel hücre parametreleri:

    • en boy;

    • sınır rengi;

    • arka plan rengi (dolgu).







    Köprü metni belgesi

    • Köprü metni belgesi - diğer belgelere bağlantılar içeren bir belge

    • Köprü, gizli bir adresle başka bir dosyaya bağlanan ve bir fare tıklamasına yanıt veren vurgulanmış bir nesnedir.

    • Bir köprü, aynı belgeye yerleştirilen yer imlerine ve diğer belgelerdeki yer imlerine işaret edebilir.







    "Masalar"

    • "Masalar"

    • Ders kitabının pratik çalışması No. 2.5, s. 207-211.

    • Bir tablo örneği 57. slaytta sunulmuştur.



    • "Haftalık ders programı" tablosu oluşturun

    • Tablo aşağıdaki bilgileri yansıtmalıdır:

      • haftanın günü;
      • dersin sıra numarası;
      • konunun adı;
      • ders başlama zamanı;
      • dersin bitiş zamanı;
      • Ev ödevi.
    • MS Word uygulamasında gerçekleştirilen





    • Çok dilli (İngilizce-Rusça, İspanyolca-Rusça vb.)

    • Hızlı arama

    • Cümle girme yeteneği

    • Sözlükler multimedyadır



    • Çok sayfalı belgelerin yüksek hızlı çevirisi (1 sayfa/sn)

    • Teknik belgelerin, ticari yazışmaların ve diğer özel metinlerin yüksek kaliteli çevirisi







    metin çevirisi için kağıttan dijitale bilgisayar biçim

    • Optik karakter tanıma sistemleri kullanılmaktadır. metin çevirisi için kağıttan dijitale bilgisayar biçim



    • Metin düzeni yapısını tanımlama (sütunlar, tablolar, resimler vb.)

    • Metin parçalarının tek tek karakterlerin görüntülerine ayrılması

    • Karakter görüntülerini desenlerle karşılaştırma





    • Raster - kaliteli belgeleri yazdırmak için

    • Stok Fotoğraf - düşük kaliteli belgeler için



    • Örnek: Raster karakter şablonlarının üzerine bindirilmiş tanınabilir "B" karakteri



    • Örnek: Vektör karakter desenlerinin üzerine tanınabilir bir "B" karakteri bindirilmiş



    İlk bilgisayarlar sayısal bilgileri işlemek için yaratıldı. XX yüzyılın 60'lı yıllarının sonlarından beri, metin bilgilerini işlemek için bilgisayarlar kullanılmıştır. Şu anda, neredeyse tüm kişisel bilgisayar kullanıcıları, özel programlar - metin editörleri kullanarak metinlerle çalışıyor.

    Bir kişi, karakterleri stillerine ve bir bilgisayarı - kodlarına göre ayırt eder. Dünyada ASCII (American Standard Code for Interchange) tablosu, karakter bilgisinin kodlanması için standart olarak benimsenmiştir. Bir karakteri kodlamak için 1 bayta (8 bit) eşit miktarda bilgi kullanır. Toplamda, bir bayt kullanarak şunları kodlayabilirsiniz: N = 28 = 256 karakter. Bu, bir bilgisayardaki metin bilgilerini temsil etmek için oldukça yeterlidir. Tablo 128 karakterlik iki bölüme ayrılmıştır. İlk (ana) bölüm Latin alfabesinin harflerini, ondalık basamakları, noktalama işaretlerini, aritmetik işlemleri vb. içerir. İkinci bölüm (uzantı) esas olarak ulusal alfabeleri kodlamak içindir. Kodlama, her karaktere 0 ila 255 arasında benzersiz bir ondalık kod veya 00000000 ila 11111111 arasında karşılık gelen ikili kod atanmasıdır. Bir karaktere belirli bir kod atamak, kod tablosunda sabitlenen bir anlaşma konusudur. İlk 33 kod (0'dan 32'ye kadar) karakterleri değil, işlemleri (yeni satır - kod 10, satır başı - kod 13, boşluk girme - kod 32, vb.) gösterir.

    Şu anda Rus harfleri için beş farklı kod tablosu bulunmaktadır: KOI-8, СР1251 (Windows için), СР866 (ASCII, MS DOS), Mac (Macintosh için), ISO (Uluslararası Standartlar Örgütü, HTML'de kullanılan kod). Bu kadar çok sayıda kodlama, İnternet'teki metinleri okumayı ve test editörlerinde görüntülemeyi zorlaştırır. Farklı kodlamalarda aynı ikili koda farklı karakterler atanır. Örneğin, ASCII'de Rusça A harfi - 10000000, KOI-8 - 11100001, СР1251 - 11000000 koduna sahiptir.

    Farklı bir kodlama ile gönderilen metni doğru okuyabilmek için yapmanız gerekenler:

    • metin düzenleyicide Microsoft Word menüde Servis - Seçenekler - Genel onay kutusunu etkinleştir açılışta dönüştürmeyi onayla, istediğiniz kodlamayı seçin;
    • menüde IE gibi bir tarayıcıda çalışırken Görünüm - Kodlama türü istediğiniz kodlamayı seçin.

    Metin bilgisi bir bilgisayara girildiğinde, ikili kodlama. Kullanıcı, klavyede sembolü olan bir tuşa basar ve bilgisayar belirli bir dizi sekiz elektrik darbesi alır (sembolün ikili kodu). Karakter kodu bilgisayarın RAM'inde saklanır. Bir karakterin monitör ekranında görüntülenmesi sürecinde, ters işlem gerçekleştirilir - kod çözme, yani karakter kodunu bilgisayarın belleğinde depolanan görüntüsüne dönüştürme.

    Yeni uluslararası standart Unicode (Unicode) her karaktere bir değil iki bayt atar ve bu nedenle 256 değil, N = 216 = 65 536 karakteri kodlamak için kullanılabilir. Unicode kodlaması tüm dillerin tüm karakterlerini destekler ​​ve sürüm 4.0'dan beri Microsoft Internet Explorer'da ve 1997'den beri Microsoft Office'te okumak için uygundur

    Temel Metin Dönüştürme Teknikleri: Düzenleme ve Biçimlendirme

    Bir metin düzenleyicide oluşturulan metin dönüştürülebilir, yani düzenlenebilir ve biçimlendirilebilir. düzenleme- bu, parçalarının (nesnelerinin) eklenmesini, silinmesini, hareketini sağlayan bir belge dönüşümüdür. Nesne, bir bütün olarak metnin tamamı ve bir paragraf, bir satır, bir kelime, bir karakter, bir tablo ve bileşenleridir. Düzenleme, önceden seçilen herhangi bir belge nesnesine uygulanabilir.

    Aşağıdaki düzenleme işlemleri mümkündür:

    • silme, taşıma, kopyalama;
    • son işlemlerin yürütülmesini iptal edin veya iade edin;
    • metin parçalarının aranması ve değiştirilmesi;
    • gerekli nesneyi ekleme (resim, dosya, pano içeriği, köprü, OLE nesnesi - formül, grafik, Excel'den tablo, animasyon, ses).

    Menünün metni veya parçalarıyla yapmanıza izin veren her şey Düzenle - Yapıştır ve bazı araç çubuğu düğmeleri Standart, ve bir düzenleme olacak.

    biçimlendirme- bu, belge türünde bir değişiklik, yani belgenin sunum şeklini değiştiren bir dönüşümdür. Biçimlendirme seçilen herhangi bir belge nesnesine uygulanabilir (şemaya bakın).

    Aşağıdaki biçimlendirme türleri mümkündür:

    1) Sayfa parametrelerini ayarlama (boyut, kenar boşlukları, yön vb.).

    2) Paragraf formatı:

    Hizalama (genişlik, merkez, sağ ve sol kenarlar);

    İlk satır girintisini ayarlayın;

    Girintileri ve satırlar ve paragraflar arasındaki boşlukları ayarlayın.

    3) Karakter Biçimlendirme:

    Yazı tipi değişikliği - raster (Comic Sans MS) veya vektör (Bookman Old Style), monospace (Courier), doğranmış (Arial) veya serifler (Times New Roman);

    Yazı tipi stilini değiştirme (normal, gözü pek, el yazısı, Kalın italik , seçenekler alt çizgi, karakter rengi, alt simge veya üst simge);

    Karakter boyutunun değiştirilmesi (yazı tipi boyutunun birimi noktadır (pt), 1 pt = 0,376 mm. Örneğin, 10 pt boyuttur, 14 pt boyuttur).

    4) Listelerin oluşturulması.

    5) Bordür yapma ve doldurma.

    6) Sütunların organizasyonu.

    7) Tablo biçimlendirme (metin yönü, hücre birleştirme, sütun genişliği ve satır yüksekliği vb.).

    Araç, biçimlendirme konusunda büyük bir yardım sağlar. Örnek Format araç çubuğunda bulunan biçimlendirme.

    Metin belgelerini metin düzenleyicilere (işlemciler) kaydederken, farklı biçimler ayarlayabilirsiniz.

    Metin bilgilerinin kodlanması

    Bir bilgisayardaki metin bilgilerinin ikili kodlanması. Doğal ve biçimsel diller kullanılarak yazılı olarak ifade edilen bilgilere genellikle denir. metin bilgisi.

    Metinsel bilgileri (Rus ve Latin alfabelerinin büyük ve küçük harfleri, sayılar, işaretler ve matematiksel semboller) temsil etmek için 256 farklı karakter yeterlidir. Formülü kullanarak, her karakteri kodlamak için ne kadar bilgi gerektiğini hesaplayabilirsiniz:

    N = 2 ben => 256 = 2 ben => 2 8 = 2 ben => ben = 8 bit.

    Bir bilgisayardaki metinsel bilgileri işlemek için, onu bir ikili işaret sisteminde temsil etmek gerekir. Her karakteri kodlamak için 8 bite eşit miktarda bilgi gereklidir, yani uzunluk ikili kod işareti sekiz ikili basamaktır. Her karaktere, 00000000 ila 11111111 aralığında (0 ila 255 ondalık kodda) benzersiz bir ikili kod atanmalıdır (Tablo 3.1).

    Bir kişi, işaretleri stillerine ve bir bilgisayarı - ikili kodlarına göre ayırt eder. Metin bilgisi bir bilgisayara girildiğinde ikili kodlanır, işaretin görüntüsü ikili koduna dönüştürülür. Kullanıcı, klavyede bir işaret bulunan bir tuşa basar ve belirli bir dizi sekiz elektriksel darbe (işaretin ikili kodu) bilgisayara girer. İşaret kodu, bir hücreyi kapladığı bilgisayarın RAM'inde saklanır.

    İşaretin bilgisayar ekranında görüntülenmesi sürecinde ters kayıt yapılır, yani işaretin ikili kodu görüntüsüne dönüştürülür.

    Çeşitli karakter kodlamaları. Belirli bir ikili kodun bir işarete atanması, kod tablosunda sabitlenen bir anlaşma konusudur. Mevcut kod tablolarında ilk 33 kod ( ondalık kodlar 0 ila 32) karakterlere değil, işlemlere (satır besleme, boşluk girişi vb.) karşılık gelir.

    33'ten 127'ye kadar olan ondalık kodlar uluslararasıdır ve Latin karakterlere, sayılara, aritmetik işlemlere ve noktalama işaretlerine karşılık gelir.

    128'den 255'e kadar olan ondalık kodlar ulusaldır, yani farklı ulusal kodlamalarda farklı karakterler aynı koda karşılık gelir. Ne yazık ki, şu anda Rus harfleri için beş farklı kod tablosu vardır (Windows, MS-DOS, KOI-8, Mac, ISO (Tablo 3.1 ve 3.2)), bu nedenle bir kodlamada oluşturulan metinler diğerinde doğru şekilde görüntülenmeyecektir.

    Örneğin, kodlamada pencereler 221, 194, 204 numaralı sayısal kodların dizisi "bilgisayar" kelimesini oluştururken, diğer kodlamalarda anlamsız bir karakter kümesi olacaktır.

    Neyse ki, çoğu durumda, metin belgelerinin kodunun dönüştürülmesi konusunda kullanıcının endişelenmesine gerek yoktur, çünkü bu, yerleşik özel dönüştürücü programları tarafından yapılır. işletim sistemi ve uygulamalar.

    İÇİNDE son yıllar geniş kullanım her karakter için 2 bayt (16 bit) ayıran Unicode metin karakterlerini kodlamak için yeni bir uluslararası standart aldı. Formülü kullanarak, bu standarda göre kodlanabilecek karakter sayısını belirleyebilirsiniz:

    N = 2 ben = 2 16 = 65 536.

    Bu karakter sayısı sadece Rus ve Latin alfabelerini, sayıları, işaretleri ve matematiksel sembolleri değil, aynı zamanda Yunan, Arap, İbrani ve diğer alfabeleri de kodlamak için yeterliydi.

    Kontrol soruları

      1. Rus alfabesinde yalnızca 33 harf olmasına rağmen, bir bilgisayardaki metin bilgilerini kodlarken neden çoğu kodlama 256 farklı karakter kullanır?
      2. 65.536 farklı karakteri kodlamanıza izin veren Unicode kodlamayı tanıtmanın amacı neydi?
    benzer makaleler

    2023 dvezhizni.ru. Tıbbi portal.