ComputereInformationsteknologi

Kodning af tekstinformation i computeren

Computer - en sofistikeret enhed, som du kan oprette, konvertere og lagre information. Men computeren ikke arbejde meget forståelig måde for os - grafisk, tekst og numerisk data gemmes som binære arrays numre. I denne artikel vil vi se på, hvordan kodningen af teksten oplysninger.

Hvad for os er teksten til en computer - en sekvens af tegn. Hvert symbol repræsenterer et bestemt sæt af nuller og ettaller. Under symbolerne betød ikke kun store og små bogstaver i det latinske alfabet, men også tegnsætningstegn aritmetiske skilte, specialtegn, særlige symboler og endda plads.

Binær kodning af tekstinformation

Ved at trykke på en bestemt tast på den interne regulator sender et elektrisk signal, der er konverteret til en binær kode. Kode er matchet med en vis symbol, som vises på skærmen. Til forelæggelse for det latinske alfabet i et digitalt format ASCII kodning internationale system blev oprettet. Det kræver 1 byte til optagelse et symbol består således af otte-symbol sekvens af nuller og ettaller. Optageintervallet - lige fra 00000000 til 11111111, dvs. kodning af tekst oplysninger ved hjælp af dette system giver os mulighed for at repræsentere 256 tegn. I de fleste tilfælde er det nok.

ASCII er opdelt i to dele. De første 127 tegn (fra 00000000 til 01111111) er internationale og er særlige symboler og bogstaver i det engelske alfabet. Den anden del - udvidelse (fra 10000000 til 11111111) - er beregnet til at repræsentere den nationale alfabet, skrivning af som er forskellig fra det latinske.

Kodning tekstinformation i ASCII er bygget på princippet om stigende sekvens, det vil sige, jo større sekvens antal bogstaver, jo større værdien af sin ASCII-kode. Tal og russiske del af tabellen er bygget efter samme princip.

Men i verden er der flere typer af kodning for kyrilliske bogstaver. Den mest almindelige - er KOI-8 (otte-bit kodning, der har været brugt til i 70'erne i det første ruifitsirovannyh Unix-operativsystemet), ISO 8859-5 (udviklet af Den Internationale Standardiseringsorganisation Bureau), CP 1251 (kodning tekstinformation anvendes i moderne OS Windows), samt 2-byte kodning af Unicode, som kan bruges til at introducere 65.536 tegn. Sådan en bred vifte af kodninger på grund af det faktum, at de er udviklet på forskellige tidspunkter, for forskellige operativsystemer og forskellige overvejelser. På grund af dette, ofte har problemer, når der overføres tekst fra et medium til et andet - fra et mismatch koder brugeren vil se et sæt af forvirrende ikoner. Hvordan kan jeg løse denne situation? I Word, for eksempel, når et dokument åbnes, en besked om problemer med tekst display og byder på flere muligheder for omkodning.

Således kodning og behandling af tekstinformation i computerens tarme - processen er vanskelig og tidskrævende organiseret. Alle symboler af enhver alfabet er kun en bestemt sekvens af cifre af binære system, en celle - dette er en byte data.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 da.birmiss.com. Theme powered by WordPress.