ComputereProgrammering

ASCII-kode (amerikansk standard til udveksling af information) - grundteksten kodning til det latinske alfabet

Ifølge International Telecommunication Union, i 2016 på internettet med mere eller mindre regelmæssigt bruger tre og en halv milliard mennesker. De fleste af dem ikke engang tænke på, at eventuelle meddelelser sendt til dem via en pc eller mobile gadgets, såvel som tekster, der vises på skærmene af alle slags, i virkeligheden, er en kombination af 0 og 1. Dette kaldes den kodede repræsentation af informationen. Det giver og letter gennemførelsen af dens lagring, behandling og transmission. I 1963 har den amerikanske ASCII-koden er udviklet, som er emnet for denne artikel.

Præsentation af oplysninger i computeren

Med hensyn til en hvilken som helst elektronisk computer tekst er en samling af individuelle karakterer. Blandt dem er ikke kun det brev, herunder hovedstaden, men også tegnsætningstegn, tal. Desuden er specielle symboler anvendes "=", "&", "(" og mellemrum.

En flerhed af symboler, der udgør den tekst, kaldet alfabetet, og antallet - power (betegnet N). For at bestemme N udtryk = 2 ^ b, hvor b - antal informationsbit eller et bestemt symbol vægt.

Det viste sig, at effekten af 256 tegn alfabet giver dig mulighed for at sende alle de nødvendige tegn.

Siden 256 er en 8 graders to, så vægten af hver karakter er 8 bit.

Måleenhed 8 bit kaldes en 1-byte, så vi siger, at den binære kode af ethvert tegn i den tekst, der er gemt på computeren, indtager en byte af hukommelsen.

Hvordan er kodningen

Enhver tekst indtastet i pc'ens hukommelse gennem taster, som blev skrevet tal, bogstaver tegnsætningstegn og andre symboler. Til minde de sendes i binær kode, det vil sige, er hvert symbol knyttet til det velkendte decimal kode for en person fra 0 til 255, hvilket svarer til en binær kode - .. Fra 00000000 til 11111111.

Byte tegnsæt tillader processoren udfører behandling af tekst se hvert tegn separat. Samtidig er de 256 tegn er nok til at repræsentere alle oplysninger tegn.

Coding ASCII-tegn

Denne forkortelse står for det engelske amerikanske standard til udveksling af information.

Selv ved indgangen til edb, blev det klart, at det er muligt at komme med en række forskellige måder at kodning oplysninger. Men for at overføre oplysninger fra én computer til en anden var forpligtet til at udvikle en fælles standard. Så i 1963 var der en ASCII-tabel i USA. Det enhver karakter computer alfabet tildeles et løbenummer i den binære repræsentation. I første omgang er det ASCII-kode, der bruges kun i USA, og senere blev en international standard for pc'en.

indholdsfortegnelse

ASCII-koder er opdelt i 2 dele. International standard anses for at være kun den første halvdel af tabellen. Det inkluderer kode fra sekvensen antal 0 (kodet som 00000000) til 127 (kode 01111111).

serienummer

N

Coding ASCII-tekst

symbol

0-31

0000 0000 - 0001 1111

Tegn med N fra 0 til 31 kaldes ledere. Deres funktion er at "guide" processen med tekst output til en monitor eller trykning enhed, en bippende lyd, osv

32-127

0010 0000 - 0111 1111

Symboler med N 32-127 (en standard del af tabellen) - store og små bogstaver i det latinske alfabet, de 10-new tal, tegnsætningstegn og forskellige beslag, kommercielle og andre tegn .. Symbol 32 angiver et mellemrum.

128 - 255

1000 0000 - 1111 1111

Symboler med kvælstof fra 128 til 255 (en alternativ del af tabellen eller tegntabel) kan have en række muligheder, som hver især har sit eget nummer. Koden side bruges til at indstille de nationale alfabeter, som er forskellige fra det latinske. Især er det udført ved hjælp af ASCII-koden for de russiske tegn.

Tabel koder store og små bogstaver følger hinanden i alfabetisk orden og numre - opstigende værdier. Dette princip gælder for den russiske alfabet.

kontrol tegn

ASCII indkodningstabel blev oprindeligt designet til modtagelse og transmission af oplysninger om dette ikke længere anvendes af enheden som en fjernskriver. I denne henseende ikke udskrives det tegnsæt anvendes som kommandoer til at styre indretningen. Sådanne kommandoer blev anvendt i sådanne præ-computer messaging teknikker som morsekode, og så videre.

Den mest almindelige symbol "fjernskriver" er den NUL (00 "nul"). Han er stadig bruges i de fleste programmeringssprog, der angiver tegn på slutningen af linjen.

Når de anvendes ASCII koder

American Standard Code ikke blot kræver indtastning af tekst tastatur. Det bruges også i diagrammet. Især ASCII Art Maker program billeder repræsenterer forskellige udvidelser spektrum ASCII tegnsæt.

Disse produkter kommer i to typer: grafiske redaktører udfører funktionen ved at konvertere et billede til tekst og konverterer "Billeder" i ASCII-grafik. For eksempel kendt er et godt eksempel Smiley Coding symbol.

ASCII kan bruges, når du opretter dokumentet HTML. I så fald kan du indtaste et sæt tegn og et symbol, der svarer til denne kode vil blive vist, når du ser siden på skærmen.

Der er behov for ASCII til fremstilling af flersprogede sites, som tegn, der ikke hører til et bestemt nationalt bord, erstattet af ASCII-koder.

nogle funktioner

For at indkode tekstinformation i ASCII blev oprindeligt brugt 7 bit (en forblev tom), men i dag arbejder hun som en 8-bit.

De breve, som er placeret i kolonnerne er over og under, adskiller sig fra hinanden kun af en enkelt bit. Dette reducerer kompleksiteten af testen.

ASCII ansøgning i Microsoft Office

Hvis det er nødvendigt, kan denne form for kodning tekstinformation blive brugt i teksteditorer af Microsoft, såsom Notesblok, og Office Word. Men når du skriver i dette tilfælde, kan du ikke bruge nogle funktioner. For eksempel, vil du ikke være i stand til at udføre fed som ASCII bevarer kun betydningen af information, ignorerer sin overordnede form og form.

standardisering

Organisationen vedtaget ISO-standard ISO 8859. Denne gruppe definerer otte-bit kodning for forskellige sproggrupper. Især ISO 8859-1 - er den udvidede ASCII, hvilket er en tabel for USA og Vesteuropa. En ISO 8859-5 - er den tabel, der anvendes til det kyrilliske alfabet, herunder det russiske sprog.

Af historiske grunde til ISO 8859-5 det bruges i en kort periode.

For det russiske sprog i øjeblikket faktisk anvendte kodning:

  • CP866 (Code Page 866), eller DOS, som ofte kaldes alternativ kodning GOST. Det blev aktivt brugt indtil midten af 90-erne i sidste århundrede. I øjeblikket næsten aldrig brugt.
  • KOI-8. Kodning blev udviklet i 1970-80s, og i øjeblikket er det en fælles standard for e-mails i RuNet. Det er almindeligt anvendt i OS familien Unix, herunder Linux. "Russiske" version af KOI-8, kaldet KOI-8R. Derudover er der versioner til andre kyrilliske sprog som ukrainsk.
  • Kode Page 1251 (CP 1251, Windows - 1251). Udviklet af Microsoft til at yde støtte til det russiske sprog i Windows-miljøet.

Den største fordel ved CP866 første standard var at bevare pseudo-grafiske tegn i de samme positioner som i den udvidede ASCII. Dette giver dig mulighed for at køre uændret tekst af programmet, udenlandske produktion, såsom den berømte Norton Commander. På dette tidspunkt CP866 bruges til programmer designet til Windows, der opererer på fuld skærm tekstvisning eller i tekstbokse, herunder i FAR Manager.

Computer tekster skrevet i CP866-kodning, sidst er ret sjældne, men det anvendes til russiske filnavne i "Vindous".

"Unicode"

I øjeblikket er den mest udbredte er denne kodning. Koder "Unicode" på banen. Den første (fra 0000 til U + U + 007F) omfatter et sæt af ASCII-tegn med koder. Efterfulgt af feltet tegn af forskellig national litteratur, samt tegnsætning og tekniske symboler. Desuden er en del af koden "Unicode" reserverede i tilfælde af behovet for at inkludere nye figurer i fremtiden.

Nu ved du, at hvert tegn i ASCII er repræsenteret som en kombination af 8 nuller og ettaller. Layman, denne information kan synes unødvendigt og uinteressant, men ønsker du ikke at vide, hvad der foregår "i hjernen" i computeren?!

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 da.birmiss.com. Theme powered by WordPress.