ASCII (amerikkalainen vakiokoodi tietojenvaihdolle) - latinalaisen aakkoston perustekstikoodaus

Kansainvälisen televiestintäliiton mukaanVuonna 2016 Internetin tietyssä säännöllisyydessä oli kolme ja puoli miljardia ihmistä. Useimmat heistä eivät edes ajattele, että heidän tietokoneidensa tai mobiililaitteidensa kautta lähettämät viestit sekä kaikenlaiset näytöt näkyvät teksteillä ovat itse asiassa yhdistelmiä 0 ja 1. Tällainen tietojen esitys on nimeltään koodaus. Se tarjoaa ja helpottaa huomattavasti sen tallentamista, käsittelyä ja siirtoa. Vuonna 1963 kehitettiin amerikkalainen ASCII-koodaus, joka on tämän artikkelin aihe.

Tietojen esittäminen tietokoneessa

Mikä tahansa elektroninen tietojenkäsittelyn näkökulmaKoneen teksti on joukko yksittäisiä merkkejä. Ne sisältävät paitsi kirjaimia, myös suurikirjaimia, myös välimerkkejä, numeroita. Lisäksi käytetään erikoismerkkejä "=", "&", "(" ja välilyöntejä.

Merkkijono, joka muodostaa tekstin,kutsutaan aakkoksi, ja niiden lukumäärä on teho (merkitty N: ksi). Määritä se käyttämällä lauseketta N = 2 ^ b, jossa b on tietyn symbolin bittien lukumäärä tai tietopaino.

Todistetusti, että aakkoset, joiden kapasiteetti on 256 merkkiä, voit esittää kaikki tarvittavat symbolit.

Koska 256 on kahdeksas kahdeksan teho, kunkin symbolin paino on 8 bittiä.

8 bittiä yksikköä kutsutaan 1 tavuiksi, joten on tavallista sanoa, että tietokoneelle tallennetun tekstin minkä tahansa merkin binaarikoodi vie yhden tavun muistia.

Miten koodaus suoritetaan

Tekstit kirjoitetaan henkilökohtaisen muistiintietokone näppäimistön näppäimillä, joihin kirjoitetaan numeroita, kirjaimia, välimerkkejä ja muita symboleita. RAM-muistissa ne välitetään binäärikoodilla, eli jokainen merkki on sovitettu tavalliseen ihmisen desimaaliin, 0 - 255, joka vastaa binaarikoodia - 00000000 - 11111111.

Byte-byte -merkin koodaus mahdollistaasuorittimen, joka suorittaa tekstin käsittelyn, saa jokaisen symbolin erikseen. Samalla 256 merkkiä riittää kaikkien merkistötietojen esittämiseen.

Merkkikoodaus ASCII

Tämä englanninkielinen lyhenne tarkoittaa amerikkalaista vakiokoodia tiedonvaihdolle.

Tietokoneistamisen kynnyksellä kävi selväksi, ettävoit kehittää erilaisia tapoja koodata tietoa. Tietojen siirtämisestä tietokoneesta toiseen kuitenkin vaadittiin kehittämään yksi standardi. Joten vuonna 1963 Yhdysvalloissa oli ASCII-koodaustaulukko. Siinä on tietokoneen aakkosten jokin symboli sille sarjanumero binaarisessa esityksessä. Aluksi ASCII-koodausta käytettiin vain Yhdysvalloissa ja siitä tuli sitten kansainvälinen standardi PC: lle.

Taulukon sisältö

ASCII-koodit on jaettu kahteen osaan. Kansainvälinen standardi on vain tämän taulukon ensimmäinen puoli. Se sisältää symbolit, joiden järjestysnumerot ovat 0 (koodattu 00000000) - 127 (koodi 01111111).

Järjestysnumero N	ASCII-tekstin koodaus	symboli
0 - 31	0000 0000 - 0001 1111	Symbolit, joiden N on 0 - 31, kutsutaan johtajiksi. Heidän tehtävänsä on "ohjata" prosessia, jolla tekstiä tulostetaan näyttöön tai tulostuslaitteeseen, antaen äänisignaalin jne.
32 - 127	0010 0000 - 0111 1111	Symbolit, joiden N on 32 - 127 (vakioosataulukot) - latinalaisia aakkosia pienempiä ja isoja kirjaimia, 10 numeroa, välimerkkejä sekä erilaisia sulkeja, kaupallisia ja muita symboleita. Symboli 32 merkitsee tilaa.
128 - 255	1000 0000 - 1111 1111	Symbolit, joiden N on 128 - 255 (vaihtoehtoinen osataulukot tai koodisivu) voi olla eri versioita, joista jokaisella on oma numero. Koodisivulla määritetään kansalliset aakkoset, jotka eroavat latinasta. Erityisesti sen avulla ASCII on koodattu venäläisille merkille.

Koodaustaulukossa suuret ja pienet kirjaimet seuraavat toisiaan aakkosjärjestyksessä ja numerot ovat nousevassa järjestyksessä. Tämä periaate säilyy myös venäjän aakkostossa.

Ohjausmerkit

ASCII-koodaustaulukko luotiin alunperintiedon vastaanottamiseksi ja lähettämiseksi laitteesta, jota ei ole käytetty pitkään, kuten teletyyppi. Tähän liittyen merkitsemättä jättäminen, jota käytettiin komennoiksi tämän laitteen ohjaamiseksi, sisällytettiin merkkijoukkoon. Samanlaisia komentoja käytettiin sellaisissa pre-tietokoneen viestintämenetelmissä kuin Morse-koodi jne.

Yleisin teletyypin symboli on NUL (00, "nolla"). Sitä käytetään edelleen useimmissa ohjelmointikieleissä, mikä merkitsee loppupään merkkiä.

Jos käytetään ASCII-koodausta

Amerikkalaista vakiokoodia tarvitaan paitsitekstin tietojen syöttäminen näppäimistöltä. Sitä käytetään myös grafiikassa. Erityisesti ASCII Art Maker -ohjelmassa eri laajennusten kuvat edustavat joukkoa ASCII-merkkisymboleja.

Samanlaisia tuotteita on kaksi tyyppiä: Graafisten toimittajien tehtävän suorittaminen muuntamalla kuvat tekstiksi ja muokkaamalla "piirustuksia" ASCII-grafiikaksi. Esimerkiksi tunnettu hymiö on elävä esimerkki koodaussymbolista.

ASCIIa voidaan käyttää myös HTML-dokumentin luomiseen. Tällöin voit syöttää tiettyjä merkkisarjoja, ja kun katsot sivua, näyttöön tulee symboli, joka vastaa tätä koodia.

ASCII tarvitaan myös monikielisten sivustojen luomiseen, koska merkkejä, jotka eivät ole osa kansallista taulukkoa, korvataan ASCII-koodeilla.

koodata tekstitietoja ASCII-koodauksessa

Joitakin ominaisuuksia

Tekstisisältöä koodaavan ASCII-koodausta varten alun perin käytettiin 7 bittiä (yksi oli tyhjä), mutta nykyään se toimii 8-bittisenä.

Ylä- ja alareunojen sarakkeissa olevat kirjaimet eroavat toisistaan vain yhdellä bittiä. Tämä vähentää huomattavasti todentamisen monimutkaisuutta.

ASCII: n käyttäminen Microsoft Officeissa

Tarvittaessa tällainen teksti koodaaTietoja voidaan käyttää Microsoftin tekstieditorissa, kuten Notepadissa ja Office Wordissa. Kun kirjoitat, tässä tapauksessa on mahdotonta käyttää joitain toimintoja. Et esimerkiksi pysty toteuttamaan rohkeita kuin ASCII säilyttää ainoastaan merkityksen tietojen välittämättä sen yleistä muodoissa.

standardointi

ISO on hyväksynyt ISO 8859 -standardit. Tämä ryhmä määrittää kahdeksan bittisen koodauksen eri kieliryhmille. Erityisesti ISO 8859-1 on Extended ASCII, joka on taulukko Yhdysvalloille ja Länsi-Euroopan maille. Ja ISO 8859-5 on taulukko, jota käytetään kyrillisille, myös venäjäksi.

Useista historiallisista syistä ISO 8859-5 -standardia ei käytetty kovin pitkään.

Venäjänkielellä tällä hetkellä koodausta todella käytetään:

CP866 (koodi: 866) tai DOS, jota kutsutaan usein vaihtoehtoiseksi koodaukseksi GOST. Sitä käytettiin aktiivisesti vasta viime vuosisadan 90-luvun puolivälissä. Tällä hetkellä melkein ei käytetä.
KOI-8. Koodausta kehitettiin 1970 - 80 - luvulla, jaTämä on RuNet-sähköpostiviestien standardi. Se on laajalti käytössä Unix-perheen käyttöjärjestelmässä, mukaan lukien Linux. KOI-8: n "venäjän" versiota kutsutaan nimellä KOI-8R. Lisäksi on olemassa versioita muille kyrillisille kielille, esimerkiksi ukrainaksi.
Koodi Page 1251 (CP 1251, Windows - 1251). Microsoft Corporation on kehittänyt tukea venäläiselle kielelle Windows-ympäristössä.

Ensimmäisen standardin CP866 tärkein etuoli pseudo-graafisten symbolien säilyttäminen samoissa kohdissa kuin Extended ASCII -järjestelmässä. Tämä mahdollistaa muuttumattomien tekstiohjelmien, ulkomaisen tuotannon, kuten kuuluisan Norton Commanderin. Tällä hetkellä CP866-ohjelmaa käytetään Windows-käyttöjärjestelmissä, jotka toimivat koko näytön teksti -tilassa tai tekstin ikkunoissa, mukaan lukien FAR Manager.

CP866-koodauksessa kirjoitetut tietokone-tekstit ovat äskettäin olleet harvinaisia, mutta niitä käytetään venäläisissä tiedostonimissä "Vindous".

"Unicode"

Tällä hetkellä kaikkein yleisinsai tämän tietyn koodauksen. Unicode-koodit on jaettu alueisiin. Ensimmäinen (U + 0000: stä U + 007F: hen) sisältää ASCII-koodin koodin merkit. Seuraa sitten eri kansallisten komentosarjojen merkkien alueita sekä välimerkkejä ja teknisiä symboleja. Lisäksi osa Unicode-koodeista on varattu, jos tulevaisuudessa tarvitaan uusia symboleja.

Nyt tiedät, että ASCII-koodauksessa, kukinsymboli on esitetty kahdeksan nollan ja yhden yhdistelmällä. Muille kuin asiantuntijoille nämä tiedot saattavat tuntua turhalta ja tuntemattomilta, mutta etkö halua tietää, mitä tietokoneen aivoissa tapahtuu?

</ p>

arviointi: