Kansainvälisen televiestintäliiton mukaanVuonna 2016 Internetin tietyssä säännöllisyydessä oli kolme ja puoli miljardia ihmistä. Useimmat heistä eivät edes ajattele, että heidän tietokoneidensa tai mobiililaitteidensa kautta lähettämät viestit sekä kaikenlaiset näytöt näkyvät teksteillä ovat itse asiassa yhdistelmiä 0 ja 1. Tällainen tietojen esitys on nimeltään koodaus. Se tarjoaa ja helpottaa huomattavasti sen tallentamista, käsittelyä ja siirtoa. Vuonna 1963 kehitettiin amerikkalainen ASCII-koodaus, joka on tämän artikkelin aihe.
Mikä tahansa elektroninen tietojenkäsittelyn näkökulmaKoneen teksti on joukko yksittäisiä merkkejä. Ne sisältävät paitsi kirjaimia, myös suurikirjaimia, myös välimerkkejä, numeroita. Lisäksi käytetään erikoismerkkejä "=", "&", "(" ja välilyöntejä.
Merkkijono, joka muodostaa tekstin,kutsutaan aakkoksi, ja niiden lukumäärä on teho (merkitty N: ksi). Määritä se käyttämällä lauseketta N = 2 ^ b, jossa b on tietyn symbolin bittien lukumäärä tai tietopaino.
Todistetusti, että aakkoset, joiden kapasiteetti on 256 merkkiä, voit esittää kaikki tarvittavat symbolit.
Koska 256 on kahdeksas kahdeksan teho, kunkin symbolin paino on 8 bittiä.
8 bittiä yksikköä kutsutaan 1 tavuiksi, joten on tavallista sanoa, että tietokoneelle tallennetun tekstin minkä tahansa merkin binaarikoodi vie yhden tavun muistia.
Tekstit kirjoitetaan henkilökohtaisen muistiintietokone näppäimistön näppäimillä, joihin kirjoitetaan numeroita, kirjaimia, välimerkkejä ja muita symboleita. RAM-muistissa ne välitetään binäärikoodilla, eli jokainen merkki on sovitettu tavalliseen ihmisen desimaaliin, 0 - 255, joka vastaa binaarikoodia - 00000000 - 11111111.
Byte-byte -merkin koodaus mahdollistaasuorittimen, joka suorittaa tekstin käsittelyn, saa jokaisen symbolin erikseen. Samalla 256 merkkiä riittää kaikkien merkistötietojen esittämiseen.
Tämä englanninkielinen lyhenne tarkoittaa amerikkalaista vakiokoodia tiedonvaihdolle.
Tietokoneistamisen kynnyksellä kävi selväksi, ettävoit kehittää erilaisia tapoja koodata tietoa. Tietojen siirtämisestä tietokoneesta toiseen kuitenkin vaadittiin kehittämään yksi standardi. Joten vuonna 1963 Yhdysvalloissa oli ASCII-koodaustaulukko. Siinä on tietokoneen aakkosten jokin symboli sille sarjanumero binaarisessa esityksessä. Aluksi ASCII-koodausta käytettiin vain Yhdysvalloissa ja siitä tuli sitten kansainvälinen standardi PC: lle.
ASCII-koodit on jaettu kahteen osaan. Kansainvälinen standardi on vain tämän taulukon ensimmäinen puoli. Se sisältää symbolit, joiden järjestysnumerot ovat 0 (koodattu 00000000) - 127 (koodi 01111111).
Järjestysnumero N | ASCII-tekstin koodaus | symboli |
0 - 31 | 0000 0000 - 0001 1111 | Symbolit, joiden N on 0 - 31, kutsutaan johtajiksi. Heidän tehtävänsä on "ohjata" prosessia, jolla tekstiä tulostetaan näyttöön tai tulostuslaitteeseen, antaen äänisignaalin jne. |
32 - 127 | 0010 0000 - 0111 1111 | Symbolit, joiden N on 32 - 127 (vakioosataulukot) - latinalaisia aakkosia pienempiä ja isoja kirjaimia, 10 numeroa, välimerkkejä sekä erilaisia sulkeja, kaupallisia ja muita symboleita. Symboli 32 merkitsee tilaa. |
128 - 255 | 1000 0000 - 1111 1111 | Symbolit, joiden N on 128 - 255 (vaihtoehtoinen osataulukot tai koodisivu) voi olla eri versioita, joista jokaisella on oma numero. Koodisivulla määritetään kansalliset aakkoset, jotka eroavat latinasta. Erityisesti sen avulla ASCII on koodattu venäläisille merkille. |
Koodaustaulukossa suuret ja pienet kirjaimet seuraavat toisiaan aakkosjärjestyksessä ja numerot ovat nousevassa järjestyksessä. Tämä periaate säilyy myös venäjän aakkostossa.
ASCII-koodaustaulukko luotiin alunperintiedon vastaanottamiseksi ja lähettämiseksi laitteesta, jota ei ole käytetty pitkään, kuten teletyyppi. Tähän liittyen merkitsemättä jättäminen, jota käytettiin komennoiksi tämän laitteen ohjaamiseksi, sisällytettiin merkkijoukkoon. Samanlaisia komentoja käytettiin sellaisissa pre-tietokoneen viestintämenetelmissä kuin Morse-koodi jne.
Yleisin teletyypin symboli on NUL (00, "nolla"). Sitä käytetään edelleen useimmissa ohjelmointikieleissä, mikä merkitsee loppupään merkkiä.
Amerikkalaista vakiokoodia tarvitaan paitsitekstin tietojen syöttäminen näppäimistöltä. Sitä käytetään myös grafiikassa. Erityisesti ASCII Art Maker -ohjelmassa eri laajennusten kuvat edustavat joukkoa ASCII-merkkisymboleja.
Samanlaisia tuotteita on kaksi tyyppiä: Graafisten toimittajien tehtävän suorittaminen muuntamalla kuvat tekstiksi ja muokkaamalla "piirustuksia" ASCII-grafiikaksi. Esimerkiksi tunnettu hymiö on elävä esimerkki koodaussymbolista.
ASCIIa voidaan käyttää myös HTML-dokumentin luomiseen. Tällöin voit syöttää tiettyjä merkkisarjoja, ja kun katsot sivua, näyttöön tulee symboli, joka vastaa tätä koodia.
ASCII tarvitaan myös monikielisten sivustojen luomiseen, koska merkkejä, jotka eivät ole osa kansallista taulukkoa, korvataan ASCII-koodeilla.
Tekstisisältöä koodaavan ASCII-koodausta varten alun perin käytettiin 7 bittiä (yksi oli tyhjä), mutta nykyään se toimii 8-bittisenä.
Ylä- ja alareunojen sarakkeissa olevat kirjaimet eroavat toisistaan vain yhdellä bittiä. Tämä vähentää huomattavasti todentamisen monimutkaisuutta.
Tarvittaessa tällainen teksti koodaaTietoja voidaan käyttää Microsoftin tekstieditorissa, kuten Notepadissa ja Office Wordissa. Kun kirjoitat, tässä tapauksessa on mahdotonta käyttää joitain toimintoja. Et esimerkiksi pysty toteuttamaan rohkeita kuin ASCII säilyttää ainoastaan merkityksen tietojen välittämättä sen yleistä muodoissa.
ISO on hyväksynyt ISO 8859 -standardit. Tämä ryhmä määrittää kahdeksan bittisen koodauksen eri kieliryhmille. Erityisesti ISO 8859-1 on Extended ASCII, joka on taulukko Yhdysvalloille ja Länsi-Euroopan maille. Ja ISO 8859-5 on taulukko, jota käytetään kyrillisille, myös venäjäksi.
Useista historiallisista syistä ISO 8859-5 -standardia ei käytetty kovin pitkään.
Venäjänkielellä tällä hetkellä koodausta todella käytetään:
Ensimmäisen standardin CP866 tärkein etuoli pseudo-graafisten symbolien säilyttäminen samoissa kohdissa kuin Extended ASCII -järjestelmässä. Tämä mahdollistaa muuttumattomien tekstiohjelmien, ulkomaisen tuotannon, kuten kuuluisan Norton Commanderin. Tällä hetkellä CP866-ohjelmaa käytetään Windows-käyttöjärjestelmissä, jotka toimivat koko näytön teksti -tilassa tai tekstin ikkunoissa, mukaan lukien FAR Manager.
CP866-koodauksessa kirjoitetut tietokone-tekstit ovat äskettäin olleet harvinaisia, mutta niitä käytetään venäläisissä tiedostonimissä "Vindous".
Tällä hetkellä kaikkein yleisinsai tämän tietyn koodauksen. Unicode-koodit on jaettu alueisiin. Ensimmäinen (U + 0000: stä U + 007F: hen) sisältää ASCII-koodin koodin merkit. Seuraa sitten eri kansallisten komentosarjojen merkkien alueita sekä välimerkkejä ja teknisiä symboleja. Lisäksi osa Unicode-koodeista on varattu, jos tulevaisuudessa tarvitaan uusia symboleja.
Nyt tiedät, että ASCII-koodauksessa, kukinsymboli on esitetty kahdeksan nollan ja yhden yhdistelmällä. Muille kuin asiantuntijoille nämä tiedot saattavat tuntua turhalta ja tuntemattomilta, mutta etkö halua tietää, mitä tietokoneen aivoissa tapahtuu?
</ p>