SITE SEARCH

Tekstin käsittely. Tiedoston koodauksen määrittäminen

Tiedämme, mitä tiedostojen koodaus on. Yksinkertaisesti sanottuna koodaus on joukko tavu merkkejä, jotka vastaavat aakkosia aakkosia tietyssä kielessä. Jokaisella kielellä on erityinen tällaisten koodausmerkin sekvenssi. Joskus on tarpeen määrittää koodaus. Harkitse tätä esimerkkinä tekstitiedostosta.

Mitä tarvitset

Tietyt ohjelmistotyökalut. Ensinnäkin tarpeeksi sovelluksia tyyppiä sana, KWrite, Firefox-selain ja tunnistustyökalut - ENCA.

Voit määrittää tiedoston koodauksen käyttäen yleistä Microsoft Word -editoria. Ennen sitä on asennettava pakkauksesta Toimistoon. Kun sovellus on asennettu ja avautuu työpöydällä olevan W-merkin avulla, siirry seuraavaan vaiheeseen.

Seuraava tunnustusprosessi

Avaa sovelluksen navigointipalkin läpi "Tiedosto" - "Avaa" kohteita kerrallaan. Sama voidaan tehdä näppäimistöyhdistelmän avulla Ctrl + O.

Valitse valintaikkunassa haluamasi hakemisto ja itse asiassa tiedosto lukemiseen. Valitse se hiirellä, napsauta "avaa" -painiketta.

Kun tiedostossa ei ole otteluasetusta CP1251, hakemus yrittää määrittääkoodaus. Näytetään luettelo mahdollisista otteluista. Valitse luettelon oikealla puolella olevista ehdotetuista merkkijonoista yksi koodauksista. Jos valinta tehdään oikein, tunnistettu teksti näkyy "näyte" -elementissä.

Kuinka määritellä koodaus KWrite-ohjelmalla

Tekstinkäsittelyn edeltäjän, Wordin lisäksi, on myös muita toiminnallisia apuohjelmia. Yksi niistä - KWrite (unix-järjestelmien analogi). Jotta et sekoittaisi, kirjoitan pisteitä "määrittämään asiakirjan koodauksen KWrite-ohjelmassa".

  1. Tiedoston lataaminen laajennuksella .txt sovellukseen.
  2. Enkoodien rekursio, kunnes yksi niistä ei ole sopiva.
  3. Voit tehdä vaiheen 2 siirtymällä koodausvalikon työkaluihin.

Selain Mozilla Firefox, tavoite on sama - määrittää koodauksen

Periaate on suunnilleen sama kuin tekstien käsittelyssä käytettävät apuohjelmat. Suorita asennettuna oleva selain suoritettavaksi ja jos sitä ei ole asennettu - lataa asennusohjelma mozilla.org-palvelusta.

Sitten avoimen ohjelman ikkunassa sinun täytyy avatatekstitiedosto "Tiedosto" -valikon kautta, alavalikko "Avaa tiedosto". Jos valittu tiedosto näkyy ilman vääristymiä ja teksti on luettavissa, koodausta ei ole vaikea määrittää.

Jos haluat tehdä tämän, siirry "View" - "encoding", näytetään useita merkkijoukkoja ja yksi niistä, vastapäätä on "rasti", ja on selainpohjainen koodaus.

Jos tekstiä ei tunnisteta oikein, valitse "lisäksi" alaosa, kokeile koodauksella tai valitse arvo "auto".

Erikoistuneet ohjelmistot - työskentelemällä enca kanssa

Lisäksi on olemassa useita ylimääräisiä elektronisia työkaluja, joiden avulla voidaan määrittää epävirallisen tekstin koodaus.

Niille, jotka ovat tottuneet työskentelemään unixin alla,hyödyllisyys enca. Se voidaan asentaa "Package Manager" -palvelun avulla. Kun olet löytänyt käytettävissä olevan pakkausryhmän, voit aloittaa ohjelmiston asentamisen.

Jotta tunnistekielet voidaan listata, suorita enca-listikielet komennolla päätelaitteen avulla.

Jos haluat määritellä tekstitiedoston koodauksen avaimen (g) jälkeen, anna sen nimi ja anna tunnustekieli samalla (L) -vaihtoehdon jälkeen:

enca -L russian -g /home/vic/temp/myfile.txt.

Yhteenvetona, mitä sanottiin koodauksesta

Uskon, että edellä mainitut apuohjelmat tarjoavat käyttäjälle riittävät työkalut tekstidokumenttien dekoodaamiseen.

Vaikka tosiasiassa kyse on siitä, miten tunnistaakoodaus. Vakioihin tarkoituksiin, mielestäni määritelty ohjelmisto lähestyy. On olemassa erikoistuneempia menetelmiä määritelmää varten, mutta niiden tarkastelu ei kuulu tämän artikkelin soveltamisalaan.

Microsoft Wordissa tunnistuslähde voi olla joko tavallinen teksti tai monimutkainen muotoilu.

</ p>
  • arviointi: