ASCII (američki standardni kod za razmjenu informacija) - osnovno kodiranje teksta za latinicu
Prema Međunarodnoj telekomunikacijskoj uniji, 2016. godine troje i pol milijardi ljudi koristili su Internet ovom ili onom pravilnošću. Većina njih uopće ne razmišljati o tome sve poruke poslane na njih putem računala ili mobilnih gadgeta, kao i tekstovi koji se prikazuju na monitorima svih vrsta, u stvari, je kombinacija 0 i 1. To se zove kodirani prikaz informacija. On pruža i uvelike olakšava provedbu svoje pohrane, obrade i prijenosa. Godine 1963. razvijen je američki kodiranje ASCII, koji je predmet ovog članka.
sadržaj
Prikaz podataka u računalu
Sa stajališta bilo kojeg elektroničkog računala, tekst je zbirka pojedinačnih simbola. Oni uključuju ne samo pisma, uključujući i velika slova, ali i interpunkcijske znakove, brojeve. Osim toga, koriste se posebni znakovi "=", "", "(" i prostori.
Skup simbola koji čine tekst naziva se abeceda, a njihov broj je moć (označena kao N). Da biste je odredili, upotrijebite izraz N = 2 ^ b, pri čemu je b broj bitova ili težina informacija određenog simbola.
Dokazano je da abeceda kapaciteta od 256 znakova omogućuju vam da predstavite sve potrebne simbole.
Budući da je 256 osamna snaga dva, težina svakog simbola je 8 bita.
Jedinica mjere od 8 bita se zove 1 bajt, pa je uobičajeno to reći binarni kod Svaki znak u tekstu pohranjenom na računalu zauzima jedan bajt memorije.
Kako se vrši kodiranje
Svi se tekstovi upisuju u memoriju osobnog računala pomoću tipkovnih tipki na kojima su pisani brojevi, slova, interpunkcijski znakovi i drugi simboli. U spomen na one se prenose u binarnom kodu, odnosno svaki simbol se preslikava na poznatu decimalnog koda za osobu od 0 do 255, što odgovara binarnom kodu - .. Od 00000000 do 11111111.
Byte-byte kodiranje znakova omogućuje procesoru koji obavlja obradu teksta kako bi pristupio svakom znaku zasebno. Istovremeno, 256 znakova dovoljno je da predstavljaju sve informacije o znakovima.
Kodiranje znakova ASCII
Ova kratica na engleskom jeziku označava američki standardni kod za razmjenu informacija.
Čak iu svitanje računalstva, postalo je očito da možete pronaći različite načine kodiranja informacija. Međutim, za prijenos podataka s jednog računala na drugo, bilo je potrebno razviti jedan standard. Dakle, 1963. godine u SAD-u bilo je tablica za kodiranje ASCII. U njemu, svaki simbol abecede računala dodjeljuje serijski broj u binarnom prikazu. U početku je ASCII kodiranje korišteno samo u Sjedinjenim Državama, a zatim je postao međunarodni standard za PC.
Sadržaj tablice
ASCII kodovi su podijeljeni u 2 dijela. Međunarodni standard samo je prva polovica ove tablice. Uključuje simbole s rednim brojevima od 0 (kodiran kao 00000000) do 127 (šifra 01111111).
Broj sekvence N | Kodiranje ASCII teksta | simbol |
0 - 31 | 0000 - 0001 1111 | Simboli s N od 0 do 31 nazivaju se menadžeri. Njihova je funkcija "voditi" postupak izlaženja teksta na monitor ili uređaj za ispis, dajući audio signal, itd. |
32 - 127 | 0010 0000 - 0111 1111 | Simboli s n od 32 do 127 (standardni dio tablice) - velika i mala slova latinice, 10-Nye brojevi, znakovi interpunkcije, i razne zagrade, komercijalni i ostali likovi .. Simbol 32 označava prostor. |
128 - 255 | 1000 0000 - 1111 1111 | Simboli s N od 128 do 255 (alternativni dio tablice ili kodne stranice) mogu imati različite varijante, od kojih svaka ima svoj broj. Kodna stranica koristi se za određivanje nacionalnih alfabeta, koji se razlikuju od latinskog. Konkretno, sa svojim je pomoćom ASCII kodiran za ruske znakove. |
U tablici za kodiranje, velika i mala mala slova idite jedan za drugim abecednim redom, a brojevi - u povećanju vrijednosti. Ovo je načelo također sačuvano za rusku abecedu.
Kontrolni znakovi
Tablica za kodiranje ASCII izvorno je stvorena za primanje i prijenos informacija na uređaju koji nije dugo korišten, poput teletipsa. U tom smislu, bez ispisa, koji se koriste kao naredbe za upravljanje ovim uređajem, uključene su u skup znakova. Slične naredbe korištene su u takvim predodređenim metodama razmjene poruka kao Morseov kod, itd.
Najčešći simbol "teletro" označava NUL (00, "nula"). Još se uvijek koristi u većini programskih jezika, što označava krajnji karakter.
Tamo gdje se koristi ASCII kodiranje
Američki standardni kod potreban je ne samo za upisivanje tekstualnih podataka s tipkovnice. Koristi se i za grafiku. Posebno, u ASCII Art Maker programu, slike raznih ekstenzija predstavljaju raspon simbola ASCII znakova.
Slični proizvodi su od dvije vrste: obavljanje funkcije grafičkih urednika pretvaranjem slika u tekst i pretvaranjem "crteža" u ASCII grafiku. Na primjer, dobro poznata smijeska je živopisan primjer simbola kodiranja.
ASCII se također može koristiti prilikom izrade HTML dokumenta. U tom slučaju, možete unijeti skup znakova i simbola koji odgovara ovaj kod će se pojaviti tijekom pregledavanja stranice na zaslonu.
ASCII je također potreban za stvaranje višejezičnih stranica, budući da znakovi koji nisu dio određene nacionalne tablice zamjenjuju se ASCII kodovima.
Neke značajke
Za kodiranje tekstualnih informacija u ASCII kodiranju, u početku su korišteni 7 bita (jedan je bio prazan), ali danas funkcionira kao 8-bitni.
Slova smještena u stupcima na vrhu i na dnu se međusobno razlikuju samo jednim bitom. To uvelike smanjuje složenost provjere.
Upotreba ASCII u Microsoft Officeu
Ako je potrebno, ova vrsta kodiranja tekstualnih podataka može se koristiti u Microsoftovim urednicima teksta, kao što su Notepad i Office Word. Međutim, prilikom upisivanja, u ovom slučaju nemoguće je koristiti neke funkcije. Na primjer, nećete biti u mogućnosti provesti hrabar kao ASCII karakter zadržava samo značenje informacija, ignoriranje svoj osnovni oblik i formu.
standardizacija
ISO je usvojio standarde ISO 8859. Ova grupa definira 8-bitna kodiranja za različite jezične skupine. Konkretno, ISO 8859-1 je proširen ASCII, što je tablica za Sjedinjene Države i zemlje zapadne Europe. ISO 8859-5 je stol koji se upotrebljava za ćirilicu, uključujući ruski.
Zbog brojnih povijesnih razloga standard ISO 8859-5 nije se koristio jako dugo.
Za ruski jezik u ovom trenutku, kodiranje se stvarno koristi:
- CP866 (kodna stranica 866) ili DOS, što se često naziva alternativnim kodiranjem GOST. Aktivno se upotrebljava do sredine 90-ih godina prošlog stoljeća. U ovom trenutku gotovo se ne koristi.
- KOI-8. Kodiranje je razvijeno 1970-80-ih, a trenutno je standard za poruke e-pošte u RuNet-u. To je naširoko koristi u OS obitelji Unix, uključujući i Linux. "Ruska" verzija KOI-8 naziva se KOI-8R. Osim toga, postoje i verzije za druge ćirilice, na primjer, ukrajinski.
- Kôd Stranica 1251 (CP 1251, Windows - 1251). Razvijena od strane tvrtke Microsoft Corporation za pružanje podrške ruskom jeziku u Windows okruženju.
Glavna prednost CP866 prvi standard je sačuvati pseudo-grafičke znakove u istom položaju kao u Extended ASCII. To je omogućilo pokretanje nepromijenjenih tekstualnih programa, inozemne proizvodnje, kao što je poznati zapovjednik Norton. Trenutno se CP866 koristi za programe razvijene u sustavu Windows koji rade u tekstualnom modusu cijelog zaslona ili u prozorima teksta, uključujući FAR Manager.
Računalni tekstovi, napisani u kodiranju CP866, nedavno su bili rijetki, ali se koriste za ruske nazive datoteka u "Vindous".
"Unicode"
Trenutačno je ovo šifriranje najrasprostranjenije. Unicode kodovi podijeljeni su na regije. Prvi (od U + 0000 do U + 007F) sadrži znakove ASCII seta s kodovima. Zatim pratite područja znakova različitih nacionalnih skripti, kao i znakove interpunkcije i tehničke simbole. Osim toga, dio Unicode kodova je rezerviran u slučaju da postoji potreba za ubacivanjem novih simbola u budućnost.
Sada znate da se kod ASCII kodiranja svaki znak predstavlja kao kombinacija od 8 nula i jednog. Za ne-stručnjake, ove informacije svibanj činiti se nepotrebnim i nezanimljiv, ali ne želite znati što se događa u "mozak" vašeg računala?!
- Rad s tekstom. Kako odrediti kodiranje datoteke
- ASCII, simboli: opis, tablica koda i prikazi
- Način kodiranja podataka pomoću brojeva. Binarno kodiranje
- Kodiranje je ... Potpisani sustavi: kodiranje podataka
- Kodiranje i dekodiranje je teško?
- Proširenje tekstualne datoteke: vrste i glavni aspekti utvrđivanja pripadnosti programima
- Što je kodiranje i dekodiranje? Primjeri. Metode kodiranja i dekodiranja podataka numeričkih,…
- Što je kodiranje informacija i njegova obrada?
- Zašto je binarno kodiranje univerzalno? Programske metode
- UTF-8 - kodiranje znakova
- Koja je snaga abecede? Kako pronaći snagu abecede: formula
- Htaccess (kodiranje): postavka, primjeri upotrebe
- Kodiranje teksta
- Postoje dva načina za promjenu kodiranja u programu Word
- Dva načina za promjenu kodiranja u programu Word
- Koncept informiranja
- Što je Bodo kod? Opis tehnologije
- Binarni kodovi: recenzije, komentari, pitanja, odgovori
- Dekodiranje crtičnog koda. Korisne informacije
- Kodiranje HTML-a. Kako su web stranice oslikane
- Kodiranje tekstualnih podataka na računalu