410 Shares 2447 views

codice ASCII (codice standard americano per lo scambio di informazioni) – la codifica del testo di base per l'alfabeto latino

Secondo l'Unione internazionale delle telecomunicazioni, nel 2016 Internet con più o meno utilizzano regolarmente tre miliardi e mezzo di persone. La maggior parte di loro non hanno nemmeno pensare che tutti i messaggi inviati a loro tramite un PC o dispositivi mobili, così come i testi che vengono visualizzati sui monitor di tutti i tipi, di fatto, è una combinazione di 0 e 1. Questa è chiamata la rappresentazione codificata delle informazioni. Fornisce e facilita l'attuazione del suo stoccaggio, elaborazione e trasmissione. Nel 1963, il codice ASCII degli Stati Uniti è stato sviluppato, che è oggetto di questo articolo.

Presentazione di informazioni nel computer

In termini di qualsiasi testo calcolatore elettronico è una raccolta di singoli caratteri. Tra di loro non sono solo la lettera, compresa la capitale, ma anche segni di punteggiatura, i numeri. Inoltre, simboli speciali vengono utilizzati "=", "e", "(" e spazi.

Una pluralità di simboli che compongono il testo, chiamato l'alfabeto, e il numero – potenza (indicato come N). Per determinare l'espressione N = 2 ^ b, dove b – numero di bit di informazione o un peso particolare simbolo.

Si è dimostrato che la potenza di 256 caratteri permette alfabeto di inviare tutti i caratteri necessari.

Poiché 256 è un 8 gradi due, allora il peso di ogni carattere è 8 bit.

Unità di misura 8 bit è chiamato 1 byte, quindi diciamo che il codice binario di qualsiasi carattere nel testo che viene memorizzato sul computer, occupa un byte di memoria.

Come è la codifica

Qualsiasi testo inserito nella memoria del PC tramite i tasti della tastiera, i numeri su cui erano scritti, lettere, segni di punteggiatura e altri simboli. In memoria vengono trasmessi in codice binario, vale a dire, ogni simbolo è associato al codice decimale familiare per una persona da 0 a 255, che corrisponde ad un codice binario – .. Da 00000000 a 11111111.

codifica dei caratteri byte consente al processore esegue l'elaborazione di testo, fare riferimento a ciascun carattere separatamente. Allo stesso tempo, i 256 caratteri è sufficiente per rappresentare tutte le informazioni di carattere.

Codifica caratteri ASCII

Questa sigla sta per il codice standard inglese americano per lo scambio di informazioni.

Anche agli albori della informatizzazione, è emerso che è possibile trovare una varietà di modi di codifica delle informazioni. Tuttavia, per trasferire informazioni da un computer ad un altro è stato richiesto di sviluppare un unico standard. Così, nel 1963 v'è stato un ASCII-table negli Stati Uniti. E qualsiasi alfabeto calcolatore carattere viene assegnato un numero di sequenza nella rappresentazione binaria. Inizialmente, il codice ASCII viene utilizzata solo negli Stati Uniti, e più tardi divenne uno standard internazionale per il PC.

INDICE

codici ASCII sono divise in 2 parti. Standard internazionale è considerata solo la prima metà della tabella. Esso include codice dal numero di sequenza di 0 (codificata come 00000000) a 127 (codice 01111111).

numero di serie

N

testo ASCII Coding

simbolo

0 – 31

0000 0000 – 0001 1111

I personaggi con N da 0 a 31 sono chiamati manager. La loro funzione è quella di "guida" il processo di output di testo ad un dispositivo di monitoraggio o di stampa, un segnale acustico, etc.

32 – 127

0010 0000 – 0111 1111

I simboli con N 32-127 (una parte standard della tabella) – lettere maiuscole e minuscole dell'alfabeto latino, i numeri 10-Nye, segni di punteggiatura e varie staffe, commerciali e altri personaggi .. Simbolo 32 indica uno spazio.

128 – 255

1000 0000 – 1111 1111

Simboli con N da 128 a 255 (una parte alternativa della pagina tabella o codici) può avere una varietà di opzioni, ciascuna delle quali ha il proprio numero. La pagina di codice utilizzato per impostare alfabeti nazionali, che sono diverse dal latino. In particolare, viene effettuata con l'ausilio di codice ASCII per i caratteri russi.

Tabella codifica maiuscole e minuscole sono susseguono in ordine alfabetico e numeri – valori crescenti. Questo principio vale per l'alfabeto russo.

caratteri di controllo

tavolo codifica ASCII stato originariamente progettato per la ricezione e la trasmissione di informazioni su questo non viene più utilizzato dal dispositivo come una telescrivente. A questo proposito, il set di caratteri inclusa non stampabile utilizzato come comandi per controllare il dispositivo. Tali comandi sono stati utilizzati in tali tecniche messaggistica pre-computer come codice Morse, e così via.

Il simbolo più comune "telescrivente" è il NUL (00 "zero"). Egli è ancora usato nella maggior parte dei linguaggi di programmazione, che indica il segno della fine della linea.

Dove codifica ASCII utilizzati

American Standard Code richiede non solo la tastiera di immissione del testo. Viene usato anche nel grafico. In particolare, le immagini ASCII Art Maker programma rappresentano diversa codifica dei caratteri ASCII estensioni spettro.

Questi prodotti sono di due tipi: editor grafici svolgere la funzione per la conversione di un'immagine in testo e converte il "Immagini" in ASCII-grafica. Ad esempio, noto è un primo esempio di codifica Smiley simbolo.

ASCII può essere utilizzato per la creazione del documento HTML. In questo caso, è possibile inserire una serie di caratteri e un simbolo che corrisponde a questo codice viene visualizzato quando si visualizza la pagina sullo schermo.

ASCII è necessaria per la creazione di siti multilingue, come segni che non appartengono ad una particolare tabella nazionale, sostituito da ASCII-codes.

alcune caratteristiche

Per codificare le informazioni di testo in formato ASCII è stato originariamente usato 7 bit (uno è rimasto vuoto), ma oggi lavora come un 8-bit.

Le lettere, che si trovano nelle colonne sono sopra e sotto, differiscono tra loro solo da un singolo bit. Ciò riduce notevolmente la complessità del test.

applicazione ASCII in Microsoft Office

Se necessario, questo tipo di informazioni di testo codifica può essere utilizzato in editor di testo da parte di Microsoft, come Blocco note e Office Word. Tuttavia, quando si digita in questo caso, non è possibile utilizzare alcune funzioni. Ad esempio, non sarà in grado di svolgere in grassetto come il carattere ASCII conserva solo il significato delle informazioni, ignorando la sua forma complessiva e la forma.

standardizzazione

L'organizzazione ha adottato norma ISO 8859. Questo gruppo definisce la codifica a otto bit per i diversi gruppi linguistici. In particolare, ISO 8859-1 – è l'ASCII esteso, che è un tavolo per gli Stati Uniti e l'Europa occidentale. A ISO 8859-5 – è la tabella utilizzata per l'alfabeto cirillico, tra cui la lingua russa.

Per ragioni storiche a ISO 8859-5 viene utilizzato per un breve periodo.

Per la lingua russa in questo momento codifica effettivamente utilizzato:

  • CP866 (Code Page 866), o DOS, che viene spesso chiamato GOST codifica alternativa. E 'stato utilizzato attivamente fino a metà degli anni 90-zioni del secolo scorso. Al momento, quasi mai utilizzato.
  • KOI-8. Coding è stato sviluppato nel 1970-80s, e al momento è uno standard comune per i messaggi di posta elettronica in RuNet. È ampiamente usato nella famiglia del sistema operativo Unix, compreso Linux. versione "russo" di KOI-8, chiamato KOI-8R. In aggiunta, ci sono versioni per altre lingue come il cirillico ucraino.
  • Code Page 1251 (CP 1251, Windows – 1251). Sviluppato da Microsoft per fornire il supporto per la lingua russa in ambiente Windows.

Il vantaggio principale del CP866 primo standard era di preservare caratteri pseudo-grafica nelle stesse posizioni come nella ASCII esteso. Questo consente di eseguire il testo invariato del programma, la produzione estera, come il famoso Norton Commander. A questo punto CP866 è usato per i programmi progettati per Windows, che operano a schermo intero testo o in caselle di testo, tra cui in FAR Manager.

testi scritti in Computer codifica CP866, ultimamente sono abbastanza rari, ma è usato per i nomi dei file russi in "Vindous".

"Unicode"

Al momento, la più diffusa è questa codifica. Codici "Unicode" sul campo. La prima (da 0000 a U + U + 007F) comprende un insieme di caratteri ASCII con codici. Seguito da personaggi campo della letteratura diversa nazionali, così come la punteggiatura e simboli tecnici. Inoltre, parte del codice "Unicode" è riservato in caso di necessità di includere nuovi personaggi in futuro.

Ora si sa che in ASCII ogni carattere è rappresentato come una combinazione di 8 zero e uno. Layman, queste informazioni possono sembrare inutile e poco interessante, ma non si vuole sapere cosa sta succedendo "nel cervello" del computer?!