215 Shares 3440 views

L'ASCII, caratteri: descrizione, tabella dei codici e tipi

Come è noto, il computer memorizza le informazioni in forma binaria, presentandolo come una sequenza di uno e zero. Per tradurre le informazioni in una forma adatta per il consumo umano, ogni sequenza univoca di numeri quando Visualizzazione sostituito dal carattere corrispondente.

Uno dei sistemi di correlazione codici binari per stampare e caratteri di controllo è ASCII.

Al livello attuale di sviluppo della tecnologia informatica che l'utente non ha bisogno di conoscere il codice per ogni simbolo particolare. Tuttavia, la comprensione generale di come la codifica viene effettuata, è estremamente utile, e per alcune categorie di specialisti e tutto il necessario.

creare ASCII

Nella forma originale della codifica è stato sviluppato nel 1963 e poi per 25 anni due volte aggiornato.

Nella versione originale della tabella carattere ASCII comprende 128 caratteri, versione successiva apparso estesa, dove vengono salvati i primi 128 caratteri e codici coinvolti con i simboli ottavo bit mappati precedentemente assenti.

Nel corso degli anni, questa codifica è il più popolare al mondo. Nel 2006 il posto di primo piano ha preso Latina nel 1252, e alla fine del 2007 e attualmente detiene una posizione di leadership saldamente Unicode.

rappresentazione informatica ASCII

Ogni carattere ASCII ha il proprio codice formato da 8 caratteri, che rappresenta uno zero o uno. Il numero minimo di tale rappresentazione è zero (otto zeri nel sistema binario), che è la sorgente del primo elemento nella tabella.

codice binario massima a una versione ASCII del originale è nullo + sette unità, e nella versione estesa – otto unità, connesse come l'ottavo bit.

caratteri di controllo

caratteri di controllo sono chiamati segni che non hanno una rappresentazione grafica e viene utilizzato per l'organizzazione del testo, dispositivi di controllo, e così via D. Si può indicare l'inizio o la fine del testo, linguette, generare un segnale sonoro, varie operazioni di TTY (teletype -. una macchina per il trasferimento di dati canale elettrico) risoluzione dei dati del dispositivo di uscita, ecc azione di cancellazione.

Nella tabella dei caratteri ASCII posizioni da 0 a 31, e 127 sono assegnati per i caratteri di controllo. Totale di 33 marchi.

I caratteri rimanenti

I restanti 95 posizioni sono riservate ai segni di punteggiatura e operazioni matematiche, cifre decimali, lettere dell'alfabeto, diverso registro: "A" e una "A" maiuscola corrispondono orizzontale per diversi codici nella tabella dei caratteri ASCII.

i numeri di caratteri nella tabella

Se una persona è impegnata nello sviluppo di software, o per eseguire alcune altre attività dal settore delle tecnologie dell'informazione, è necessario conoscere il numero di un certo numero di caratteri ASCII.

Come accennato in precedenza, la posizione di 0-31 e 127 prendere caratteri di controllo. Numero 32 è assegnato a uno spazio, il numero di 33-47, 58-64 e sono riservati per le operazioni di punteggiatura e matematiche di base.

lettere maiuscole latine disposte in ordine alfabetico e sono numerati da 65 ° a 90 °. minuscole sono anche disposti in ordine alfabetico, le loro posizioni – da 97 ° a 122 °. I numeri rimanenti (91-96 e 123-126) assegnati alle staffe e bretelle, obliqua e diritta caratteristica, così come alcuni dei segni diacritici.

tavolo pieno di simboli in una rappresentazione grafica comoda è visibile nell'immagine sopra. La figura seguente mostra il numero di segni nella tabella dei caratteri ASCII russo.

ASCII esteso

Dal momento che la versione originale del codice è stato sviluppato, sulla base del membro americana, non ci sono stati forniti non solo per i vari tipi di scrittura e alfabeti nazionali, ma anche un uso conveniente dei segni diacritici, attivamente utilizzati nelle lingue europee.

8 bit è stata coinvolta per la formazione della codifica estesa. Questa versione include simboli di alfabeti nazionali europei e trascrizione fonetica, elementi grafici, utilizzati per tavoli da disegno, un certo numero di simboli matematici.

Alcuni caratteri ASCII sono raramente utilizzati oggi. In particolare, questo vale per i caratteri che vengono utilizzati per disegnare tabelle, come negli anni successivi lo sviluppo della codifica estesa, molto sono stati introdotti più convenienti modi di rappresentazione grafica delle tabelle.

Varianti nazionali di codifica

Prima dell'avvento della versione ASCII estesi per visualizzare i caratteri internazionali utilizzati rigenerate codifica versione, dove posizionare le lettere latine sono stati collocati russo, greco, caratteri arabi.

Due codici nella tabella sono riservati per il passaggio tra l'US-ASCII standard e il suo obiettivo nazionale.

Dopo l'ASCII non divenne includere 128 e 256 caratteri, la diffusione per la codifica opzione, in cui la versione originale del tavolo è stato salvato nei primi 128 codici da zero 8 bit. Segni letteratura nazionale memorizzato nella metà superiore della tabella (posizione 128-255-esima).

Per conoscere i codici di carattere ASCII direttamente l'utente non è necessaria. sviluppatore di software di solito è sufficiente conoscere il numero dell'elemento nella tabella per calcolare il codice, se necessario, utilizzando il sistema binario.

lingua russa

In seguito allo sviluppo nei primi anni '70 di codifiche per le lingue scandinave, cinese, coreano, greco, ecc, Creare la propria versione del impegnati e l'Unione Sovietica. Presto sviluppato versione di codifica a 8 bit chiamato KOI8, preservando i primi 128 codici di carattere ASCII e assegna lo stesso numero di posizioni sotto le lettere dell'alfabeto nazionale e caratteri aggiuntivi.

Prima dell'introduzione di Unicode KOI8 dominato nel segmento russo di Internet. C'erano le varianti di codifica per il russo, e per l'alfabeto ucraino.

problemi ASCII

Poiché il numero di elementi anche in tabella estesa non supera 256, la possibilità di accogliere una singola codifica vari diversi script assente. Negli anni '90 c'era un problema in RuNet "oops, spazzatura", quando i caratteri ASCII russi testo digitato vengono visualizzati correttamente.

Il problema era la discrepanza di codici di opzioni diverse tra loro ASCII. Ricordiamo che nelle posizioni 128-255 possono essere posizionati vari segni, e quando si cambia un set di caratteri Cirillico ad un altro, tutte le lettere del testo sono state sostituite da altre aventi lo stesso numero in un altro codici di versione.

stato attuale

Con l'avvento di Unicode popolarità ASCII è diminuita.

La ragione di ciò sta nel fatto che i nuovi set di caratteri possono contenere segni di lingue quasi tutti scritti. In questo caso, i primi 128 caratteri ASCII corrispondono allo stesso carattere Unicode.

Nel 2000, è stato l'ASCII codificati su Internet e utilizzato da 60% delle pagine web indicizzate "Google" più popolari. Già entro il 2012 la proporzione di tali pagine è sceso al 17%, e il luogo della codifica più popolare ha preso Unicode (UTF-8).

Così, ASCII è una parte importante della storia della tecnologia dell'informazione, ma il suo uso in futuro sembra poco promettente.