112 Shares 3396 views

Codifica delle informazioni di testo nel computer

Computer – un sofisticato dispositivo con cui è possibile creare, convertire e memorizzare le informazioni. Tuttavia, il computer non funziona modo molto comprensibile per noi – grafica, testo e dati numerici vengono memorizzati come array binari numeri. In questo articolo vedremo come la codifica delle informazioni di testo.

Quello che per noi è il testo di un computer – una sequenza di caratteri. Ogni simbolo rappresenta un certo insieme di zero e uno. Sotto i simboli inteso non solo maiuscole e minuscole lettere dell'alfabeto latino alfabeto, ma anche segni di punteggiatura, segni aritmetici, caratteri speciali, simboli speciali e anche lo spazio.

codifica binaria di informazioni testuali

Premendo un determinato tasto sul regolatore interno invia un segnale elettrico che viene convertito in un codice binario. Codice è abbinato con un certo simbolo, che è visualizzato sullo schermo. Per l'invio di latino in un formato ASCII digitale sistema di codifica internazionale è stato creato. Richiede 1 byte per registrare un simbolo consiste quindi della sequenza di otto simbolo di zero e uno. L'intervallo di registrazione – dalle 00000000 a 11111111, vale a dire la codifica delle informazioni di testo utilizzando questo sistema permette di rappresentare 256 caratteri. Nella maggior parte dei casi, questo è sufficiente.

ASCII è diviso in due parti. I primi 127 caratteri (da 00000000 a 01111111) sono internazionali e sono simboli e lettere dell'alfabeto inglese specifici. La seconda parte – l'estensione (10.000.000-11.111.111) – ha lo scopo di rappresentare l'alfabeto nazionale, la scrittura di che è diverso dal latino.

Codifica informazioni di testo in ASCII si basa sul principio della sequenza crescente, cioè, maggiore è il numero di sequenza di lettere, maggiore è il valore della sua codice ASCII. Figure e parte russa della tabella sono costruiti sullo stesso principio.

Tuttavia, nel mondo ci sono diversi tipi di codifica per caratteri cirillici. Il più comune – è KOI-8 (codifica a otto bit che è stato utilizzato per negli anni '70 nel sistema operativo Unix prima ruifitsirovannyh), ISO 8859-5 (sviluppato dall'Ufficio internazionale per la standardizzazione), il CP 1251 (codifica informazioni testuali utilizzati nella moderno sistema operativo Windows), così come 2 byte codifica Unicode, che può essere utilizzato per introdurre 65.536 caratteri. Tale varietà di codifiche a causa del fatto che sono stati sviluppati in tempi diversi, per diversi sistemi operativi e diverse considerazioni. A causa di questo, spesso hanno difficoltà nel trasferimento testo da un mezzo ad un altro – da una mancata corrispondenza codificante l'utente vedrà un set di icone di confusione. Come posso risolvere questa situazione? In Word, ad esempio, quando un documento viene aperto, un messaggio di problemi con la visualizzazione del testo e offre diverse opzioni per la transcodifica.

Così, la codifica e l'elaborazione di informazioni testuali nel viscere del computer – il processo è difficile e richiede tempo organizzata. Tutti i simboli di qualsiasi alfabeto sono solo una certa sequenza di cifre del sistema binario, una cella – questo è un byte di informazioni.