Um conjunto de caracteres é um grupo completo de caracteres de um ou mais sistemas de escrita. É mais completo que o alfabeto. Esta formado por um conjunto de símbolos gráficos e textuais, cada um dos quais está mapeado para um conjunto de inteiros não negativos. O primeiro conjunto de caracteres usado na computação foi o ASCII. É limitado, pois só pode representar o inglês americano. O Unicode define um conjunto de caracteres universal padronizado que pode ser estendido a fim de absorver adições.