Sunday, November 04, 2007

Estandar Unicode

¿Que es?
Es el estandar universal de codificacion de caracteres usa para representar el texto que se escribe en el computador.

¿Esta escrita bajo alguna norma?
Si, bajo la ISO/IEC 10646. Es totalmente compatible, y es actualizada constantemente.

¿Cuales son sus beneficios?
Cualquier tipo de implementacion con Unicode, podra decirse que tambien fue implementado bajo la norma ISO/IEC 10646.

¿Que hace Unicode?
Provee una manera unica y consistente de codificar texto en todos los idiomas.

¿Que problemas soluciono?
El intercambio internacional de archivos de texto.

¿Quienes son sus principales beneficiados?
  • Las personas de negocio.
  • Poliglotas.
  • Investigadores.
  • Cientificos.
  • Matematicos.
  • Tecnicos.
¿En que se basa Unicode?
Se basa en ASCII, y lo expando, yendo mas alla del alfabeto latino.

¿Que hace Unicode que no hace ASCII?
  • Codifica todos los caracteres existentes en los idiomas de todo el mundo.
  • La manera de codificar un caracter es simple y eficiente.
  • Cada caracter corresponde a un unico valor numero y a un unico nombre.
¿Como lo hace?
Existen 3 formas de codificacion que contienen el mismo conjunto de caracteres, permiten la codificacion de millones de caracteres.

¿Es suficiente, para soportar todo tipo de escritura?
  • Si, para todos los requerimientos de codificacion de caracteres.
  • Cubre totalmente todos los escritos existentes en el mundo del presente y del pasado.
  • Provee sistemas de notacion comunes.
¿Que textos utiliza?
  • El alfabeto europeo.
  • El alfabeto del medio oriente(middle eastern), de derecha a izquierda.
  • Textos asiaticos.
¿Que incluye el estandar Unicode?
  • Signos de puntuacion.
  • Signo diacrito.
  • Simbolos matematicos.
  • Simbolos tecnicos.
  • Flechas.
  • Dingbats.
  • Letras acentuadas(caracter simple + un signo diacrito).
La version 5.0 provee 99 089 caracteres.

¿Como estan ordenados los codigos?
Usan el plano multilenguaje basico (BMP).


¿Como se representa cada caracter?
En bits.

¿Que tamaƱo de datos maneja?
Usa 3 formas de codificacion, que permiten la transmicion de datos en cualquier direccion, sin la perdida de integridad, transmiten byte, word y doble word midiendo cada uno de ellos 8, 16 y 32 bits respectivamente.

¿Que normas de transmicion existen?

  • UTF-8.
    • Usa grupos de bytes para representar el estandar Unicode, posee los mismo valores de bytes de los que posee el ASCII.
    • Es codificado en 8 bits.
  • UTF-16.
    • Usado para propositos de economizar el espacio.
    • Es codificado en 16 bits.
  • UTF-32.
    • Es codificado en 32 bits.
    • El espacio no interesa.
Este link fue generado por la pregunta:
En sql server 2005, en el t-sql, cual es la diferencia que existe entre los tipos, char, nchar, varchar, nvarchar.(ya que el prefijo n significa Unicode).
Links relacionados al respecto: