Guia 1 BD - Introduccion BD - Aprendiz
-
Upload
andres-chavez -
Category
Documents
-
view
308 -
download
6
Transcript of Guia 1 BD - Introduccion BD - Aprendiz
Regional Distrito Capital Sistema de Gestión de la Calidad
GUIA DE APRENDIZAJEINTRODUCCIÓN A LAS BASES DE DATOS
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 2 de 17
Control del Documento
Nombre Cargo Dependencia Firma Fecha
AutoresSandra Yanneth Rueda Guevara Instructor
Regional Distrito Capital
Febrero de 2011
Asesoría Pedagógica
Elizabeth ZuñigaFormadores Docentes
Regional Distrito Capital
RevisiónAprobación
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 3 de 17
1. IDENTIFICACIÓN DE LA GUÍA DE APRENDIZAJE
PROGRAMA DE FORMACION: ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN - ADSI
PROYECTO ASOCIADO:
MODALIDAD DE FORMACION: Presencial
ACTIVIDAD DEL PROYECTO: Realizar el análisis de Base de Datos ( 1 Trimestre)
RESULTADOS DE APRENDIZAJE:
220501032 04 Valorar la incidencia de los datos en los procesos del macrosistema, tomando como referente el diccionario de datos y las miniespecificaciones, para la consolidación de los datos que intervienen, de acuerdo con parámetros establecidos.
TAREA DE APRENDIZAJE Y DURACION
• Narrar la evolución de las bases de datos y de los medios de almacenamiento.
• Conceptualizar la terminología de Base de Datos.
Duración de la guía de Aprendizaje: 4 horas
2. CARACTERIZACIÓN DE LA ACTIVIDAD DE APRENDIZAJE
2.1 Introducción
Las bases de datos se ingeniaron para dar solución de almacenamiento, al ingente volumen de información generado en las grandes empresas; era necesario que el registro de los datos se hiciera de forma rápida, sencilla y fiable; además que a su vez, pudieran acceder a ellos en cualquier momento sin la necesidad de trasladarse a las salas dedicadas a archivo documental.
Con el inicio de los programas informáticos, se logró almacenar datos en los archivos de los mismos, lo cual era más cómodo pero, aun así, tenían grandes dificultades para modificar registros, estructuras o simplemente buscar información.
Inicialmente vamos a conocer la evolución en el manejo de la información, incluyendo el grado de influencia de los medios de almacenamiento; además, estableceremos el vocabulario pertinente a bases de datos.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 4 de 17
2.2 Tarea de Aprendizaje
1. Consulte y conceptualice los siguientes términos para bases de datos:Base de datos, Base de datos Relacional, Dato, Tupla, Atributo, Registro, Tabla, Archivo, Dominio, clave, Llave primaria, Llave Foránea, Cardinalidad, Relación, Usuario, SGBD, SQL, escalabilidad, flexibilidad, portabilidad, conexión, persistencia, GUI, accesibilidad.
Haga un documento tipo diccionario y agregue 8 términos diferentes a los relacionados, selecciónelos por la dificultad de comprensión, que para usted represente, sus definiciones.
Base de datos:
2. Dibuje una tabla en la que señale: dato, tupla, atributo, registro; identifique sinónimos para estos conceptos. Por ejemplo sinónimo de Tupla es: fila.
3. Elabore una tabla con las ventajas y los inconvenientes de un SGBD.
4. Relacione 4 SGBD gratuitos y 4 licenciados, que se estén utilizando actualmente, incluya sus características e identifique si son libres.
5. Indique, haciendo investigación, a que se refiere el término “Arquitectura” en el contexto de Base de Datos.
6. Defina qué es un bit, un byte, un caracter.
7. Investigue y presente la historia de los sistemas de codificación de caracteres. (ASCII, Unicode, UTF-8, etc). Qué son los caracteres no imprimibles?
8. Construya la línea de tiempo de los medios de almacenamiento y la línea de tiempo de la generación de las bases de datos sistematizadas.
DE CONOCIMIENTO:
• Respuesta a preguntas sobre los cambios que ha tenido la forma en la que se almacenan datos.• Respuesta a preguntas sobre qué es una base de datos, dato, tabla, campo, registro.
DE PRODUCTO:
• Documento con el desarrollo de las actividades planeadas en la Guía 1 BD
2.3 Proceso de Aprendizaje
2.4 Ambientes de Aprendizaje
La actividad se debe desarrollar en un aula dispuesta con equipos de cómputo y acceso a Internet.
2.5 Evaluación del aprendizaje
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 5 de 17
Para valorar el alcance del resultado de aprendizaje, se tendrá en cuenta:
La participación oportuna del aprendiz en el desarrollo de la actividad. Que el aprendiz optimice los recursos del aula en el desarrollo de las actividades propuestas y
este acorde con las normas institucionales. Que la respuesta a preguntas formuladas sobre el tema, durante el desarrollo de las
actividades propuestas, esté acorde con la lectura y el aprendiz aporte con información adicional, si es el caso.
2.6 Conclusiones
Se espera conseguir a través de la realización de esta actividad, las competencias necesarias para expresar con propiedad, conceptos sobre la evolución de las bases y los dispositivos de almacenamiento; además de la terminología propia para bases de datos.
2.7 Bibliografía
Tomado de: Bases de datos I. http://knocte.blogspot.com/2005/09/el-futuro-de-las-bases-de-datos.html http://www.monografias.com/trabajos11/basda/basda.shtml http://www.ati.es/novatica/2000/145/marpia-145.pdf http://www.ganimides.ucm.cl/aurrutia/doc_pdf/El%20Futuro%20de%20las
%20Bases%20de%20Datos.pdf. http://gigo.lacoctelera.net/post/2006/04/03/ascii-unicode-utf-8-y-
internacionalizacion http://v3.juque.cl/weblog//2006/01/25/ascii-unicode-utf8-y-la-iatarnaaianalizaaian-
parte-i.html
1. Investigación
Base de datos: Una base de datos son unas grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar fácilmente.
Base de datos Relacional: Una base de datos es el modelo más utilizado en la actualidad para implementar bases de datos ya planificadas relaciones entre los datos es guardar las tablas y relacionar los datos de ambas tablas y su nombre: modelo relacional.
Dato: Un dato es una representación simbólica y un atributo o característica de una entidad y describen hechos empíricos, sucesos y entidades.
Tupla: es una secuencia ordenada de objetos como una lista una tulpa también sirve para denominar no solo listas finitas que son capaces de ser descompuestos en un cierto número de componentes.
Atributo: Un Atributo es una una propiedad de un Objeto, elemento o archivo los atributos deben ser considerados más correctamente como metadatos. Un atributo es con frecuencia y en general una característica de una propiedad.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 6 de 17
Registro: Un registro representa un objeto único de datos implícitamente estructurados en una tabla. En términos simples, una tabla de una base de datos puede imaginarse formada de filas y columnas o campos. Cada fila de una tabla representa un conjunto de datos relacionados, y todas las filas de la misma tabla tienen la misma estructura.
Tabla en las bases de datos: se refiere al tipo de modelado de datos, donde se guardan los datos recogidos por un programa. Su estructura general se asemeja a la vista general de un programa de cálculo. Las tablas se componen de dos estructura.
Registro: es cada una de las filas en que se divide la tabla. Cada registro contiene datos de los mismos tipos que los demás registros. Ejemplo: en una tabla de nombres y direcciones, cada fila contendrá un nombre y una dirección.
Campo: es cada una de las columnas que forman la tabla. Contienen datos de tipo diferente a los de otros campos. En el ejemplo anterior, un campo contendrá un tipo de datos único, como una dirección, o un número de teléfono, un nombre, etc.
Archivo: es un conjunto de información binaria; es decir, un conjunto que va de 0 a 1. Este archivo puede almacenarse para mantener un registro de esta información. Un archivo de texto es un archivo que contiene caracteres almacenados en forma de octetos Este archivo se guarda en el disco duro con la forma: representa la extensión, la cual constituye una manera de reconocer el tipo de programa que se necesita para abrir el archivo.
Dominio: es una red de identificación asociada a un grupo de dispositivos o equipos conectados a la red Internet.
Clave: es una forma de autentificación que utiliza información secreta para controlar el acceso hacia algún recurso.
Llave primaria: se llama clave primaria a un campo o a una combinación de campos que identifica de forma única a cada fila de una tabla. Una clave primaria comprende de esta manera una columna o conjunto de columnas. No puede haber dos filas en una tabla que tengan la misma clave primaria.
Cardinalidad: es el número de tuplas que contiene ya que en las relaciones se van insertando y borrando tuplas a menudo, la cardinalidad de las mismas varían a menudo.
Usuario: Se denomina así a la persona que tiene derechos especiales en algún servicio de Internet por acreditarse en el mismo mediante un identificador y una clave de acceso, obtenidos con previo registro en el servicio, de manera gratuita o de pago. Normalmente, un usuario registrado tiene asignada una cuenta propia que mantiene información personalizada del usuario en el servidor, (como puede ser dirección de e-mail y espacio correspondiente).
SGBD: Los sistemas de gestión de bases de datos: son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 7 de 17
SQL: El lenguaje de consulta estructurado es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar diversos tipos de operaciones en estas. Una de sus características es el manejo del álgebra y el cálculo relacional permitiendo efectuar consultas con el fin de recuperar -de una forma sencilla- información de interés de una base de datos, así como también hacer cambios sobre ella.
Escalabilidad: la escalabilidad es la propiedad deseable de un sistema, una red o un proceso, que indica su habilidad para extender el margen de operaciones sin perder calidad, o bien manejar el crecimiento continuo de trabajo de manera fluida, o bien para estar preparado para hacerse más grande sin perder calidad en los servicios ofrecidos.
Conexión: Punto donde se realiza un enlace entre dispositivos o sistemas. También conexión hace referencia al enlace completo. Una conexión puede ser alambrada o inalámbrica, digital o analógica, virtual o real, etc. Por ejemplo, el acceso a internet es un tipo de conexión
Persistencia: Se llama “persistencia” de los objetos a su capacidad para guardarse y recuperarse desde un medio de almacenamiento. La persistencia en Base de Datos relacionales se suele implementar mediante el desarrollo de funcionalidad específica
Accesibilidad: accesibilidad es la cualidad de aquello que resulta accesible. El adjetivo accesible, por su parte, refiere a lo que es de comprensión o entendimiento sencillo. El concepto de accesibilidad, por lo tanto, se utiliza para nombrar al grado o nivel en el que cualquier ser humano, más allá de su condición física o de sus facultades cognitivas, puede usar una cosa, disfrutar de un servicio o hacer uso de una infraestructura.
2. SINONIMOS
PALABRAS SINONIMOSTUPLA REGISTROATRIBUTO CARACTERISTICA, CUALIDAD,
PROPIEDADREGISTRO FILA, TUPLADATO
3. VENTAJAS E INCONVENIENTES DE SGBDVENTAJAS INCONVENIENTESProveen facilidades para la anipulación de grandes volúmenes de datos ver objetivos). Entre éstas: Simplificanla programación de equipos de consistencia - Manejando las políticas de respaldo adecuadas, garantizan que los cambios de la base serán siempre consistentes sin importar si hay errores
- Típicamente, es necesario disponer de una o más personas que administren la base de datos, de la misma forma en que suele ser necesario en instalaciones de cierto porte disponer de una o más personas que administren los sistemas operativos. Esto puede. llegar a
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 8 de 17
correctamente,etc. incrementar los costos de operación en una empresa. Sin embargo hay que balancear este aspecto con la calidad y confiabilidad del sistema que se btiene
4. SOFWARE SGBD GRATUITOS LICENCIADO
MySQLfor Windows 1.FileMaker (Versión de desarrollo)
PhpMyAdmin PostgreSQL SQLyog
ARQUITECTURA
La arquitectura a tres niveles del grupo ANSI, con su esquema conceptual, ha marcado una clara línea de investigación en el campo de las bases de datos. Aun cuando en trabajos y propuestas de normalización anteriores ya se había indicado la conveniencia de separar los tres niveles de estructuras, ninguno de estos estudios había tenido un impacto semejante al del esquema conceptual de ANSI. Consideramos, por tanto, de interés presentar dicha arquitectura.
Una de las primeras tareas del grupo de estudio consistió en buscar una terminología común e intentar desarrollar un vocabulario consistente y comprensible. Otro trabajo que se abordó desde las primeras etapas fue el análisis de los componentes
NIVELES DE ARQUITECTURA (Dato) La arquitectura se divide en tres niveles generales: interno,
conceptual y externo. Nivel Interno: es el más cercano al almacenamiento físico, es decir, el que
concierne a la manera como los datos se almacenan en realidad. Nivel Externo: es el más cercano a los usuarios, es decir, el que atañe a la
manera cómo cada usuario ve los datos. Nivel Conceptual: es un nivel de mediación entre los otros dos.
6. definicion
Bit : Se define un bit como la unidad de información más básica que se puede manejar en un ordenador pudiendo tomar uno de dos posibles estados: 1 ó 0. Dichos estados equivalen a activado o desactivado, abierto o cerrado, etc. dando lugar al sistema de numeración binario lo que facilita una mejor comprensión electrónica por parte de los transistores del
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 9 de 17
ordenador. Es la unidad mas pequeña de información que utiliza un ordenador.
byte Un byte es la unidad fundamental de datos en los ordenadores personales, un byte son ocho bits contiguos. El byte es también la unidad de medida básica para memoria, almacenando el equivalente a un carácter.
Los términos Kilo (en Kilobyte, abreviado como K) y mega (en Megabyte, abreviado como M) se utilizan para contar bytes (aunque son engañosos, puesto que derivan de una base decimal de 10 números).
Carácter : Un carácter es un tipo de dato así como existen los datos numéricos 1,2,3,4..etclos strings que son datos parecidos a los caracteres, pero se diferencian porque son un conjunto de ellos como por ejemplo "hola","h","o","1","2"...etc. y los caracteres que son todos los símbolos posibles con los que puede contar un sting.
un carácter es una unidad de información que corresponde aproximadamente con una unidad o símbolo parecido, como los de un alfabeto de la forma escrita de un lenguaje natural.
EJEMPLOS DE CARACTERES Letras minúsculas del alfabeto: { a, b, c, ..., x, y, z } Letras mayúsculas del alfabeto : { A, B, C, ..., X, Y, Z } Números (dígitos del Sistema Decimal): { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 } Caracteres especiales: { +, -, *, /, @, #, ñ, Ñ, á, é, ... Caracteres gráficos: { ♣, ♦, ♥, ♠, ... } Caracteres de control: { Salto de línea, Tabulador horizontal, ... }
LOS SISTEMAS DE CODIFICACIÓN DE ASCII
Binario Decimal Hex Abreviatura Repr AT Nombre/Significado
0000 0001 1 01 SOH ␁ ^AInicio de
Encabezado
0000 0010 2 02 STX ␂ ^B Inicio de Texto
0000 0011 3 03 ETX ␃ ^C Fin de Texto
0000 0100 4 04 EOT ␄ ^D Fin de Transmisión
0000 0101 5 05 ENQ ␅ ^E Consulta
0000 0110 6 06 ACK ␆ ^F Acuse de recibo
0000 0111 7 07 BEL ␇ ^G Timbre
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 10 de 17
0000 1000 8 08 BS ␈ ^H Retroceso
0000 1001 9 09 HT ␉ ^I Tabulación horizontal
Binario Dec Hex Representación
0010 0000 32 20 espacio ( )
0010 0001 33 21 !
0010 0010 34 22 "
0010 0011 35 23 #
0010 0100 36 24 $
0010 0101 37 25 %
0010 0110 38 26 &
0010 0111 39 27 '
0010 1000 40 28 (
0010 1001 41 29 )
ASCII (acrónimo inglés de American Standard Code for Information Interchange — Código Estándar Estadounidense para el Intercambio de Información), pronunciado generalmente [áski] o [ásci] , es un código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comité Estadounidense de Estándares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estándares Nacionales, o ANSI) como una refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía. Más tarde, en 1967, se incluyeron las minúsculas, y se redefinieron algunos códigos de control para formar el código conocido como US-ASCII.
El código ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisión. A menudo se llama incorrectamente ASCII a otros códigos de caracteres de 8 bits, como el estándar ISO-8859-1 que es una extensión que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al inglés, como el español.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 11 de 17
Los caracteres de control ASCII
El código ASCII reserva los primeros 32 códigos (numerados del 0 al 31 en decimal) para caracteres de control: códigos no pensados originalmente para representar información imprimible, sino para controlar dispositivos (como impresoras) que usaban ASCII. Por ejemplo, el carácter 10 representa la función "nueva línea" (line feed), que hace que una impresora avance el papel, y el carácter 27 representa la tecla "escape" que a menudo se encuentra en la esquina superior izquierda de los teclados comunes.
El código 127 (los siete bits a uno), otro carácter especial, equivale a "suprimir" ("delete"). Aunque esta función se asemeja a otros caracteres de control, los diseñadores de ASCII idearon este código para poder "borrar" una sección de papel perforado (un medio de almacenamiento popular hasta la década de 1980) mediante la perforación de todos los agujeros posibles de una posición de carácter concreta, reemplazando cualquier información previa. Dado que el código 0 era ignorado, fue posible dejar huecos (regiones de agujeros) y más tarde hacer correcciones.
Caracteres imprimibles ASCII
El código del carácter espacio, designa al espacio entre palabras, y se produce normalmente por la barra espaciadora de un teclado. Los códigos del 33 al 126 se conocen como caracteres imprimibles, y representan letras, dígitos, signos de puntuación y varios símbolos.
El ASCII de siete bits proporciona siete caracteres "nacionales" y, si la combinación concreta de hardware y software lo permite, puede utilizar combinaciones de teclas para simular otros caracteres internacionales: en estos casos un backspace puede preceder a un acento abierto o grave (en los estándares británico y estadounidense, pero sólo en estos estándares, se llama también "opening single quotation mark"), una tilde o una "marca de respiración".
Rasgos estructurales Los dígitos del 0 al 9 se representan con sus valores prefijados con el valor
0011 en binario (esto significa que la conversión BCD-ASCII es una simple cuestión de tomar cada unidad bcd y prefijarla con 0011).
Las cadenas de bits de las letras minúsculas y mayúsculas sólo difieren en un bit, simplificando de esta forma la conversión de uno a otro grupo.
Otros nombres para ASCII
La RFC 1345 (publicada en junio de 1992) y el registro IANA de códigos de caracteres, reconocen los siguientes nombres alternativos para ASCII para su uso en Internet.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 12 de 17
ANSI_X3.4-1968 (nombre canónico) ANSI_X3.4-1986 ASCII US-ASCII (nombre MIME recomendado) us ISO646-US ISO_646.irv:1991 iso-ir-6 IBM367 cp367 csASCII
Unicode
_ _ ____ ____ ___ ___
__ _ _ __| |_ ____ /_\ / ___| / ___|_ _|_ _|
/ _` | '__| __|/ __ \ //_\\ \___ \| | | | | |
| (_| | | | |_| ___/ / ___ \ ___) | |___ | | | |
\__,_|_| \__|\____) /_/ \_\____/ \____|___|___|
El Estándar Unicode es un estándar de codificación de caracteres diseñado para facilitar el tratamiento informático, transmisión y visualización de textos de múltiples lenguajes y disciplinas técnicas además de textos clásicos de lenguas muertas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.
Unicode especifica un nombre e identificador numérico único para cada caracter o símbolo, el code point o punto de código, además de otras informaciones necesarias para su uso correcto: direccionalidad, capitalización y otros atributos. Unicode trata los caracteres alfabéticos, ideográficos y símbolos de forma equivalente, lo que significa que se pueden mezclar en un mismo texto sin la introducción de marcas o caracteres de control.
Este estándar es mantenido por el Unicode Technical Committee (UTC), integrado en el Unicode Consortium, del que forman parte con distinto grado de implicación empresas como: Microsoft, Apple, Adobe, IBM, Oracle, SAP, Google o Yahoo, instituciones como la Universidad de Berkeley, y profesionales y académicos a título individual. El Unicode Consortium mantiene estrecha relación con ISO/IEC, con la que mantiene un acuerdo desde 1991 con el objetivo de mantener la sincronización entre sus estándares que contienen los mismos caracteres y puntos de código.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 13 de 17
Alcance del estándar
Unicode incluye todos los caracteres de uso común en la actualidad. La versión 5.1 contenía 100 713 caracteres provenientes de alfabetos, sistemas ideográficos y colecciones de símbolos (matemáticos, técnicos, músicales, iconos...). La cifra crece en cada versión.
Unicode incluye sistemas de escritura modernos como: Árabe, Braille, Copto, Cirílico, Griego, Han (Kanji, Hanja y Hanzi), Japonés (Kanji, Hiragana y Katakana), Hebreo y Latino. Escrituras históricas menos y extintas para propósitos académicos, como por ejemplo: Cuneiforme, Griego antiguo, Lineal B micénico, Fenicio y Rúnico. Entre los caracteres que no forman parte de alfabetos se encuentran símbolos musicales y matemáticos, fichas de juegos como el dominó, flechas, iconos, etc. Además Unicode dispone de versiones predefinidas de la mayoría de combinaciones de letras y símbolos diacríticos en uso en la actualidad y define mecanismos de combinación de caracteres como forma de extensión. Unicode es un estándar en constante evolucion y nuevas escrituras y símbolos son agregados contínuamente. Otros alfabetos propuestos han sido descartados por distintas razones como por ejemplo el alfabeto Klingon.
Relación con otros estándares
Como ya se ha indicado, Unicode está sincronizado con el estándar ISO/IEC, conocido como UCS o juego de caracteres universal. Desde un punto de vista técnico, incluye o es compatible con codificaciones anteriores como ASCII7 o ISO 8859-1, los estándares nacionales ANSI Z39.64, KS X 1001, JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, GB 18030, HKSCS, y CNS 11643, codificaciones particulares de fabricantes de software como Apple, Adobe, Microsoft, IBM, etc. Además, Unicode reserva espacio para uso privado por fabricantes de software.6
Tipos de caracteres
Caracteres gráficos: Letras, signos diacríticos, cifras, caracteres de puntuación, símbolos y espacios.
Caracteres de formato: Caracteres invisibles que afectan al proceso del texto próximo. Ejemplos: U+2028 salto de línea, U+2029 salto de párrafo, U+00A0 no break space, etc.
Códigos de control: 65 códigos definidos por compatibilidad con ISO/IEC 2022. Son los caracteres entre en los rangos [U+0000,U+001F], U+007F y [U+0080..U+009F]. Interpretarlos es responsabilidad de protocolos superiores.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 14 de 17
Caracteres privados: Reservados para el uso fuera del estándar por fabricantes de software.
Caracteres reservados: Códigos reservados para su uso por Unicode. Son posiciones no asignadas.
Puntos de código subrogados: Unicode reserva los puntos de código de U+D800 a U+DFFF para su uso como códigos subrogados en UTF-16, en la representación de caracteres suplementarios.
No-caracteres: Son códigos reservados permanentemente para uso interno por Unicode. Los dos últimos puntos de cada plano U+FFFE y U+FFFF.
Caracteres descartados: Son caracteres que se retienen por compatibilidad con versiones anteriores, pero se debe evitar su uso.
UTF-8
(8-bit Unicode Transformation Format) es un formato de codificación de caracteres Unicode e ISO 10646 utilizando símbolos de longitud variable. UTF-8 fue creado por Robert C. Pike y Kenneth L. Thompson. Está definido como estándar por la RFC 3629 de la Internet Engineering Task Force (IETF). Actualmente es una de las tres posibilidades de codificación reconocidas por Unicode y lenguajes web, o cuatro en ISO 10646.
Sus características principales son:
Es capaz de representar cualquier carácter Unicode. Usa símbolos de longitud variable (de 1 a 4 bytes por carácter Unicode). Incluye la especificación US-ASCII de 7 bits, por lo que cualquier mensaje
ASCII se representa sin cambios. Incluye sincronía. Es posible determinar el inicio de cada símbolo sin
reiniciar la lectura desde el principio de la comunicación. No superposición. Los conjuntos de valores que puede tomar cada byte de
un carácter multibyte, son disjuntos, por lo que no es posible confundirlos entre sí.
Estas características lo hacen atractivo en la codificación de correos electrónicos y páginas web. El IETF requiere que todos los protocolos de Internet indiquen qué codificación utilizan para los textos y que UTF-8 sea una de las codificaciones contempladas. El Internet Mail Consortium (IMC) recomienda que todos los programas de correo electrónico sean capaces de crear y mostrar mensajes codificados utilizando UTF-8.
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 15 de 17
8. lineas de tiempo
1980 1994 1997
1850 1865 1878 1960 1971 1980 1994 1997 1998 2003
2005
2005 2006 2009
Tarjeta perforada Cintas perforada
Cintas magnetica
disco duro interno
Disquete o disco flexibles
Cd o disco compacto
Disco duro externo
Unidad lomega zip
Compact flash
Dvd-1995
Multimedia card
Unidad lomega jaz
Memory stick
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 16 de 17
Superdisc
Memoria sd
Microdrive
Smartmedia
Mini cd
Disco blu-ray
Memoria usb
GENERACIÓN DE LAS BASES DE DATOS SISTEMATIZADAS.
1965 1969 1971
1950 1960 1964 1966 1970 1980 1990 2000
Orígen de las cintas magnéticas
Inicio de las cintas magnéticas, para suplir las necesidades de información de algunas industrias
Uso de los discos
El uso de los discos ayudo a consultar información directamente (ahorro de tiempo)
la Creación del GUAM
La primera empresa encargada del proyecto, NAA (North American Aviation), desarrolló unsoftware denominado GUAM (General Update Acces Method) basado en una estructura jerárquica.
Primera Base de Datos
Desarrolló IDS (Integrated Data Store), de General Electric
Information Management System (IMS)
Jerarquía conjunta de Base de datos y gestión de sistemas de información
Conferencia de Lenguajes en Sistemas de Datos (CODASYL)
Se estableció la primera especificación del modelo de base de datos de red
Conferencia de Lenguajes en Sistemas de Datos (CODASYL)
Fue la segunda publicación del modelo de bases de redes de Charles Bachman
Sistema de Gestión de la Calidad
REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA
INFORMACIÓN
GUIA INTRODUCCIÓN A LAS BASES DE DATOS
Fecha: julio de 2011Versión: 1Página 17 de 17
Modelos de las bases de redes
Las bases de datos relacionales con su sistema de tablas, filas y columnas, pudieron competir con las bases de datos jerárquicas y de red, ya que su nivel de programación era bajo y su uso muy sencillo.
Lenguaje SQL
Structured Query Language fué creado como ayuda para la toma de decisiones
World Wide Web
Lanzamiento del WWW
Sistemas de información Siglo XXI
En la actualidad existe gran cantidad de alternativas en línea que permiten hacer búsquedas orientadas a necesidades especificas de los usuarios, una de las tendencias más amplias son las bases de datos que cumplan con el protocolo Open Archives Initiative – Protocol for Metadata Harvesting (OAI-PMH) los cuales permiten el almacenamiento de gran cantidad de artículos que permiten una mayor visibilidad y acceso en el ámbito científico y general.