DATOS - w3c.br · Integración+de+Datos++ Bernade1e+Lóscio/CInUFPE + 12 cod título cod_autor L01...

31
Integración de Datos Bernade1e Lóscio/CInUFPE DATOS desde todos los lados 1

Transcript of DATOS - w3c.br · Integración+de+Datos++ Bernade1e+Lóscio/CInUFPE + 12 cod título cod_autor L01...

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

DATOS  desde  todos  los  lados  

1  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Datos  – Datos  registrados,  que  >enen  un  significado  implícito,  sobre  fenómenos  del  mundo  real  

– Por  lo  general  representan  valores  (números,  caracteres)  variables  (cualita>va  o  cuan>ta>va)  

– Se  u>liza  para  transmi>r,  almacenar  y  deducir  información  

2  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  metaDados  – Facilitan  la  comprensión  de  las  relaciones  y  la  u>lidad  de  la  información  de  datos  

3  

Central  do  Brasil  Walter  Sales  Fernanda  Montenegro  

Qtulo  

director  

actriz  principal  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

dato  

4  

información  

conocimiento  Información  adicional  

extraída  de  los  datos  o  de  expertos  del  dominio  de  

aplicación  

Significado  asociado  o  deducido  de  un  conjunto  de  datos  y  asociaciones  entre  elles  

Valor  sin  un  significado  explícito  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

5  

dato  

información  

conocimiento  AB

STRA

CCIÓN  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

6  

8.848  

Monte  Everest  es  la  montaña  más  alta  de  la  superficie  de  la  Tierra  y  mide  8.848m  

A  altura  do  monte  Everest  é  8.848m  

La  altura  del  monte  Everest  es  8.848m  

dato  

información  

conocimiento  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

Procesar  los  datos  para  generar  información  

 

7  

Es interés común de las organizaciones públicas y privadas

Proceso  de  información  para  generar  conocimiento  

 

dato  

información  

conocimiento  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

8  

¿Cuáles  son  las  fuentes  de  datos?  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Datos  – Los  datos  pueden  ser  almacenados  en    

•  Fuentes  de  datos  privadas  -­‐  disponibles  en  las  organizaciones  

•  Fuentes  de  datos  públicas  -­‐  disponibles  en  la  Web  

9  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Datos  – Pueden  tener  formatos  diferentes  

•  Datos  estructurados  (por  ejemplo,  bases  de  datos  relacionales)  

•  Datos  semi-­‐estructurados  (por  ejemplo,  documentos  XML)  

•  Datos  no  estructurados  (por  ejemplo,  documentos  de  texto)  

10  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Datos  estructurados  – Los  datos  de  los  sistemas  transaccionales  – Los  datos  almacenados  en  bases  de  datos  relacionales  

– Tienen  una  estructura  fija  y  bien  definida  (esquema  de  base  de  datos)  

•  Esquema  predefinido    •  Todos  los  datos  de  acuerdo  con  el  esquema  

11  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

12  

cod título cod_autor Mar Muerto L01 autor_1

ano

L02

L03

L04 L05

El Camino hacia el Mar

1936 género_1 cod_género

autor_1 1938 género_2 El mundo de la Paz autor_1 género_3 1951

autor_2 1930 género_1 Tieta de Agreste autor_1 1977 género_1

El Quince

Tabla relacional - Libros

Tabla  de  Géneros  Tabla  de  

Autores  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  Dados  

•  Datos  semi-­‐estructurados  – Ausencia  de  una  estructura  regular,  o  la  estructura  puede  evolucionar  impredecible  

– Los  datos  pueden  estar  incompletos  – Estructura  irregular  (datos  heterogéneos)  – Los  >pos  son  sólo  indica>vos  – La  estructura  puede  ser  implícita  – Los  datos  en  la  Web  

13  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

14  

<?xml  version="1.0"  encoding="ug-­‐8"?>    <livraria>        <livro  id="L01"  ano="1936">  

 <autor>  Jorge  Amado  </autor>    <>tulo>Mar  Morto</>tulo>  

     </livro>        <livro  id="L04"  ano="1930">  

 <autor>            <nome>Rachel</nome  >            <sobrenome>de  Queiroz</sobrenome  >    </autor>    <>tulo>O  Quinze</>tulo>      

                             <genero>  Romance  </genero>        </livro>  </livraria>  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

15  

•  Datos  no-­‐estructurados  –  Falta  de  estructura  –  Los  datos  que  no  han  sido  "tratado"  o  modelo  –  Los  datos  almacenados  en  archivos  o  documentos  

   

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

16  

Islas  de    …   …

…  

estructurados   semi-­‐estructurados  

no-­‐estructurados  

datos  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Integración  dos  Datos  – Presentación  de  una  visión  uniforme  y  coherente  de  los  datos    

–  Iden>ficación  de  los  datos  complementarios  y  redundantes  

– Resolución  de  inconsistencias  

17  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

¿Cómo  integrar?  ¿Cómo  ofrecer  una  visión  global  de  datos  distribuidos  a  

través  de  fuentes  de  datos  heterogéneas  y  autónomas?  

resumen de los datos

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

19  

Tipos  de  heterogeneidad  

Estructural  

SintácGco  

SemánGca  

Modelos  diferentes  Diferentes  

estructuras  

Significados  diferentes  

Terminología  Nombres  diferentes  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

esquema de integración

esquema local

esquema local

esquema local

vision integrada

mapeamentos

mismo modelo de datos

                   

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Arquitecturas  de  Integración  – Mediadores  – Datawarehouse  – P2P  – Enfoque  pay-­‐as-­‐you-­‐go  

21  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

traductor

aplicación

traductor traductor

mediador

consultas

sub-consultas

datos

Arquitectura  mediadores  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

aplicación

Data warehouse

consultas

atualizaciones datos

Arquitetura  de  data  warehouse  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

Arquitectura  P2P  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

traductor traductor traductor

mediador

traductor traductor traductor

mediador

traductor traductor traductor

mediador

aplicación

foco  pay-­‐as-­‐you-­‐go  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Arquitecturas  de  integración  – La  elección  de  la  arquitectura  depende  de  algunos  factores:  

•  La  can>dad  de  fuentes  de  datos  para  ser  integrado  •  La  frecuencia  de  actualización  fuentes  •  La  infraestructura  de  comunicación  •  …s  

26  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Arquitecturas  de  integración  – La  elección  de  la  arquitectura  responde  a  algunas  preguntas:  

•  ¿La  integración  de  datos  se  materializará  o  virtual?  •  ¿Se  u>liza  un  esquema  de  integración  único  o  múl>ples  esquemas?  

•  ¿Puede  definir  asignaciones  entre  las  fuentes  de  datos  o  simplemente  entre  las  fuentes  y  el  esquema  de  integración?  

27  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

Proporcionar  interoperabilidad  entre  las  fuentes  de  datos  

28  

DesaPo  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

•  Interoperabilidad  – Una  solución  de  integración  de  datos  debe  proporcionar:  

•  Interoperabilidad  sintác>ca:  la  adopción  de  un  modelo  de  datos  común  

•  Interoperabilidad  estructural:  las  asignaciones  definen  •  Interoperabilidad  semán>ca:  el  uso  de  vocabularios    

29  

La  interoperabilidad  es  la  capacidad  de  un  sistema  (o  no)  para  comunicar  de  forma  homogénea  (o  tan  cerca  de  ella)  con  otro  sistema  (similar  o  no)  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

30  

Web  SemánGca  y     Linked  Data    

 –  Proporcionan  soluciones  y  tecnologías  apropiadas  para  resolver  el  problema  de  la  integración  de  datos  

–  Modelo  de  datos  flexible  para  la  representación  de  datos  en  la  Web  

–  Ontologías  ayudar  a  resolver  el  problema  de  la  heterogeneidad  semánGca  

Integración  de  Datos    Bernade1e  Lóscio/CIn-­‐UFPE  

31  

Conclusiones