Datos de referencia y listas de códigos
Los datos de referencia son la columna vertebral poco vistosa que hace interoperables los conjuntos de datos. Esta guía cubre los datos de referencia y las listas de códigos y por qué importan para los datos externos.
Qué son los datos de referencia
Los datos de referencia son los códigos, clasificaciones e identificadores estándar —códigos de país, monedas, códigos de industria, unidades— que dan significado y consistencia a otros datos. Cambian despacio pero lo sustentan todo.
Por qué importa
Combinar conjuntos de datos requiere datos de referencia compartidos; las clasificaciones o identificadores desajustados rompen en silencio las uniones y las agregaciones. Unos buenos datos de referencia son lo que hace funcionar la integración.
El panorama de los datos
- Clasificaciones: industria (NACE), producto (CPV, HS), geografía (NUTS).
- Identificadores: país, moneda, entidad (LEI).
- Mapeos: correspondencias entre esquemas.
- Versiones: revisiones a lo largo del tiempo.
Mapeos y versiones
Distintas fuentes usan distintos esquemas, así que las correspondencias son esenciales, y las clasificaciones se revisan, por lo que el tratamiento de versiones importa para las series temporales.
Consideraciones de sourcing
Los organismos de normalización y las fuentes oficiales proporcionan datos de referencia autorizados, en gran parte abiertos. Mantenerlos actualizados y mapeados es el trabajo.
En un modelo gestionado
Un socio gestionado puede mantener los datos de referencia y los mapeos para que los conjuntos de datos adquiridos se alineen de forma consistente.
Correspondencias y versiones
Distintas fuentes usan distintos esquemas de clasificación, así que las correspondencias entre ellos son esenciales, y los esquemas se revisan, por lo que el tratamiento de versiones importa para las series temporales. Un desajuste entre, digamos, dos clasificaciones de industria rompe en silencio las uniones y las agregaciones. Mantener datos de referencia actualizados y mapeados es la columna vertebral silenciosa que permite alinear los conjuntos de datos adquiridos.
Autorizados y en gran parte abiertos
Los organismos de normalización y las fuentes oficiales —Eurostat (NACE, NUTS, CPV), códigos ISO, el Sistema Armonizado de la OMA, el LEI de GLEIF— proporcionan datos de referencia autorizados, en gran parte abiertos. El trabajo es mantenerlos actualizados y mapeados, para que sigan siendo un ancla fiable para la integración en lugar de una fuente de error silencioso.
- Los datos de referencia dan significado y consistencia a otros datos.
- Las clasificaciones desajustadas rompen en silencio las uniones.
- Las correspondencias entre esquemas y el tratamiento de versiones son esenciales.
- Los organismos de normalización proporcionan datos de referencia autorizados y a menudo abiertos.
Fuentes y lecturas adicionales
- Eurostat: clasificaciones NACE, NUTS y CPV.
- ISO: códigos de país, moneda y unidades.
- GLEIF: Identificador de Entidad Jurídica (LEI).
- OMA: códigos del Sistema Armonizado.
Mantenemos los datos de referencia y los mapeos para que los conjuntos de datos adquiridos se alineen de forma consistente. Obtenga un presupuesto sin compromiso.