En todo el mundo, los datos, como factor de producción emergente, desempeñan un papel vital en las actividades económicas y comerciales globales, impulsando el vigoroso ascenso de la economía digital. Según previsiones prospectivas, para 2025, se espera que la contribución de los flujos mundiales de datos al crecimiento económico general alcance la asombrosa cifra de 11 billones de dólares.
En los últimos años, la atención del país a los elementos de datos ha ido aumentando. El 31 de diciembre de 2023, 17 departamentos, incluida la Administración Nacional de Datos, emitieron conjuntamente el Plan de acción trienal "Elementos de datos ×" (2024-2026). La construcción de una economía digital con los datos como elemento clave es un requisito inevitable para promover la alta calidad. -desarrollo de calidad.
Es previsible que en 2024 comience plenamente una nueva era de "datos×", liberando el efecto multiplicador de los datos y catalizando el desarrollo de una nueva productividad. El camino clave para lograr este objetivo es promover el proceso de capitalización de datos , utilizar elementos de datos para impulsar cambios comerciales y obtener valor de los datos.
Este artículo profundizará en la definición y la importancia de los elementos de datos y la capitalización de datos, y aclarará sus funciones clave en el contexto de big data. Al mismo tiempo, definiremos el camino para lograr la assetización de los datos y cómo lograr el valor de aplicación de los datos, a fin de potenciar el desarrollo innovador de las empresas en la nueva era y lograr actualizaciones comerciales y transiciones de valor.
Elementos de datos y capitalización de datos
¿Qué son los elementos de datos?
Según el "Libro blanco sobre elementos de datos (2022)", los elementos de datos se refieren a recursos de datos que participan en la producción social y las actividades comerciales y aportan beneficios económicos a los propietarios o usuarios. Por lo tanto, el término "elementos de datos" está orientado a la economía digital. La referencia a "datos" en el contexto de la discusión sobre productividad y relaciones de producción enfatiza el valor de los datos para promover la producción. sobre necesidades de producción específicas, los datos informáticos recopilados, clasificados y procesados y sus formas derivadas, conjuntos de datos originales, conjuntos de datos estandarizados , diversos productos de datos invertidos en producción y sistemas, información y conocimientos generados a partir de datos pueden incluirse en el documento. discusión de elementos de datos.
Las propiedades centrales de los elementos de datos incluyen unicidad, atomicidad y claridad de definición, que permiten que el sistema los identifique, procese y analice con precisión. Por ejemplo, nuestros números de teléfono móvil, direcciones de correo electrónico, registros de navegación web, etc., todos estos son elementos de datos que pueden recopilarse, almacenarse, analizarse y utilizarse para ayudarnos a tomar mejores decisiones y soluciones.
La necesidad de la capitalización de datos
En la economía digital, garantizar el uso eficiente y seguro de los datos es crucial. La implementación de la assetización de datos es la base para construir un sistema de garantía de seguridad y calidad de los datos. La capitalización de datos incluye reglas y estándares para la recopilación, el almacenamiento, el uso y el intercambio de datos. Además, la capitalización de datos también implica la protección de la privacidad de los datos y requisitos de cumplimiento para garantizar que el uso de los datos no infrinja los derechos personales ni viole las leyes y regulaciones.
Por lo tanto, se puede decir que la capitalización de datos es la base para realizar el " elemento de datos x ". Sólo mediante la gestión estandarizada de los activos de datos se pueden crear las condiciones para que los datos obtengan valor económico. A través de la capitalización de datos, se puede gestionar mejor la adquisición, el almacenamiento, el procesamiento, el intercambio y el uso de los activos de datos, y se puede mejorar la confiabilidad, precisión y seguridad de los datos.
¿Cómo realizar la capitalización de datos?
Con la ayuda de la " plataforma de gestión de activos de datos " de Kangaroo Cloud , a través de un enlace completo de recopilación de metadatos, gestión de metadatos y análisis de metadatos, se recopila y mantiene información de metadatos estandarizados y se abre la red de relaciones de datos para que las empresas puedan darse cuenta. la capitalización de datos. Estandarización y gestión estandarizada.
Además, las empresas pueden comprender los activos de datos generales a través del inventario de activos , combinado con la gestión de la seguridad de los datos y las funciones relacionadas con el control, para proporcionar una base de metadatos "completa, unificada y conectada" para la extracción de valor de los datos y liberar completamente el potencial de los elementos de datos. e impulsar la innovación y las actualizaciones empresariales.
Recopilación de metadatos
La recopilación de metadatos es la base para realizar la adquisición de datos. Para recopilar información de metadatos, primero debe realizar una investigación interna para clasificar los datos comerciales, los datos del almacén del lago o los datos de aplicaciones que la empresa necesita para realizar una gestión unificada de metadatos. Después de recopilar la información de conexión de la fuente de datos de varios tipos de datos, solicite permisos de metadatos de solo lectura a cada persona a cargo de recopilar metadatos.
Después de conectarse exitosamente a la fuente de datos, se pueden crear tareas de sincronización periódicas y tareas de sincronización temporales para fuentes de datos o bases de datos específicas a través de la " Plataforma de gestión de activos de datos " de Kangaroo Cloud. Si hay información de la tabla de la base de datos que no necesita ser recopilada ni mantenida, puede establecer condiciones de filtrado de la base de datos y condiciones de filtrado de la tabla de datos para evitar que bases de datos/tablas sin importancia se sincronicen con la plataforma de activos y admitir la configuración del contenido de sincronización temporal de los metadatos. y el ciclo de programación de tareas de sincronización.
Una vez completada la sincronización, la plataforma recopilará automáticamente la información de metadatos de las tablas de datos de cada tipo de fuente de datos, como la base de datos a la que pertenece, la hora de creación de la tabla de datos, la hora del último cambio de DDL, el almacenamiento. ubicación, tamaño de almacenamiento, formato de almacenamiento, número de filas de la tabla y tipo de tabla y otra información de atributos técnicos, y completar el trabajo de mantenimiento preliminar de la adquisición de datos.
Gestión de metadatos
Después de completar la recopilación de metadatos, se puede llevar a cabo una gestión estandarizada de los metadatos de acuerdo con las necesidades comerciales específicas para mejorar la calidad de la adquisición de datos. Primero, puede comunicarse con la persona a cargo de cada fuente de datos fuera de línea sobre la falta de metadatos, discutir las especificaciones de diseño del modelo de metadatos, enumerar los elementos de metadatos que deben mantenerse para cada tipo de fuente de datos e ingresarlos en la plataforma. .
En segundo lugar, se pueden utilizar métodos de mantenimiento de metadatos para asignar una persona responsable de cada pieza de metadatos para garantizar que el trabajo de mantenimiento de metadatos pueda asignarse a la persona responsable. La persona a cargo debe mantener completamente la información de metadatos faltantes de acuerdo con el acuerdo, y todo el personal de mantenimiento puede agregar etiquetas personalizadas a los activos de datos para facilitar la consulta rápida de la información de los activos de datos de acuerdo con la clasificación de etiquetas. Los administradores pueden contar periódicamente la integridad de los metadatos y realizar un seguimiento del progreso del mantenimiento de los metadatos. Pueden realizar estadísticas periódicas basadas en múltiples dimensiones, como fuentes de datos y personas responsables, descubrir problemas de manera oportuna e instar a las personas responsables a mejorar la información de los metadatos.
Al mismo tiempo, a través de las capacidades de gestión de estándares de datos proporcionadas por la plataforma , se puede estandarizar la información estándar a nivel de campo de los activos de datos. A través de la administración raíz y la administración estándar, se define la información estándar de los campos en la tabla de datos, como el nombre del campo, el nombre chino del campo, el tipo de campo, la longitud del campo y otra información.
Análisis de metadatos
Después de completar la recopilación de metadatos y la gestión de metadatos, se puede realizar un análisis basado en la información de metadatos. La plataforma proporciona análisis de integridad, análisis de calidad y análisis de linaje de metadatos , y analiza e integra de manera integral la información de activos dentro de la empresa para facilitar las empresas de manera efectiva. gestionar los activos de datos.
Análisis de integridad: porcentaje de integridad estadística, que respalda el análisis estadístico de múltiples dimensiones, incluido el nivel de plataforma, el nivel de tipo de fuente de datos , el nivel de fuente de datos, el nivel de base de datos, el nivel de persona a cargo y el nivel de atributo específico. Por ejemplo, al realizar análisis estadísticos según la dimensión del responsable, los resultados estadísticos se pueden utilizar plenamente para promover y supervisar a los desarrolladores de datos para mantener la información de metadatos de manera oportuna y completa.
Análisis de calidad: la plataforma proporciona capacidades de verificación de calidad y puede proporcionar una variedad de escenarios de monitoreo de calidad . Tiene funciones de verificación enriquecidas integradas para la verificación de una sola tabla y la comparación de varias tablas para satisfacer las necesidades de las empresas en cuanto a puntualidad, integridad y coherencia de los datos. y Requisitos para la verificación multidimensional de validez y precisión. A través del proceso de configuración de reglas previa al evento, verificación de reglas durante el evento y informe de análisis posterior al evento, se lleva a cabo una evaluación multidimensional de los datos para garantizar la calidad de los datos empresariales.
Análisis de parentesco consanguíneo: a través de la capacidad de análisis de parentesco consanguíneo , las empresas pueden descubrir rápidamente algunas tablas que definitivamente tienen parentesco consanguíneo, pero que faltan, como tablas en los niveles posteriores de los almacenes de datos, informes de BI, etc. Las empresas pueden configurar la información de la base de datos que necesita monitorear las relaciones consanguíneas. La plataforma utilizará los resultados del análisis SQL de relaciones consanguíneas y las estadísticas de tablas de relaciones consanguíneas aisladas en la base de datos para ayudar a las empresas a monitorear la calidad de los activos de datos y optimizar el espacio de almacenamiento de activos. .
Inventario y visualización de activos.
La plataforma proporciona una función de mapa de datos , que resume todos los datos de los activos empresariales, incluidas tablas de bases de datos, tareas de desarrollo, indicadores, etiquetas, API y otros tipos de activos de datos, proporcionando a los usuarios un portal de consulta de metadatos unificado, completo y conveniente . Admite una variedad de modos de búsqueda y condiciones de filtrado para localizar rápidamente metadatos. También puede descubrir continuamente metadatos faltantes en función de los resultados de la consulta y respaldar el mantenimiento de metadatos.
Al mismo tiempo, la plataforma también proporciona un panel de activos , a través del cual las empresas pueden analizar las tendencias cambiantes, la distribución, las clasificaciones de valor, las proporciones de almacenamiento y otra información de los activos generales para comprender completamente la situación general de los activos de datos. Proporcione a la administración acceso a la visualización de activos para ayudar a la administración a tomar decisiones sobre las direcciones de construcción.
Control de seguridad de datos
La gestión de activos de datos es inseparable del control de seguridad de los datos . La " plataforma de gestión de activos de datos " de Kangaroo Cloud admite la gestión de reglas de desensibilización de datos , la gestión de permisos de datos y la clasificación de datos. Para algunos datos confidenciales, como números de teléfono móvil, números de identificación y otra información privada, puede personalizar las reglas de desensibilización para visualización insensibilizada. La plataforma admite la configuración de permisos a nivel de fila y puede controlar el alcance de los permisos de usuario en función de la clasificación de datos y la vinculación con niveles de usuario para lograr un control detallado de los permisos de datos.
Resumir
La capitalización de datos puede mejorar significativamente la eficiencia de la gestión de datos de las empresas y explorar y aprovechar plenamente el valor de la aplicación de los datos. A través de este proceso, las empresas pueden clasificar, almacenar y recuperar datos sistemáticamente para lograr una recopilación unificada de datos en lugar de estar dispersos en varios sistemas y archivos.
Al mismo tiempo, el modelo de gestión unificado generado por la capitalización de datos desempeña un papel clave en el fortalecimiento de la seguridad de los datos. Las empresas pueden desensibilizar y cifrar los datos y controlar los niveles de confidencialidad para garantizar que solo el personal autorizado pueda acceder y modificar los datos, garantizando así la seguridad y privacidad de los datos en la mayor medida y permitiendo a las empresas utilizar plenamente los activos de datos bajo la premisa de cumplimiento. la Fundación.
Los datos son el punto de partida de todo. Las empresas deben conceder gran importancia a la promoción de la adquisición de datos, fortalecer las capacidades de gestión de datos y aprovechar al máximo los activos de datos para promover el desarrollo sostenible de las empresas.
Los usuarios que necesiten activos de datos pueden hacer clic en el siguiente enlace para probar la [Plataforma de activos de datos].
Plataforma de activos de datos: https://www.dtstack.com/dtinsight/dataassets?src=szsm
Dirección de descarga del "Libro técnico del sistema de indicadores industriales": https://www.dtstack.com/resources/1057?src=szsm
Dirección de descarga del "Informe técnico del producto Dutstack": https://www.dtstack.com/resources/1004?src=szsm
Dirección de descarga del "Libro técnico sobre prácticas de la industria de gobernanza de datos": https://www.dtstack.com/resources/1001?src=szsm
Para aquellos que quieran saber o consultar más sobre productos de big data, soluciones industriales y casos de clientes, visite el sitio web oficial de Kangaroo Cloud: https://www.dtstack.com/?src=szkyzg
Linus se encargó de evitar que los desarrolladores del kernel reemplazaran las pestañas con espacios. Su padre es uno de los pocos líderes que puede escribir código, su segundo hijo es el director del departamento de tecnología de código abierto y su hijo menor es un núcleo de código abierto. Colaborador Robin Li: El lenguaje natural se convertirá en un nuevo lenguaje de programación universal. El modelo de código abierto se quedará cada vez más atrás de Huawei: tomará 1 año migrar completamente 5,000 aplicaciones móviles de uso común a Hongmeng, que es el lenguaje más propenso. Vulnerabilidades de terceros. Se lanzó el editor de texto enriquecido Quill 2.0 con características, confiabilidad y experiencia de desarrolladores que Ma Huateng y Zhou Hongyi se dieron la mano para "eliminar los rencores". La fuente de Laoxiangji no es el código, las razones detrás de esto son muy conmovedoras. Google anunció una reestructuración a gran escala.