GQL, el nuevo estándar ISO para consultar bases de datos de gráficos

La Organización Internacional de Normalización (ISO) ha publicado un estándar internacional para consultar gráficos llamado Graph Query Language (ISO/IEC 39075:2024).

Traducido de GQL: un nuevo estándar ISO para consultar bases de datos de gráficos , autor Joab Jackson.

Las bases de datos de gráficos son ahora oficialmente una entidad de primera clase en informática.

La Organización Internacional de Normalización (ISO) ha publicado un estándar internacional para consultar gráficos, llamado Graph Query Language (ISO/IEC 39075:2024).

Este es el primer lenguaje de consulta de bases de datos publicado por ISO desde la aprobación de SQL en 1987 . Los organismos de normalización pasaron más de cinco años clasificando los detalles.

Philip Rathle , director de tecnología de Neo4j , dijo en una entrevista con TNS: "No hay nada como un estándar formal internacional. Proviene de la misma organización que SQL y es hermano de SQL. Puede promover el valor general de GQL. "

Tony Holland , jefe de comunicaciones del Comité Técnico Conjunto 1/AG 1 de ISO/IEC, dijo en un comunicado: "Este lanzamiento marca un nuevo capítulo en la historia de los lenguajes de consulta, revolucionando la forma en que interactuamos y aprovechamos el poder de los datos interconectados. "GQL representa un importante paso adelante en la consulta y manipulación de datos, proporcionando un lenguaje unificado y expresivo para navegar por estructuras gráficas complejas".

Además de la experiencia de Neo4J, en el proyecto también participan ingenieros de HypergraphDB , Redis Labs , TigerGraph , Oracle y la Universidad de Bonn en Alemania .

Visualización de bases de datos de gráficos (proporcionada por Neo4J)

Ventajas de la estandarización

La aprobación del lenguaje por parte de un organismo de estándares global, tal como lo hizo con el propio SQL, garantiza su estabilidad y alienta a los usuarios y proveedores de herramientas a seguir invirtiendo en la tecnología.

La base de la computación gráfica es el gráfico de atributos , que describe mejor datos que cambian dinámicamente.

Las bases de datos de gráficos se han utilizado ampliamente durante décadas , y sólo recientemente esta forma ha generado un interés renovado en convertirse en un componente clave de modelos de lenguaje a gran escala para aplicaciones de IA generativa . Los modelos gráficos pueden visualizar sistemas complejos e interconectados.

Rathle explica que la desventaja de los LLM es que son una especie de caja negra. "No hay manera de entender el razonamiento detrás del modelo de lenguaje. Simplemente sigue la red neuronal y hace lo suyo", dijo. El gráfico de conocimiento puede servir como una memoria externa, una forma de visualizar cómo el LLM construye su visión del mundo.

"Así que puedo rastrear el gráfico y entender por qué surgió esa respuesta", dijo Rathle.

Las bases de datos gráficas también son ampliamente utilizadas por las empresas de atención médica para el descubrimiento de fármacos, y por los fabricantes de aviones y otros fabricantes como una forma de visualizar diseños de sistemas complejos, dijo Rathle. "Tienes todas estas dependencias en cascada, y ese cálculo funciona muy bien en el gráfico", dijo Rathle.

El estándar GQL tiene más de 600 páginas y cita más de 400 artículos.

Los componentes incluyen:

  • Solo tipos de datos gráficos (vértices, aristas, caminos)
  • Tipo de datos escalares
  • Operaciones, funciones y predicados de tipos escalares.
  • modelo de transacción
  • modelo de seguridad
  • coincidencia de patrones gráficos
  • Tipo de gráfico, utilizado para restringir el contenido del gráfico.

GQL se basa en Cypher (y su variante de código abierto OpenCypher ), el lenguaje de consulta para Neo4j , uno de los sistemas de bases de datos de gráficos más populares .

La sintaxis principal de GQL es básicamente la misma que la de Cypher, y la declaración MATCH...RETURN funciona de la misma manera. Preguntar:

MATCH (movie:Movie)
RETURN movie.title

Devolverá todos los nodos de la base de datos que tengan la etiqueta "Película" .

Table 2. Result
movie.title
"Wall Street"
 
"The American President"
 
Rows: 2

GQL también utiliza las mismas expresiones básicas, combinaciones lineales y otros aspectos de Cypher.

Por ejemplo, esta consulta de ejemplo de Neo4J muestra las siguientes paradas de un servicio de transporte que para en Denmark Hill a las 22:37:

MATCH (n:Station {name: 'Denmark Hill'})<-[:CALLS_AT]-
(s:Stop WHERE s.departs = time('22:37'))-[:NEXT]->
(:Stop)-[:CALLS_AT]->(d:Station)
RETURN d.name AS nextCallingPoint

El resultado es…

Table 4. Result
nextCallingPoint
"Clapham High Street"

Sin embargo, existen algunas diferencias básicas entre Cypher y GQL .

GQL usará palabras clave INSERTpara agregar nodos o relaciones al gráfico, mientras que Cypher usa CREATE. FORLa declaración reemplaza la de Cypher UNWIND.

Otros lenguajes de consulta de gráficos incluyen NQL de NebulaGraph , Gremlin de Apache Tinkerpop , SPARQL de RDF y AQL de ArangoDB . También existe el lenguaje GraphQL , un lenguaje de consulta orientado a gráficos para crear API.

La ruta de actualización desde los lenguajes de consulta de gráficos existentes debería ser bastante fácil, al menos si estas implementaciones se basan en Cypher. Según Rathlee, existen al menos una docena de sistemas de bases de datos de gráficos diferentes construidos en OpenCypher, incluido el popular Neptune de Amazon Web Services .

Este artículo se publicó por primera vez en Yunyunzhongsheng ( https://yylives.cc/ ), todos son bienvenidos a visitarlo.

El equipo de la Fundación Google Python fue despedido. Google confirmó los despidos y los equipos involucrados en Flutter, Dart y Python se apresuraron a la lista caliente de GitHub: ¿Cómo pueden ser tan lindos los lenguajes y marcos de programación de código abierto? Xshell 8 abre la prueba beta: admite el protocolo RDP y puede conectarse de forma remota a Windows 10/11 Cuando los pasajeros se conectan al WiFi del tren de alta velocidad , la "maldición de 35 años" de los codificadores chinos aparece cuando se conectan a la alta velocidad. Rail WiFi, la primera herramienta de búsqueda de IA con soporte a largo plazo de la versión 8.4 GA. Perplexica: completamente de código abierto y gratuito, una alternativa de código abierto a Perplexity. Los ejecutivos de Huawei evalúan el valor del código abierto. Hongmeng: todavía tiene su propio sistema operativo a pesar de la continua supresión. por países extranjeros, la empresa alemana de software para automóviles Elektrobit abrió una solución de sistema operativo para automóviles basada en Ubuntu.
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/6919515/blog/11066674
Recomendado
Clasificación