Autor: Yu Fan
fondo
La ecuación de Schrödinger es una ecuación básica de la mecánica cuántica. Al resolver esta ecuación, se pueden resolver la mayoría de los problemas físicos y químicos. Pero el problema es que el número de funciones básicas en la ecuación de Schrödinger aumenta exponencialmente a medida que aumenta la dimensión del sistema molecular. Por ejemplo, una molécula de metano tiene 5 átomos, su dimensión es 9=3*5 – 6 y el número de. Las funciones básicas son 10 elevado a la novena potencia.
Dado que la ecuación de Schrödinger no se puede resolver exactamente, las propiedades químicas de las moléculas se pueden predecir con soluciones aproximadas de alta precisión. Los métodos de interacción de configuración y clúster acoplado tienen mayor precisión, pero el costo computacional aumenta exponencialmente, aunque el método de la teoría funcional de la densidad (DFT) tiene un costo computacional relativamente bajo, su precisión es limitada. Debido a su poderosa capacidad de ajuste no lineal del aprendizaje profundo, DeepMind propuso FermiNet para lograr una solución aproximada de la función de onda.
Los electrones de las moléculas no solo interactúan con el núcleo atómico y otros electrones, sino que también deben seguir el principio de exclusión de Pauli: dos fermiones no pueden estar en el mismo estado cuántico y la función de onda después del intercambio de fermiones tiene antisimetría, es decir, cuando dos fermiones se intercambian. estados, la función de onda debe tener el signo opuesto. Con respecto a la antisimetría de la función de onda, el determinante es naturalmente consistente. Por lo tanto, el uso del determinante de Slater para representar la función de onda se usa ampliamente en química cuántica.
**1. ** Arquitectura de red
Figura 1 Arquitectura general de la red FermiNet
Figura 2 Transferencia de flujo de información entre capas de red
La arquitectura de red general de FermiNet se muestra en la Figura 1 y la Figura 2 es una vista parcialmente ampliada de la capa de red. Cada electrón en la red no solo tiene un flujo de información separado, sino que cuando la información se transmite en la capa de la red, cada electrón integrará la información de otros electrones y la interacción entre electrones, y reemplazará la órbita original del electrón único por una que satisfaga la sustitución. equivarianza. La función de onda multielectrónica (Ecuación 1) constituye la función de onda final (Ecuación 2), que tiene una capacidad de expresión más fuerte que el determinante de Slater tradicional.
Antes de que la red comience a entrenarse, se realiza un entrenamiento previo para mejorar la estabilidad del proceso de entrenamiento y reducir el tiempo de entrenamiento. La pérdida previamente entrenada utiliza la solución de la ecuación de Hartree-Fock del conjunto de bases STO-3G como referencia, y la función de pérdida se muestra en la Ecuación 3.
Para el entrenamiento de la red, se basa en Monte Carlo variacional, con el valor esperado de energía como función de pérdida, como se muestra en la Fórmula 4. Específicamente, la energía se puede expresar mediante la Ecuación 5 y el gradiente de energía se calcula como se muestra en la Ecuación 6. Además, para optimizar eficientemente los parámetros de la red, se utiliza el optimizador de segundo orden KFAC que se aproxima al método del gradiente natural.
**2, ** Resultados experimentales
La precisión de FermiNet supera al método VMC tradicional (como se muestra en la Tabla 1), y la precisión es mejor que la del método CCSD(T) bajo conjuntos de bases limitados, porque FermiNet no utiliza conjuntos de bases y no hay problema de extrapolación de conjuntos de bases. .
Tabla 1 Valores de energía del estado fundamental (la parte en negrita es el elemento más cercano al valor exacto en FermiNet, VMC y DMC)
Aunque CCSD(T) es muy preciso para geometrías de equilibrio, tiene limitaciones para moléculas que se encuentran en estados poco excitados, estiradas, retorcidas o con geometrías fuera de equilibrio, y no es tan bueno como FermiNet. Los resultados se muestran en la Figura 3. .
Figura 3 Curva de energía de la molécula H4
Para la disociación del triple enlace nitrógeno-nitrógeno de moléculas de nitrógeno, FermiNet es mejor que el método CCSD(T) sin restricciones, como se muestra en la Figura 4.
Figura 4 Curva de energía de la disociación del triple enlace nitrógeno-nitrógeno
**3, ** Resumen
FermiNet fusiona información entre electrones individuales y múltiples electrones en la capa de red, y reemplaza las órbitas de un solo electrón con funciones de onda de múltiples electrones que satisfacen la equivarianza de sustitución. Puede lograr soluciones de funciones de onda de mayor precisión, que no solo superan en precisión a las tradicionales. es mejor que el método CCSD (T) para desafiar estructuras de sistemas, como estructuras geométricas en desequilibrio y disociación de triples enlaces nitrógeno-nitrógeno. Los logros de FermiNet alentarán a los investigadores a proponer arquitecturas de red nuevas o mejores en el campo de la química cuántica, logrando así soluciones de función de onda más eficientes y precisas.
referencias
[1] Pfau D, Spencer JS, Matthews AGDG, et al. Solución ab initio de la ecuación de Schrödinger de muchos electrones con redes neuronales profundas[J]. Investigación de revisión física, 2020, 2(3): 033429.
DOI: https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429
Un programador nacido en los años 90 desarrolló un software de portabilidad de vídeo y ganó más de 7 millones en menos de un año. ¡El final fue muy duro! Google confirmó despidos, relacionados con la "maldición de 35 años" de los codificadores chinos en los equipos Python Flutter Arc Browser para Windows 1.0 en 3 meses oficialmente GA La participación de mercado de Windows 10 alcanza el 70%, Windows 11 GitHub continúa disminuyendo. GitHub lanza la herramienta de desarrollo nativo de IA GitHub Copilot Workspace JAVA. es la única consulta de tipo fuerte que puede manejar OLTP + OLAP. Este es el mejor ORM. Nos encontramos demasiado tarde.