인공지능의 10대 수학적 기본 문제

        이 글은 블로거가 인공지능 및 기타 분야를 공부할 때 개인 공부, 연구 또는 감상을 위해 기록한 학습 발췌 및 메모이며, 인공지능 및 기타 분야에 대한 블로거의 이해를 바탕으로 합니다. 부적절 및 침해가 있는 부분이 있을 경우 지적 후 즉시 시정하겠습니다.

기사는 연구 발췌 및 메모 열로 분류됩니다 .

        연구 발췌 및 노트 (1) --- " 인공 지능의 10가지 주요 수학적 기본 문제 "

인공지능의 10대 수학적 기본 문제

원문/논문 출처:

제목: " 수학 10 대- 인공지능의 기초문제 "

저자: 쉬종번 

시간: 접수 날짜 : 2021–07–04, 접수 날짜 : 2021–09–30, 온라인 게시 날짜: 2021–12–09

출처: 중국의 과학: 정보 과학

1. 빅데이터의 통계적 근거

        현재 인공지능의 주류 기술(예: 딥러닝)은 빅데이터 처리를 기반으로 하며 그 모델, 분석 및 계산 기반은 모두 통계에 뿌리를 두고 있습니다. 통계는 항상 사람들이 데이터를 분석하고 활용하도록 지배하고 안내하는 학문으로 여겨져 왔습니다. 모든 모델링은 표현의 확장성과 모든 접근 방식의 병목 현상인 통계적 추론의 용이성 또는 해석 가능성 사이에서 균형을 유지해야 합니다.


2. 빅 데이터 컴퓨팅의 기본 알고리즘

        빅데이터 분석 및 가공의 핵심은 빅데이터를 가공 하고 컴퓨팅을 통해 유용한 정보를 추출하는 것입니다 . 인공지능 적용의 주요 장애물 중 하나는 실제 빅데이터의 경우 알려진 핵심 알고리즘과 기본 알고리즘의 대부분이 실패(사용할 수 없거나 만족스러운 결과를 계산할 수 없음)하는 것입니다. 테라바이트를 초과하는 데이터의 직접 클러스터링.

        이러한 빅데이터 알고리즘이 부족한 근본적인 원인은 빅데이터 환경에서 전통적 컴퓨팅 이론과 전통적 컴퓨팅 이론에 기반한 알고리즘 설계 및 분석 방법론의 실패에 있다. National Academy of Sciences/National Research Council에서 발표한 보고서에서는 빅데이터 환경에서 다음과 같은 7가지 수학 문제를 해결하는 문제를 " 7개의 거대 문제" 라고 합니다 .

        • 기본 통계;

        • 일반화된 N-바디 문제;

        • 그래프 이론적 계산;

        • 선형 대수 계산;

        • 최적화;

        • 통합;

        • 정렬 문제.


3. 데이터 공간의 구조 및 특성

        우리가 살고 있는 세계는 인간 사회 , 물리적 공간 (둘을 총칭하여 현실 세계라고 함) 및 정보 공간 (가상 세계라고 함)으로 구성됩니다. 인간사회의 구성요소는 사람 , 물리적 공간의 구성요소는 원자/분자 , 정보공간의 구성요소는 데이터 이다 .

인공지능의 역할: 데이터 공간에서 데이터 공간의 방식을 이용하여 실세계를 인식하고 조작하는 기술이다.

        이러한 공통 데이터 공간에 대해 수학적 공간을 만들기 위해 어떤 종류의 수학적 구조가 제공될 수 있습니까?

        그렇다면 어떤 종류의 수학적 공간일까요?

        내적공간인가, 규준공간인가, 위상공간인가(여러 수학적 공간에서 제공하는 분석도구가 다르다는 점에 유의)

        데이터 분석에 가장 자연스럽고 합리적이며 가장 도움이 되는 수학적 구조는 어떤 것이어야 할까요 이미지 공간을 더 구체적으로 만들기 위해 예를 들어 스케일링, 컨볼루션, 변환 + 회전, 또는 작업을 수행하고 유클리드 거리, KL 발산, Wasserstein 거리 등과 같은 이미지 차이 측정을 선택하여 이미지 공간이 수학적 의미에서 공간이 되도록 합니까?

        그렇다면 어떤 선택과 배열이 구축된 공간을 이미지 분석에 더 유리하게 만들 수 있을까?


4. 딥러닝의 수학적 메커니즘 ; 

        현대 인공 지능의 주류 기술은 딥 러닝으로 대표 됩니다 . 딥 러닝의 대성공은 만연한 AI 기술로서의 지배적 위치를 크게 강화했지만 한편으로는 딥 러닝의 내재적 한계와 "포스트 딥 러닝 시대"에 대한 사람들의 생각을 불러일으키기도 했습니다. 

        딥 러닝의 고유한 장점은 복잡한 데이터에 대한 강력한 모델링 능력을 가지고 있다는 것입니다.훈련 데이터가 충분하면 학습 및 적용이 가능하여 범용 AI 솔루션을 제공합니다 . 

        그러나 치명적인 결점은 네트워크 구조가 설계하기 어렵고 결과를 해석할 수 없으며 속기 쉽다는 것입니다.


5. 비공식적 제약 하에서 최적의 운송 

        인공 지능의 많은 문제는 데이터 전송 또는 데이터 연결을 기반으로 합니다. 예를 들어 기계 번역은 음성과 텍스트, 두 가지 언어를 연결해야 하고 머신 비전은 이미지와 텍스트를 연결해야 합니다. "변수 보존"이라는 의미에서 최적의 전송을
        달성하는 방법 이 모든 것이 데이터 변환 및 연결의 기초이며 전이 학습의 가장 근본적인 문제이기도 합니다.


6. 학습 방법론을 배우는 방법 ; 

        학습 방법론은 학습자가 학습 과제를 학습하고 완료하는 방법을 안내하고 관리하는 일반적인 원칙이자 방법론입니다. 

자동화 및 자율성을 지향하는 인공 지능의 일반적인 추세에서 기계가 인간 학습 방법론을 배우거나 더 엄격하게 말하면 시뮬레이션 학습 방법론(SLM)을 배우도록 하는 것이 AI 개발         의 유일한 방법입니다 .

        기능 공간에서의 학습 이론은 아직 개발되지 않은 분야입니다.


7. 기계 학습의 기존 가정을 깨는 방법 ;

기계 학습의 적용 및 효과는 항상 다음과 같은 몇 가지 기본 선험적 가정을 전제로 합니다.

        (i) 대용량 가정: 우리는 항상 공간 F의 용량이 포함할 수 있을 만큼 충분히 크지해체 에프에 의존하지 않는다고에프

        (ii) 독립성 가정: 최적성 기준은 데이터 생성 메커니즘과 독립적으로 설정되며, 특히 손실 메트릭은나데이터 등과 독립적으로 미리 설정됩니다.

        이러한 모든 가정은 기계 학습 연구 의 일반적인 설정 입니다. 이는 머신러닝이 빠르게 발전할 수 있는 이유일 뿐만 아니라 머신러닝 발전의 걸림돌이라고도 할 수 있다. 기존 인공지능 기술의 응용 수준과 성능을 향상시키기 위해서는 이러한 머신러닝의 선험적 가정을 깨는 것이 필요하다.


8. 기계 학습 자동화 ; 

        이 새로운 물결은 "환경에 적응"하는 물결이어야 합니다. 폐쇄된 정적 환경, 고정된 작업, 열악한 견고성 및 열악한 해석성에만 적용되는 기존 딥 러닝의 단점을 극복하는 데 기반을 두고 있습니다. , 강력하고 설명 가능하며 적응력이 뛰어난 AI 기술입니다. 보다 현실적이고 반드시 달성해야 하는 중간 단계 목표는 기계 학습의 "6자기"를  자동화하는 목표를 달성하는 것입니다 .

        • 데이터/샘플 수준: 자체 생성 데이터, 자체 선택 데이터;

        • 모델/알고리즘 수준: 모델 자체 구성, 알고리즘 자체 설계;

        • 작업/환경 수준: 작업 자체 전환, 환경 자체 적응.


9. 지식 추론과 데이터 학습의 통합

        포스트 딥러닝 시대에는 지식 추론과 딥러닝 의 결합을 추구하여 딥러닝이 강력한 데이터 학습 능력을 유지하면서 더 명확한 해석력과 더 강력한 일반화를 가질 수 있도록 해야 합니다. 데이터와 지식을 연결하기 위해 데이터 공간시맨틱 공간 사이의 중간 공간을 설정하는 것이 좋은 선택이 될 것입니다.

        이론적으로 데이터-지식 하이브리드 시스템을 분석하는 것도 어려운 문제입니다.


10. 지능형 최적화 및 인공 지능 칩 문제 .

        수학적 최적화 이론 및 방법은 최적화를 위한 이론적 근거를 제공하지만 수학적 방법은 일반적으로 목적 함수가 분석적 형식을 가지며 볼록한 구조를 가지며 알려진 하이퍼파라미터를 가지고 있다고 가정합니다. 최적화 문제를 해결하는 것은 딥 러닝의 전문 분야가 아닙니다. 따라서 최적화를 위한 인공 지능 프로세스를 설계하는 방법은 아직 해결되지 않았습니다.

        인공 지능 칩은 AI 알고리즘의 실행을 가속화하는 강력한 도구입니다.그 기능은 AI 알고리즘에서 특정하고 재사용 가능한 계산/연산을 하드웨어화하는 것 입니다 물리적인 방식 으로 작동합니다 . 일부 고급 최적화 알고리즘(예: ADMM) 칩을 기반으로 인공 지능 알고리즘을 가속화하는 것은 탐색할 가치가 있는 방향입니다.


11. 기타:

 인공 지능 기술 및 개발은 주로 "계산 예제, 알고리즘 및 컴퓨팅 성능"에 의해 구동되며 그 기반은 데이터이고 핵심은 알고리즘입니다.

 수학은 도구일 뿐만 아니라 기술적 함의 그 자체이기도 하며, 본질과 독창적인 혁신을 가장 잘 구현하는 부분인 경우가 많습니다.

AI 알고리즘은 기본적으로 다음과 같습니다.

        빅 데이터 분석 및 처리 알고리즘은 주로 빅 데이터 분석 및 처리 기술의 하위 계층이 의존하는 관련 수학적 모델, 분석 원칙 및 계산 방법을 해결합니다.

AI 역할:

        데이터 공간에는 데이터 공간의 방식을 이용하여 실세계를 인식하고 조작하는 기술이 있다.

구조의 특성

        데이터의 수학적 표현을 추구

        오브제 컬렉션에 일정한 수학적 구조(연산+위상)가 부여되면 수학적 의미의 공간이 될 수 있다.

딥 러닝의 고유한 이점은 다음과 같습니다.

        복잡한 데이터에 대한 강력한 모델링 능력을 가지고 있으며 훈련 데이터가 충분하면 학습 및 적용이 가능하여 범용 AI 솔루션을 제공합니다. 

치명적인 결함 은 네트워크 구조가 설계하기 어렵고 결과를 해석할 수 없으며 속기 쉽다는 것입니다.

네트워크 토폴로지(Network Topology) 구조

        다양한 장치를 전송 매체와 상호 연결하는 물리적 배치를 말합니다 . 네트워크 구성원 간의 특정 물리적(실제) 또는 논리적(가상) 배열을 나타냅니다. 두 개의 네트워크가 동일한 연결 구조를 가지고 있다면 각각의 내부 물리적 배선 및 노드 간 거리가 다를 수 있지만 네트워크 토폴로지는 동일하다고 합니다.

        실생활에서 컴퓨터와 네트워크 장치 간의 상호 연결을 위해서는 일정한 조직 구조를 사용하여 연결해야 하며 이러한 조직 구조를 "토폴로지 구조"라고 합니다.

        네트워크 토폴로지는 네트워크의 배치와 구성, 노드 간의 관계를 생생하게 설명하며, 쉽게 설명하면 이러한 컴퓨터와 통신 장치가 서로 연결되는 방식을 "토폴로지"라고 합니다.

유클리드 공간

        특별한 종류의 벡터 공간을 말하며 길이와 각도와 같은 기하학적 속성은 일반적인 3차원 공간 V3에서 벡터에 대해 논의될 수 있습니다.

     기사가 부적절하고 잘못된 경우 이해하고 지적하십시오. 일부 글과 사진은 인터넷에서 가져왔기 때문에 실제 출처를 확인할 수 없으며, 이의가 있는 경우 블로거에게 연락하여 삭제하시기 바랍니다. 오류, 질문 또는 위반 사항이 있는 경우 작성자에게 연락할 수 있는 의견을 남기거나 VX 공개 계정: Rain21321을 팔로우하고 작성자에게 문의하십시오.

추천

출처blog.csdn.net/qq_51399582/article/details/131388356