완전한 머신 러닝 환경을 처음부터 빠르게 구축하고 도커 이미지를 사용하여 재사용이 가능하고 빠르게 사용되는 기본 머신 러닝 환경을 구축하여 머신 러닝 분야의 다양한 경쟁 기준이나 논문을 신속하게 재현 할 수 있습니다. [상세 솔루션]

목차

문제

솔루션

요약하자면


문제

기계 학습 프로그램 환경을 실행하는 데는 종종 다음과 같은 측면이 포함됩니다.

  1. 하드웨어 , 인텔 x86, amd, arm 및 기타 칩
  2. 운영 체제 , windows, ubuntu, centos, mac 등은 64 비트, 32 비트 등을 고려합니다.
  3. NVIDIA GPU 그래픽 카드, 1070ti, 1080ti 등의 사용과 같은 그래픽 카드 드라이버 . 그래픽 카드에는 드라이버, cuda, cudnn 등 설치 문제가 포함됩니다.
  4. 개발 언어 : 현재 주류 머신 러닝 실험 개발 언어는 python이며, 여기에는 python 버전 관리 문제, 다양한 종속성 패키지 관리 및 격리 문제가 포함됩니다.
  5. 주류 머신 러닝 프레임 워크 는 tensorflow, pytorch, keras (tensorflow2.0이 라이브러리에 직접 포함됨), nni 등과 같은 이전 네 가지 질문에 대해 서로 다른 종속성을 갖습니다. 예를 들어 잘 수행 된 경우 pytoch는 각 상황을 나열합니다. 방법

, 그러나 예를 들어 tensorflow는 tensorflow의 각 버전이 컴파일에 의존하는 os 및 cuda 버전의 버전을 사용자에게 알려주지 않으므로 오랜 시간 동안 사용자 설치 환경에 문제가 발생하는 경우가 많습니다.

솔루션

위의 문제에 대한 응답 :

  1. 우리는 일반적으로 인텔 x86 칩을 사용합니다. 운영 체제는 일반적으로 x86 64 비트 Linux 운영 체제를 사용합니다. 예전에는 ubuntu14.04 였지만 이제는 ubuntu18.04 x64가 점차 인기를 얻고 있습니다. 예를 들어 nvidia 회사 "nvidia / cuda : 10.0-base"의 공식 도커 이미지 "는 기본적으로 ubuntu18.04입니다.
  2. 대부분의 기계 학습 프레임 워크는 이미 ubuntu18.04 linxu 운영 체제 버전에서 실행을 지원합니다.
  3. 호스트 머신은 드라이버와 함께 설치되어야합니다. 예를 들어 호스트 머신은 다음과 같습니다 : 최신 버전의 Nvidia 그래픽 드라이버 "NVIDIA-Linux-x86_64-460.39.run"설치. 특정 드라이버는 Nvidia의 공식 웹 사이트에서 선택하고 필터링 할 수 있습니다. . 여기에 1070ti 그래픽 카드가 있습니다. Linux 프로덕션 안정 버전 환경, " https://www.nvidia.cn/Download/index.aspx?lang=cn "중 선택 : 다운로드 및 국내 인터넷 속도가 느린 이유 속도, 나는 Baidu 클라우드 디스크에 복사본을 넣었습니다. "링크 : https://pan.baidu.com/s/1b_FTjx4UsDhyWfNTfCjw3w 
    추출 코드 : 6666", Windows 환경 인 경우 최신 Nvidia 드라이버를 설치하고 docker의 미러 이미지 : "nvidia / cuda : 10.0-base", Cuda10.0 cudnn이 기본적으로 설치됨
  4. "nvidia / cuda : 10.0-base"이미지를 기반으로 컨테이너에 Miniconda3-py39_4.9.2-Linux-x86_64.sh 버전의 miniconda를 설치합니다.이 최신 버전을 설치하면 가장 작은 크기로 기본적인 Python 다양성을 얻을 수 있다는 장점이 있습니다. 설치 공간 버전 및 종속 라이브러리, 예 : "conda create --name yolov5_py3.8 python = 3.8", 자동 구성 환경 변수를 설치 한 후 재사용 가능한 docker로 패키징 할 수 있습니다. 다음은 작성자가 만든 docker입니다. : registry.cn-hangzhou.aliyuncs.com/allen135681/easyml:ubuntu18.04-nvidia_cuda10.0-base-Miniconda3-py39_4.9.2   다음 명령을 실행하여 Docker를 로컬로 다운로드합니다. Windows 10에서는 wsl 도커 기술을 사용하여 이미지를 가져올 수 있습니다.
    sudo docker pull registry.cn-hangzhou.aliyuncs.com/allen135681/easyml:ubuntu18.04-nvidia_cuda10.0-base-Miniconda3-py39_4.9.2

    위의 도커는 주로 다음과 같은 구성을 갖습니다.

    docker pull名字:
    registry.cn-hangzhou.aliyuncs.com/allen135681/easyml:ubuntu18.04-nvidia_cuda10.0-base-Miniconda3-py39_4.9.2
    
    以上docker镜像基于英伟达官网的镜像nvidia/cuda 10.0-base eb416c0a142e 2 months ago 109MB 该基础镜像os是ubuntu18.04
    
    以下内容是添加的内容:
    
    1,添加apt 阿里云源: 
    #添加阿里源 
    deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse 
    deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse 
    deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse 
    deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse 
    deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse 
    deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse 
    deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse 
    deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse 
    deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse 
    deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
    
    2,apt update;apt install vim安装vim
    
    3,“/root/miniconda3/”目录下安装 Miniconda3-py39_4.9.2-Linux-x86_64.sh 自动配置环境变量,配置好后:conda 4.9.2 Python 3.9.1 pip 20.3.1

     

  5. 다양한 기계 학습을위한 라이브러리는 서로 다른 운영 체제 버전, cuda 버전 및 python 버전으로 빌드 될 수 있으며이 버전에서 호출되어야합니다. 따라서 여러 개의 유사한 도커 이미지 파일을 빌드하려면 파트 4의 아이디어를 모방해야합니다. 나중에 저자는 다양한 기계 학습 라이브러리를위한 더 많은 도커 이미지 패키지를 출시 할 것입니다.

요약하자면

위의 거울 이미지 축복으로 누구나 자격있는 스캘 퍼가 될 수 있습니다. 기준선, SOTA 등을 빠르게 재현합니다.

추천

출처blog.csdn.net/jrckkyy/article/details/114128602