바이두의 대형 모델 기반 코드 작성 도우미 '코메이트' 정말 사용하기 쉬운가요?

우리를 따르려면 파란색 단어를 클릭하십시오

팔로우 및 별표 표시

절대 길을 잃지 않는다

컴퓨터 비전 연구소

9a91c68967d66d097fe8835e0fdb02e2.gif

9ff21a29fdbbcfd0e892797144ba03c1.gif

Public ID컴퓨터비전연구소

학습모임QR코드를 스캔하시면 홈페이지에서 가입방법을 확인하실 수 있습니다.

컴퓨터비전연구소 칼럼

컴퓨터 비전 연구소 칼럼

6월 6일, Wenxin 대규모 모델 기술 교류 회의(청두)에서 Baidu Smart Cloud는 "Comate" 코드 어시스턴트를 출시하고 공식적으로 초대 테스트를 시작했습니다. Wenxin 빅 모델의 이해 및 추론 기능 덕분에 "Comate"는 빠른 코드 완성, 자연어 코드 권장, 자동 코드 오류 찾기를 실현하고 개발자의 R&D 효율성을 종합적으로 향상시킬 수 있습니다. 앞으로 개발자는 플러그인 및 기타 형식을 통해 주류 개발 소프트웨어에서 "Comate" 코드 어시스턴트를 사용할 수 있습니다. 시장에는 이미 많은 코드 지원 도구가 있습니다. Baidu가 눈에 띌까요?

423df4887a1090c99390e926edbbbdc7.gif

01

배경

빠르면 2021년 6월부터 Baidu Smart Cloud는 미래의 대규모 모델 학습 작업을 충족하기 위해 새로운 고성능 GPU 클러스터 구축 계획을 시작했으며 NVIDIA와 함께 수용할 수 있는 IB 네트워크 아키텍처 설계를 완료했습니다. 10,000장 이상 클러스터 내 노드 방 내 각 GPU 카드는 IB 네트워크를 통해 연결되며 클러스터 구축은 2022년 4월 완료되어 단일 클러스터 EFLOPS 수준의 컴퓨팅 성능을 제공할 예정입니다.

2023년 3월, Wenxin Yiyan은 이 고성능 클러스터에서 탄생했으며 반복적으로 새로운 기능을 개발했습니다. 현재 이 클러스터의 크기는 계속 확장되고 있습니다. Lai Junjie 박사, NVIDIA China 솔루션 및 엔지니어링 총책임자: 고속 IB 네트워크로 상호 연결된 GPU 클러스터는 대형 모델 시대의 핵심 인프라입니다. NVIDIA와 Baidu Smart Cloud가 공동으로 구축한 국내 클라우드 컴퓨팅 시장에서 가장 큰 고성능 GPU/IB 클러스터는 대형 모델 분야에서 Baidu의 돌파구를 가속화할 것입니다.

a02d8b373b0e96e066553f72832c857e.png

5566fe691ed5a838732bdd878cbfcfaf.png

  • 대형 모델의 전체 수명 주기를 포괄 - 보다 포괄적이고 포괄적입니다.

데이터 라벨링, 모델 교육 및 평가, 추론 서비스 및 애플리케이션 통합을 위한 포괄적인 기능 서비스 제공

  • 훈련 및 추론 성능이 크게 향상됨 - 더 효율적이고 효율적임

MLPerf 목록의 교육 성능은 세계 최고 수준이며, 1000억 모델의 분산 병렬 교육 가속 기능과 컴퓨팅 성능 활용률이 크게 향상되었습니다.

  • 신속한 애플리케이션 오케스트레이션 및 플러그인 통합 - 더욱 개방적이고 개방적입니다.

Baidu Wenxin 대형 모델 및 타사 대형 모델 사전 설정, 플러그인 및 응용 프로그램의 유연한 배열을 지원하고 대형 모델을 여러 시나리오에 적용할 수 있도록 지원

  • 기본 제공 민감한 단어 필터링 - 더 안전하고 보안

완벽한 인증 및 흐름 제어 보안 메커니즘, 민감한 단어 필터링 내장, 기계 검토 및 사람 검토의 이중 보장

내장형 Wenxin 대형 모델 베이스

  • 기술 리더십

    지식이 강화된 대형 모델, 통합 패러다임은 여러 유형의 다운스트림 작업을 지원합니다.

    고급 병렬 전략은 대규모 모델 교육, 압축 및 배포를 지원합니다.

    제어 가능하고 신뢰할 수 있는 언어 이해 및 생성 기능

  • 전체 장면 범위

    대화 상호 작용, 무료 질문 및 답변, 카피라이팅 및 기타 기능 지원

    에너지, 금융, 항공 우주, 산업, 미디어 및 기타 분야를 포괄

  • 문턱이 낮아 사용하기 쉬움

    서비스를 호출하는 코드 한 줄

    원클릭 자동 모델 미세 조정

    다중 시나리오 AI 애플리케이션 구현을 완료하기 위한 소량의 데이터

  • 실제 및 착륙 가능

    엔터프라이즈급 원스톱 고객 서비스 제공

    칩 + 플랫폼 + 모델 + 애플리케이션의 4계층 아키텍처 통과

    엔드투엔드 애플리케이션 랜딩을 달성하기 위해 여러 파트너와 협력

02

대형 모델 코드 어시스턴트

디지털 변환에 대한 수요가 증가함에 따라 기업에서 점점 더 많은 AI 애플리케이션, AI 개발에 대한 높은 임계값, 복잡하고 다양한 애플리케이션 시나리오, 장면 주석 데이터에 대한 의존도가 AI의 대규모 구현에 대한 과제가 되었습니다. 대형 모델 훈련 인공지능의 등장은 새로운 기회와 희망을 가져왔습니다.

정부와 기업이 인공 지능 산업의 발전을 촉진하는 중요한 출발점으로 대형 모델은 인식, 이해, 의사 결정, 그리고 세대. 프로그래머가 반복적이고 단순하며 사소한 작업을 완료하는 데 쉽고 정확하게 도움을 줄 수 있는 코드 어시스턴트가 있다면 더 이상 환상이 아닙니다.

이제 점점 더 많은 개발자가 이 필수 도구를 사용해야 합니다. 현재 주류 AI 지능형 프로그래밍 코드 도우미에는 Github CopilotX, Codeium, Tabnine, Replit Ghostwriter 및 Amazon CodeWhisperer가 포함됩니다.

  • Github CopilotX

5976ecfab7f28ec50f0094a95e6f0b1b.jpeg

Copilot X는 2021년에 출시된 Copilot의 업그레이드 버전입니다. GPT-4에 연결되어 채팅 및 음성 등의 기능이 추가되었습니다. , 나는 또한 당신을 위해 테스트 케이스를 작성했습니다.또한 당신이 이해하지 못하는 코드 스 니펫을 설명하고 직접 디버깅하는 데 도움을 줄 수 있습니다.그냥 프로그래머를위한 사려 깊은 작은 조수입니다.

7a7b4d3f04a6ccfbc0e821f22629c0d6.jpeg

OpenAI의 GPT-4 모델 출시와 함께 GitHub는 GitHub Copilot X의 새 버전을 출시했습니다. Copilot X의 AI 모델은 최신 OpenAI GPT-4를 사용합니다. GitHub Copilot X는 개발자 경험을 개선하기 위해 최선을 다하고 있으며 채팅 및 음성 인터페이스를 제공하고 끌어오기 요청을 지원하며 문서 질문에 답변하고 GPT-4를 통해 보다 개인화된 개발자 경험을 가능하게 합니다. GitHub Copilot X를 사용하여 코드의 목적을 설명하고 버그를 발견하면 Copilot X가 이를 수정하도록 하고 단위 테스트도 생성합니다.

  • 리플릿 대작가

d0ee0404247b2fe3e7946eb50d69323a.png

Replit Ghostwriter는 개발자가 코드를 빠르게 작성, 생성, 변환 및 해석할 수 있도록 도와주는 동시에 에디터 내에서 오픈 소스 코드를 검색하고 가져올 수 있는 기능을 제공하는 인공 지능 기반 코드 지원 도구입니다. Replit은 Python, JavaScript, Ruby 등 여러 프로그래밍 언어를 지원하는 온라인 통합 개발 환경(IDE)으로 개발자가 브라우저에서 코드를 생성, 실행 및 공유할 수 있습니다. 또한 Replit은 다자간 협업, 버전 제어, 클라우드 배포와 같은 기능을 제공하여 개발자가 애플리케이션을 쉽게 구축하고 출시할 수 있도록 합니다. Replit AI Ghostwriter는 OpenAI의 GPT-4 모델을 활용하여 개발자에게 AI 기반 코딩 지원 도구를 제공하는 Replit의 새로운 기능입니다.

그러나 이제 Baidu Smart Cloud는 Wenxin 모델인 코드 도우미 Comate를 기반으로 차세대 코딩 지원 도구를 만들었습니다!

8859597c9c21fd3703e2834b628a3e31.png

엔지니어의 개발 과정에서 Comate는 개발 시 컨텍스트와 주석 조합 코드를 통해 선언된 함수 이름을 읽어 코드를 예측할 수 있습니다. 제안 보기 및 제안 코드 수동 편집을 허용하는 동안 중복 코드는 자동으로 채워집니다.

작동 원리는 글로벌 GitHub 리포지토리의 헤드 오픈 소스 코드를 읽고 데이터를 수집하고 이와 관련된 최상의 코드를 찾으려고 노력하며 반환된 데이터를 통해 지속적으로 추천 정확도를 훈련하고 개선하는 것입니다. 핵심 기능은 한 줄 추천, 여러 줄 추천, 자연어 변환 코드에 반영됩니다.

한 줄 추천

93f792d05e68da0834d8e96c1d2f9036.gif

여러 줄 추천

f4c28c0212ccbf1cc5db64fc4463f7c2.gif

자연어 트랜스코딩

3614c9745a75325202f66044084ee5e7.gif

코메이트에서 제안한 코드 중 30~50%는 내부 테스트를 거친 후 개발자가 제안한 코드 중 30~50%가 개발자에게 채택되어 정식 신규 코드의 10% 이상을 차지하며 다양한 제품 개발에 적용되고 있다. . Comate는 주류 IDE 프레임워크를 지원하며 현재 특히 C/C++, Python, Java, Go, PHP, JavaScript 및 기타 주류 언어에서 30개 이상의 언어를 다루고 있습니다.

© 끝 

재인쇄를 위해 승인을 위해 이 공식 계정에 문의하십시오.

bf1e52f8d93c6c68612cbc566e761e87.gif

Computer Vision Research Institute 스터디 그룹이 여러분의 참여를 기다리고 있습니다!

에 대한

컴퓨터 비전 연구소

컴퓨터비전연구소는 주로 딥러닝 분야에 관여하고 있으며 주로 표적탐지, 표적추적, 영상분할 등의 연구방향에 매진하고 있다. 연구소는 항상 최신 논문의 알고리즘 프레임워크를 공유하고 플랫폼은 "연구"와 "실천"에 중점을 둡니다. 이후 단계에서는 해당 분야의 실제 과정을 공유하여 모든 사람이 이론을 없애는 실제 장면을 실제로 경험하고 프로그래밍과 두뇌 사고를 사랑하는 습관을 기를 수 있도록 할 것입니다!

1c0fd48728e666376a727de3cc6d0ff1.png

6cdf53bbc31d5e2bb85dd5ac168c8318.png

b1a540dea9006c2ec42758514a960766.png

3657bfcd5e8f3e73a53f2c5bf99bf995.png

63a30564dde0e5cddcd851d9e0c34cc8.png

협력하고 즉시 상담하려면 "원문 읽기"를 클릭하십시오.

추천

출처blog.csdn.net/gzq0723/article/details/131118364