Open Source Daily | Angular v18, 대규모 모델 가격 전쟁에서의 추론 최적화, 실리콘 밸리에는 자체 Lu Xun이 있습니다.

매일 업데이트되는 OSCHINA 편집부에서 제작하는 오픈소스 일간지에 오신 것을 환영합니다.

#2024.5.29

오늘의 하이라이트

Angular v18 공식 출시

"OpenHarmony 장치 통합 상호 연결 기술 표준" 발표

이 표준은 통합 개체 모델 외에도 액세스 및 제어 인터페이스, 화면 투영, 파일 공유, 적합성 테스트 사양 및 기타 표준을 포함한 일련의 다른 표준도 정의하는 것으로 보고되었습니다. 접근 및 제어 인터페이스 사양은 시스템 아키텍처 관점에서 장치 검색 및 배포, 등록 및 로그인, 보안 인증, 관리 제어 및 기타 측면에 대한 특정 프로세스 및 인터페이스를 자세히 정의합니다. 스크린캐스트 및 파일 공유는 멀티미디어 장치 간의 파일, 비디오 및 기타 데이터 전송, 암호화 및 공유를 위한 인터페이스를 정의합니다. 적합성 테스트 사양은 표준 사양과의 준수 및 일관성을 보장하기 위해 각 사양의 기술 요구 사항과 표시기 테스트 방법 및 단계를 엄격하게 정의합니다.

Greenplum의 GitHub 저장소 "404"

TiDB 8.1 LTS 출시

TiDB 8.1 LTS는 특히 다중 테넌트 애플리케이션 및 SaaS 유형 사용자 시나리오를 위한 일련의 혁신적인 기능을 통해 대규모 클러스터의 안정성과 운영 및 유지 관리 기능을 향상합니다.

오픈 소스 Llama3v가 새로 출시되었습니다: GPT4-V와 맞서며 가격은 500달러입니다.

GPT-4V와 동등한 Llama 3-V가 출시되었습니다. 단돈 500달러에 제작된 Llama3를 기반으로 한 다중 모드 모델입니다.

거의 모든 측정 항목에서 Llama 3-V는 GPT-4V, Gemini Ultra 및 Claude Opus와 같은 100배 더 큰 비공개 소스 모델과 동등한 성능을 발휘합니다. 유일한 예외는 MMMU(Multimodal Memory Task)로, Llama 3-V가 약간 열등합니다.

Llama3-V의 아키텍처는 Llama3 8B 및 siglip-so400m에 의해 구동되는 시각적 모델과 언어 모델을 결합합니다.

YC가 투자한 ChatGPT의 오픈소스 코드 버전

Bloop은 코드 중심의 ChatGPT로 평가받고 있으며, 2021년 여름 YC 투자를 받았습니다. Rust 기반의 AI 코드 검색 엔진으로 MacOS/Linux/Windows를 지원합니다. 현재 GitHub에 별 8,600개가 있습니다.

Bloop 기능은 다음과 같습니다.

1. 코드 해석
2. 컨텍스트 기반 코드 작성
3. 자연어를 사용하여 코드 검색 및 찾기
4. 문제 해결
5. 다중 언어
6. 코드 감지 및 중복 제거

Bloop은 현재 10개 이상의 프로그래밍 언어를 지원하고 로컬 및 GitHub 저장소의 동기화를 지원합니다.

GitHub 주소: https://github.com/BloopAI/bloop

오늘의 관찰

사회적 관찰

오픈소스 음성 TTS의 한계를 뛰어넘다

이 ChatTTS는 대화 시나리오를 위해 특별히 설계된 음성 생성 모델로 주로 LLM 보조 대화 작업, 대화 음성 및 비디오 소개에 사용됩니다. 중국어와 영어 혼합 텍스트를 지원하여 음성을 합성할 뿐만 아니라, 더 중요한 것은 음색 성능이 매우 강해서 참과 거짓을 구별하기 어렵습니다!

GitHub:github.com/2noise/ChatTTS

- 웨이보 GitHubDaily

2024년 AI 남친·여친 폭발적 성장 이끌 것

CB Insights는 6가지 트렌드를 나열합니다.
1. AI 컴패니언 스타트업인 Character AI는 모바일 사용 측면에서 ChatGPT에 바짝 뒤처지고 있습니다.
——AI 동반자는 두 번째로 중요한 소비자 AI 애플리케이션 시나리오일 수 있습니다.
2. Character AI 사용자 400만 명 중 절반 이상이 24세 미만입니다.
——Z세대는 AI 동반자에 대한 수용도가 매우 높으며, LLM(대형 언어 모델)의 기능이 향상됨에 따라 이러한 수용도 더욱 강화될 것입니다.
3. 스마트폰 시대에 Z세대는 친구들과 대면하는 시간이 줄어듭니다 . 4.
외로움을 느끼는 사람들이 점점 더 많아 지고 있습니다
. 5. 배우자나 파트너가 없는 미국 성인들이 점점 더 많아지고 있습니다
. 6. 젊은이들의 성생활은 점점 더 나빠지고 있어요

-Weibo Baoyuxp

Yang Likun의 컨볼루션 신경망은 신념을 강화하는 신호입니다.

AI의 기여에 관해 양세찬을 비롯한 3대 거인이 20년 동안 고집을 부리지 않았다면 이후의 AI 혁명은 어디에서 왔겠는가? 그 "긴 밤" 기간 동안 양의 컨볼루션 신경망은 믿음을 강화하는 빛의 등대였습니다. 나중에 FB의 Llama 시리즈 모델과 오픈 소스 개념도 이 AI 물결에 동참하는 데 관심이 있는 많은 사람들에게 도움이 되었습니다. Ma Yilong은 이와 관련하여 Yang Likun과 비교하고 싶습니까?

- 베이 지역의 웨이보 첸 샤오밍

대형 모델 가격 인하 이면에는 국산 대형 모델의 경쟁 논리가 달라졌다

대형 모델 API의 가격 인하는 업계 혁신에 대한 경고를 울렸습니다. 단순히 매개 변수, 컴퓨팅 성능, 가격을 쌓는 것은 업계의 건전한 발전을 위한 최적의 솔루션이 아닙니다. 미래에는 차별화만이 길을 찾을 수 있습니다. 모든 산업과 마찬가지로 혼돈에서 혼돈으로의 전환은 종종 잔인한 가격 전쟁으로 표시됩니다. 요즘은 광적인 대형 모델 '100대 모델 전쟁' 이후 가격 전쟁이 본격화되며 동질적 경쟁의 폐해가 점차 나타나고 있다.

-우리 - 미디어 Liu Kuang

대형 모델 가격 전쟁에서의 추론 최적화

대규모 모델 아키텍처 수준에서는 MLA 작업이든 Dense-MoE 또는 Google MoD, Medusa, SplitWise 등과 같은 작업이든 시스템 관점에서 추론의 컴퓨팅 성능 최적화를 고려한 다음 거꾸로 작업하여 적합한 대규모 모델 아키텍처는 대부분의 풀뿌리 팀이 복사할 내용만 알고 있거나 유출된 데이터를 사용하여 목록을 만들고 매일 GPT-N을 능가하려고 시도하는 것이 안타깝습니다.

- 위챗 zartbot

미디어 워치

이제 인공지능은 얼마나 “인간과 유사”합니까?

스탠포드 대학 컴퓨터과학과 리 페이페이(Li Feifei) 교수도 최근 타임지에 기고한 글에서 일반 지능으로 가는 길에서 '감정'은 중요한 단계, 즉 주관적인 경험을 갖는 능력이라고 말했습니다. 현재의 대형 모델은 인간처럼 "느끼지" 않습니다. 발가락이 전혀 없더라도 "발가락이 아프다"고 말할 수 있습니다. 이는 단지 실리콘 칩에 인코딩된 수학적 모델일 뿐입니다.

"우리는 아직 지각 있는 AI를 달성하지 못했고 더 큰 언어 모델도 달성할 수 없습니다. AI 시스템에서 이 현상을 재현하려면 시스템에서 생성된 감각이 구현된 생물에 어떻게 존재하는지 더 잘 이해해야 합니다."라고 그녀는 말했습니다.

- 신화통신

Mistral AI, 오픈소스 모델로 미국 시장 공략

유럽의 생성 인공 지능 도구 개발업체인 프랑스 미스트랄 AI(Mistral AI)가 미국 시장을 겨냥했습니다. 이 스타트업은 이번 달 전직 Foursquare 최고 수익 책임자인 Marjorie Janiewicz를 미국 최초의 총괄 관리자로 고용했다고 Bloomberg가 화요일(5월 28일) 보도했습니다.

Janiewicz는 보고서에서 Mistral AI가 OpenAI 및 Google과 같은 대형 기술 기업이 제공하는 인공 지능 모델 및 서비스에 대한 대안을 모색하는 기업의 증가하는 수요를 활용하는 것을 목표로 한다고 말했습니다.

회사의 미국 시장 진출에 탄력이 붙고 있는 것으로 알려졌다. 스타트업은 더 많은 직원을 고용할 계획이며 이미 AI 솔루션에 대한 더 많은 선택권과 유연성을 원하는 기업들 사이에서 관심을 얻고 있습니다.

Mistral의 오픈 소스 접근 방식(기본 코드는 공개적으로 공유되고 사용자 정의 가능)은 경쟁사가 제공하는 폐쇄형 시스템보다 더 안전하고 다양한 대안으로 간주됩니다.

-비아뉴스

보다 효율적인 확장 기술: 대형 모델 제조업체가 MoE 아키텍처를 선호하는 이유는 무엇입니까?

2023년, 1년간의 질주 끝에 대형 모델은 빠르게 병목 현상에 직면했습니다. 스케일링 법칙(매개변수 수가 증가하면 모델 성능도 향상된다는 의미)이 존재하므로 대형 모델의 성능에는 한계가 없는 것처럼 보입니다. 그러나 대형 모델을 훈련하는 데 사용되는 데이터와 컴퓨팅 성능은 매우 뛰어납니다. 제한된. 이러한 배경에서 업계는 보다 효율적인 모델 아키텍처를 모색해야 하며, MoE(Mixture of Experts, 하이브리드 전문가 모델) 아키텍처의 등장은 업계에 희망을 안겨주었습니다.

- 21세기 비즈니스 헤럴드

실리콘 밸리에는 루쉰이 있습니다! AI 재벌 르쿤(LeCun)은 계속해서 광포해지고 있으며 머스크(Musk)부터 오픈AI(OpenAI)까지 모두 비판을 받고 있다.

Llama는 원래 LeCun이 이끄는 FAIR에서 개발했지만 이제는 기술 및 제품 개발에 중점을 두는 GenAI 부서로 넘겨졌고, FAIR는 장기적인 목표인 새로운 AI 아키텍처 및 방법 개발에 중점을 두고 있습니다. 인간 수준의 지능.

많은 사람들은 Yann LeCun이 논란의 여지가 있는 발언을 좋아한다고 생각하지만, 더 중요한 배경은 현재 AI의 미래 발전에 따른 문제입니다. 인공 지능 분야에서 가장 잘 알려진 이름 중 하나인 Yann LeCun은 이 논란이 많은 분야에 한발 더 나아가 명확성을 제공해야 할 의무가 있습니다.

LeCun은 AGI 구현이 제품 설계 문제나 기술 개발 문제가 아니라 상당 부분 과학적인 문제라고 말했습니다.

이 진술이 사실이라면 분명히 AGI를 탐구하는 과정에서 그와 같은 "루쉰"이 더 많이 필요합니다.

-핀완

남성 모델이라는 기본 '성공한 사람'에 성별 편견이 있는 걸까요?

Qiu Xipeng 교수는 데이터를 통해 지난 2년간 대형 모델의 발전을 살펴보았습니다. 대형 모델의 학습에서는 값 정렬이 중요한 항목이고, 목표는 인간이 부여한 값이다. 여기에는 성별 문제도 포함됩니다. 그러나 단어분석을 통해 형성된 워드클라우드에는 AIGC(생성인공지능) 고유의 인상도 나타난다. 남편, 도전, 어머니 등의 단어입니다.

Qiu Xipeng은 "실제 연구에서 말뭉치의 성별 교정에는 매우 큰 투자가 필요합니다. 모델 정렬이 수행되어야 하며, 모델 출력은 인간 선호 모델링, 가치 정렬 등의 방법을 통해 보다 긍정적인 콘텐츠를 생성하도록 조정됩니다."라고 말했습니다.

- 지닝 뉴스 네트워크

오늘의 추천

오픈소스 프로젝트

vuejs/언어 도구

https://github.com/vuejs/언어-tools

Volar는 Vue용 VS Code 플러그인이자 Vue용 공식 IDE/TS 지원 도구입니다. 강조 표시, 구문 프롬프트 등과 같은 Vetur 관련 기능을 통합하는 것 외에도 몇 가지 고유한 기능도 포함되어 있습니다.

데일리 블로그

수백억 장의 대형 이미지를 광고 시나리오에 적용

이 글에서는 검색 추천 항목을 활용하여 테이크아웃 검색 광고의 부족한 공급량을 채워 트래픽 수익 창출 효율성을 높입니다. 테이크아웃 검색 및 추천 사업의 다채널, 실시간 과제를 해결하기 위해 테이크아웃 멀티 시나리오 이기종 대형 이미지와 이기종 대형 이미지 온라인 모델링 기술의 진화 경로를 제안합니다. 관련 결과는 CIKM2023 컨퍼런스에서 논문으로 발표되었습니다. 공동 기계 학습 플랫폼은 대규모 그래프 교육 및 온라인 추론 엔진 GraphET를 구축하여 거의 100억 개의 에지와 복잡한 그래프 구조를 갖춘 여러 비즈니스 구현 요구 사항을 충족합니다.

이벤트 코멘트

세계 최초의 오픈 소스 대규모 병렬 데이터베이스 - Greenplum의 GitHub 저장소에 갑자기 "404"가 수신되었습니다. Broadcom이 폐쇄 소스에 대해 비용을 청구할 예정인가요?

잘 알려진 오픈 소스 MPP 데이터베이스 Greenplum은 소스 코드 웨어하우스 액세스 권한을 수정하여 "읽기 전용"만 지원하고 원본 분기, 태그, 홍보, 문제 및 기타 정보를 모두 지웠습니다. 배너 알림은 저장소가 5.25에 아카이브 상태로 전환되었음을 나타냅니다.

검토

잘 알려진 오픈 소스 MPP 데이터베이스인 Greenplum의 소스 코드 저장소는 읽기 전용으로 바뀌고 관련 정보가 삭제되어 데이터베이스에 의존하는 오픈 소스 커뮤니티에 큰 타격을 줄 수 있습니다. 커뮤니티 구성원과 기여자는 프로젝트의 미래에 대해 불확실함을 느끼고 Greenplum의 향후 방향과 유지 관리에 대한 의문을 제기할 수 있습니다.

Greenplum Database를 사용하는 사용자 및 기업의 경우 이러한 변경 사항이 비즈니스 연속성과 기술 선택에 영향을 미칠 수 있습니다. Greenplum에 대한 변경 사항은 다른 오픈 소스 프로젝트, 특히 Greenplum에 의존하거나 동일한 회사에서 유지 관리하는 프로젝트에 파급 효과를 미칠 수 있습니다.

브로드컴의 VM웨어 인수가 실제로 영향을 미친다면 이는 오픈소스 프로젝트가 상용화로 전환하는 또 다른 사례가 될 것이며, 이는 오픈소스 커뮤니티에 불만과 저항을 불러일으킬 수 있다. 이 사건은 또한 오픈 소스 프로젝트와 상업적 이익 사이의 긴장을 강조합니다. Greenplum이 비공개 소스로 전환되면 오픈 소스 문화에 부정적인 영향을 미치고 오픈 소스 프로젝트에 대한 커뮤니티의 신뢰와 참여가 줄어들 수 있습니다.

연구에 따르면 AI 엔지니어는 동료보다 훨씬 더 많은 돈을 벌고 있습니다.

Levels.fyi 가 공개한 2024년 1분기 AI 엔지니어 연봉 조사 자료에서는 AI를 전문으로 하는 소프트웨어 엔지니어와 비AI 소프트웨어 엔지니어의 연봉에 상당한 차이가 있음을 지적했다.

검토

AI 엔지니어의 높은 연봉은 AI 전문 기술에 대한 시장 수요가 높다는 것을 반영합니다. AI 기술이 계속 발전하고 적용됨에 따라 기업은 이러한 기술을 갖춘 인재에게 기꺼이 프리미엄을 지불할 의향이 있습니다. AI 분야에 진출하는 기업이 늘어나면서 AI 엔지니어 확보 경쟁도 치열해지고 있다. 최고의 인재를 유치하고 유지하려면 기업은 더욱 경쟁력 있는 보상을 제공해야 합니다.

초급부터 고위급까지 AI 엔지니어는 비 AI 엔지니어보다 더 많은 급여를 받습니다. 이는 경력 개발의 모든 단계에서 AI 기술이 매우 중요하다는 것을 나타냅니다. AI 인재 시장이 성숙해짐에 따라 기업은 급여를 시장 표준에 더 가깝게 만들고 AI와 비AI 직위 간의 급여 격차를 줄이기 위해 채용 및 보상 전략을 조정할 수 있습니다.

높은 급여는 더 많은 학생과 전문가가 AI 분야의 학습 및 경력 개발에 전념하도록 동기를 부여하여 교육 및 경력 계획의 방향에 영향을 미칠 수 있습니다. 기업은 AI 인재의 중요성을 인식하고 경쟁력을 유지하기 위해 전략적 계획에서 이러한 인재를 유치, 개발 및 유지하는 방법을 고려해야 합니다.

OpenAI의 전 보안 책임자가 경쟁사인 Anthropic에 합류했습니다.

이달 초 OpenAI의 전 보안 이사이자 Superalignment 팀장인 Jan Leike는 OpenAI에서 사임을 발표하고 회사의 보안 문제를 공개적으로 비판했습니다. 이제 Leike는 OpenAI 경쟁자인 Anthropic에 합류했으며 새로운 "슈퍼 정렬" 팀을 이끌 것이라고 게시 했습니다.

검토

OpenAI의 보안 책임자이자 초정렬 팀 리더인 Leike의 합류는 Anthropic의 AI 보안 연구 개발을 강화하여 AI 보안 분야의 경쟁을 더욱 심화시킬 수 있습니다. 한편 Leike는 다른 직원의 사기와 충성도에 영향을 미칠 수 있는 OpenAI의 보안 문제를 공개적으로 비판한 후 경쟁사에 합류하기로 결정했습니다.

이러한 움직임은 OpenAI의 평판에 일정한 영향을 미칠 수 있습니다. 동시에 OpenAI는 두뇌유출 이후 AI 분야에서 어떻게 리더십을 유지할 것인지 고민해야 한다.

또한 Leike의 행동과 발언은 AI 윤리 및 거버넌스 문제에 대한 대중의 관심을 높일 수 있습니다. AI 기술이 발전함에 따라 안전과 윤리를 보장하는 것이 점점 더 중요해지고 있습니다. Anthropic에서 Leike의 새로운 역할은 AI 안전 및 윤리 분야에서 회사의 혁신을 주도할 것으로 보이며 이는 업계 전체에 긍정적인 신호입니다.

이번 사건은 AI 업계 내 인재 확보 경쟁의 강도는 물론, 경쟁 우위를 확보하기 위한 기업 간 전략적 조정을 보여주는 것일 수도 있다.

오픈소스의 목소리

언론의 의견

AI는 '운영체제'가 없기 때문에 비용을 지불하더라도 사용하기가 쉽지 않습니다.

현재 기술 및 가격의 호황에도 불구하고 현재 AI 기능을 효과적으로 활용할 수 있는 기업은 제한적입니다. 현 단계에서는 약간 "가격은 있지만 시장성이 없는" 대형 모델의 구현은 명백한 문제점입니다.

-긱 파크

머스크의 최근 인터뷰: 인공지능의 가치에 대한 걱정, AI 시대에 일할 필요가 없다면 모두가 고소득을 누리나요?

과도한 정치적 올바름 경향은 인공지능의 미래를 걱정하게 만든다. 나는 이런 추세가 매우 위험하다고 생각한다.

xAI의 목표는 진실이 인기가 없더라도 절대적인 진실을 추구하는 것입니다.

-금융 싱크탱크

AI 아트는 왜 항상 나빠 보이는 걸까요?

그러나 시간이 지나면서 점점 더 많은 사람들이 AI 예술 작품 뒤에 공백이 있다는 것을 발견하기 시작합니다. AI의 그림에서는 베르메르의 조용한 삶에 대한 섬세한 묘사를 볼 수 없고, 피카소의 순수함과 사실주의에서 추상으로의 흐름을 볼 수 없습니다.

-Aifan'er

사용자 관점

세계 최초의 오픈 소스 대규모 병렬 데이터베이스 - Greenplum의 GitHub 저장소에 갑자기 "404"가 수신되었습니다. Broadcom이 폐쇄 소스에 대해 비용을 청구할 예정인가요?

관점 1: Broadcom은 업계에서 정말 파라쿼트입니다. 당시 운영 자본이 Qualcomm을 정말 잠식했다면 지금의 모바일 시장은 어떨지 상상할 수 없습니다.

관점 2: 브로드컴의 사장 첸은 금융자본식 인수합병에 참여하고 있다. VMware는 오픈 소스인데 왜 이 오픈 소스 데이터베이스 제품의 상용화에 신경을 쓰나요?

관점 3: VMware는 오픈 소스가 아니며 개인 사용자에게만 무료입니다.

관점 4: 언젠가 Spring 프레임워크가 기업용 과금 시스템에 통합된다면 정말 재미있을 것입니다.

의견 5: 하하, 저는 이 데이터베이스를 감히 사용하지 않습니다.

관점 6: 집주인이 바뀌면 집을 즉시 철거하라

Tencent App Store와 Microsoft Store가 협력하여 Windows에서 모바일 애플리케이션을 직접 실행할 수 있습니다.

관점 1: Amazon: 누군가를 교체하고 싶다면 그렇게 말하세요.

관점 2: wsa 사용 경험이 너무 나빴습니다.

관점 3: Tencent 브랜드 Android 에뮬레이터

JavaScript, Python 및 Java가 여전히 개발자의 첫 번째 선택으로 남아 있는 이유

관점: 1: 생태학이 결정적인 역할을 한다

관점 2: 언어가 사용하기 쉽지 않으면 생태가 없다.

의견 3: “또한 Java는 역사적 강점 때문만은 아닙니다. Java는 6개월마다 주요 기능 및 성능 업데이트와 사소한 개선, 버그 수정 및 보안 업데이트를 받습니다. "그러나 많은 사람들은 특별히 그렇지 않습니다. 그것이 제공하는 새로운 기능에 관심을 갖고 있으며 심지어 많은 회사도 Java8 밀레니엄 시대에 있습니다.

[Java Orm 프레임워크 비교] 열셋, 새로운 qdbc 프레임워크 비교

의견: 1: mybatis-mp는 사용하기 매우 쉽고 사용할 가치가 있는 새로운 ORM 프레임워크입니다.

관점 2: 각각 장단점이 있습니다. mybatis를 기반으로 한 2차 개발은 실제로 Solon을 우선시하는 등 많은 적응을 줄일 수 있습니다.

관점 3: Mybatis의 xml은 정말 냄새나고 길어요. 벌써 2024년인데, 여전히 결과 매핑을 수동으로 설정해야 합니다.

관점 4: 사실 굳이 설정할 필요는 없다.

관점 5: mybatis-mp는 ORM 및 xml일 수 있으며 테이블 연결은 작은 경우입니다.

관점 6: jooq를 추가하는 것이 좋습니다

의견 7: 연구하고 나면 너무 무겁고 생성해야 할 것이 많이 필요하다는 느낌이 듭니다.

---끝---

마지막으로 QR 코드를 스캔하여 "오픈 소스 중국 앱"을 다운로드하고 프로그래머와 괴짜들의 방대한 기술 보고서와 공유 내용을 읽어보세요!