기사 추천
GPT-4o가 출시되었고 사용자들은 즉시 이를 검토했습니다. OpenAI에 과장된 부분이 있나요?
OpenAI 라이브 방송 카운트다운, GPT-5가 없는 것으로 확인, GPT-3.5에서 5로, AI 진화의 큰 차이를 기사 하나로 이해하세요!
이번 호의 인기 주제
Google, I/O 2024 개최: GPT-4o에 대응하기 위해 Project Astra 출시, Gemini 시리즈 모델 업데이트
공동 창립자이자 AI 선구자인 Ilya Sutskever가 OpenAI를 떠남
미국과 중국, '오산과 우발적 충돌' 방지 위해 AI 안보 회담 개최
ByteDance, 자체 개발한 빈백 대형 모델 시리즈 공식 출시, “업계 대비 99.3% 저렴”
벤치마크 Sora, Tencent Hunyuan 오픈 소스 Wensheng 그래프 대형 모델로 업그레이드
...
Google I/O 2024: GPT-4o에 대응하기 위한 Project Astra 출시, Gemini 시리즈 모델 업데이트
Google I/O 2024 컨퍼런스에서 Google은 AI를 사용하여 더욱 유용한 제품과 기능을 구축하는 방법을 공유했습니다. 컨퍼런스에는 다음과 같은 공유 내용이 포함되었습니다.
- Gemini 시리즈 모델 업데이트:
Gemini 1.5 Pro 업그레이드: 컨텍스트 창을 200만 개의 토큰으로 확장하고 데이터 및 알고리즘의 발전을 통해 코드 생성, 논리적 추론 및 계획, 다중 턴 대화, 오디오 및 이미지 이해도 향상합니다. Gemini 1.5 Pro는 역할, 형식 및 스타일과 관련된 행동 지침을 지정하는 것을 포함하여 점점 복잡해지고 세부적인 지침을 따를 수 있는 업그레이드입니다.
Gemini 1.5 Flash 출시: 1.5 Flash는 Gemini 모델 제품군의 최신 멤버이자 API에서 가장 빠른 Gemini 모델입니다. 대규모, 고용량, 빈도가 높은 작업에 최적화되어 있으며 서비스가 더욱 비용 효율적입니다.
Gemini Advanced: Gemini 1.5 Pro의 도입으로 여러 개의 대용량 문서를 처리하고 복잡한 계획을 세울 수 있으며, 더 나은 언어 상호 작용을 달성하기 위해 Gemini Advanced 가입자를 위한 Gemini Live가 출시됩니다.
- 시각 기억 기능을 갖춘 AI 도우미 Project Astra 출시:
텍스트, 영상, 오디오를 실시간으로 처리할 수 있고, 서로에 대한 질문에 답하고 해석하거나 창의적인 결과물을 생성할 수 있으며, 화이트보드에 있는 다이어그램이나 프로그램 코드를 인식하고 해석할 수 있습니다.
- Sora와 비교하여 비디오 생성 모델 Veo가 출시되었습니다.
Veo는 다양한 영화 및 시각적 스타일로 1분 이상의 고품질 1080p 해상도 비디오를 생성할 수 있습니다. 그리고 큐의 뉘앙스와 톤을 정확하게 캡처하여 전례 없는 수준의 창의적인 제어 기능을 제공합니다. 즉, 저속 촬영이나 풍경의 공중 촬영과 같은 다양한 영화 효과에 대한 큐를 이해하는 것입니다.
- Google 검색 AI에서 AI 개요 출시:
맞춤형 Gemini 모델의 다단계 추론 기능을 기반으로 하는 AI 개요는 점점 더 복잡해지는 문제를 해결하는 데 도움이 됩니다. 질문을 여러 번 검색하는 대신, 가장 복잡한 질문을 생각하는 모든 뉘앙스와 주의 사항과 함께 한 번에 질문할 수 있습니다.
- Gemma 가족이 새 멤버를 추가했습니다:
최초의 시각적 언어 개방형 모델인 PaliGemma는 이미지 캡션, 시각적 질문 답변 및 기타 이미지 라벨링 작업에 최적화되어 있습니다.
올해 6월 출시 예정인 차세대 개방형 모델인 Gemma2는 크기가 2배 이상인 일부 모델보다 성능이 뛰어나며 Vertex AI의 GPU 또는 단일 TPU 호스트에서 효율적으로 실행될 수 있습니다.
더 알아보기:
https://blog.google/inside-google/message-ceo/google-io-2024-keynote-sundar-pichai/
공동 창립자이자 AI 선구자인 Ilya Sutskever가 OpenAI를 떠남
OpenAI의 공동 창립자이자 중요한 AlexNet 논문의 공동 저자인 Ilya Sutskever는 그녀에게 "개인적으로 중요한" 새로운 프로젝트를 추구하기 위해 약 10년 만에 회사를 떠날 예정입니다. Jakub Pachocki가 연구 책임자를 맡게 됩니다. Jakub은 OpenAI에서 7년 넘게 근무했으며 CEO Sam Altman은 그의 세대에서 가장 뛰어난 사상가 중 한 명으로 묘사했습니다. Sam에 따르면 그는 회사의 주요 프로젝트 대부분을 이끌고 있습니다. 일리아는 2022년 11월 강제 상업화와 관련 보안 위험으로 비판을 받아온 샘 알트먼 CEO의 임시 축출에 참여했다. 그러나 조사 결과 해고는 부당한 것으로 나타났다. Ilya는 사과하고 Altman의 복직을 도운 다음 이사회를 떠났습니다. 일리아가 사임한 지 몇 시간 뒤, AI 보안 연구원 얀 레이케(Jan Leike)도 사임을 발표했다. Leike와 Ilya는 초지능을 점진적으로 반복적으로 정렬하고 인간 능력을 갖춘 자동화된 정렬 연구원을 만드는 것을 목표로 2023년 여름 OpenAI가 설립한 Superalignment 팀을 공동으로 이끌었습니다.
더 알아보기:
https://the-decoder.com/co-founder-and-ai-pioneer-ilya-sutskever-leaves-openai/
ByteDance, 자체 개발한 빈백 대형 모델 시리즈 공식 출시, “업계 대비 99.3% 저렴”
오늘 열린 2024 Spring Volcano Engine FORCE Motive Power 컨퍼런스에서 ByteDance는 자체 개발한 “Bean Bag Large Model” 시리즈를 출시했습니다. 이번 대형 모델군에는 빈백 일반 모델인 Pro와 liti를 비롯해 빈백·롤플레잉 모델, 콩주머니·음성합성 모델, 콩주머니·소리재현 모델, 콩주머니·음성인식 모델, 빈백·벤센 다이어그램 모델, 빈백·Function Call 모델을 포함한 9가지 주요 모델은 인공지능 분야에서 ByteDance의 심오한 축적과 혁신 역량을 종합적으로 보여줍니다. "사용량이 많아야 좋은 모델을 다듬을 수 있고 모델 추론의 단가를 크게 줄일 수 있습니다. 기업 시장에서 Doubao의 주요 모델 가격은 0.0008위안/천 토큰에 불과하며 0.8%는 1,500자 이상의 한자를 처리할 수 있습니다. 이는 업계 99.3%보다 저렴합니다." Tan Dai는 가격 책정을 센트 단위에서 센트 단위로 전환하면 기업이 더 낮은 비용으로 비즈니스 혁신을 가속화하는 데 도움이 될 것이라고 말했습니다.
더 알아보기:
https://mp.weixin.qq.com/s/WPs7Gt3Dt_SqkN1PJXsmmw
벤치마크 Sora, Tencent Hunyuan 오픈 소스 Wensheng 그래프 대형 모델로 업그레이드
Tencent는 Hunyuan Wensheng 그래프 모델이 업그레이드되어 오픈 소스화되었다고 발표했습니다. Hugging Face 및 Github에 출시되었습니다. 여기에는 모델 가중치, 추론 코드, 모델 알고리즘 등 완전한 모델이 포함되어 있으며 기업에서 무료로 상업적으로 사용할 수 있습니다. 그리고 개인 개발자. 업그레이드된 Hunyuan Wenshengtu 대형 모델은 Sora와 동일한 DiT 아키텍처를 채택했다고 Tencent는 Hunyuan DiT가 중국어와 영어로 된 최초의 이중 언어 DiT 아키텍처라고 말했습니다. Hunyuan DiT는 Diffusion 변환기를 기반으로 한 텍스트-이미지 생성 모델입니다. 이 모델은 중국어와 영어에 대한 세밀한 이해 기능을 갖추고 있습니다. Hunyuan DiT는 사용자와 여러 차례의 대화를 수행하여 상황에 따라 이미지를 생성하고 개선할 수 있습니다. 이는 또한 업계 최초의 중국어 기반 DiT 아키텍처 Vincentian 그래프 오픈 소스 모델로, 15억 개의 매개변수로 중국어 및 영어 이중 언어 입력 및 이해를 지원합니다.
더 알아보기:
https://www.ithome.com/0/767/876.htm
침해가 있는 경우 당사에 연락하여 삭제하시기 바랍니다.
"Trusted AI Progress" 공식 계정은 대규모 그래프 학습, 인과 추론, 지식 그래프, 대형 모델 및 기타 기술 분야를 다루는 신뢰할 수 있는 최신 인공 지능 기술의 보급과 오픈 소스 기술 육성에 전념하고 있습니다. QR 코드를 스캔하여 팔로우하고 더 많은 AI 정보를 잠금해제하세요~