开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。

# 2024.5.29

今日要点

《OpenHarmony设备统一互联技术标准》发布

据悉，除了统一物模型，该标准还定义了一系列其他标准，主要包括接入与控制接口、投屏、文件分享、符合性测试规范等标准。接入与控制接口规范从系统架构视角详细定义了设备发现配网、注册登录、安全认证，管理控制等环节的具体流程及接口。投屏和文件分享定义了多媒体设备间文件、视频等数据传输、加密、共享等接口。符合性测试规范对各个规范中技术要求和指标测试方法和步骤进行严格定义，确保标准规范的遵从和一致性。

TiDB 8.1 LTS 发版

TiDB 8.1 LTS 通过一系列创新功能，增强了大型集群的稳定性和运维能力，尤其针对应用多租户功能和 SaaS 类型用户场景做了稳定性和性能的多方面增强。

开源Llama3v全新发布：对打GPT4-V，成本500美元

与 GPT-4V 相当的 Llama 3-V 来了。它是一个只用 500 美元成本构建的基于 Llama3 的多模态模型。

在几乎所有指标上，Llama 3-V 的性能与GPT-4V、Gemini Ultra和Claude Opus等规模大100倍的闭源模型相当。唯一的例外是MMMU（多模态记忆任务），Llama 3-V略逊一筹。

Llama3-V 的架构结合了视觉模型和语言模型，由 Llama3 8B 和 siglip-so400m 驱动。

YC投资的开源代码版ChatGPT

Bloop 被视为专注代码的 ChatGPT，在2021年夏季获得了 YC 投资。它是一个基于 Rust 编写的、支持 MacOS/Linux/Windows 三端的 AI 代码搜索引擎，目前在 GitHub 上获得了 8.6K Star。

Bloop 的功能包括：

1. 解释代码
2. 基于上下文写代码
3. 自然语言进行代码搜索定位
4. 修复问题
5. 多语言
6. 对代码进行重复度检测和去重

Bloop 目前支持 10+ 编程语言，支持同步本地和 GitHub 存储库。

GitHub 地址：https://github.com/BloopAI/bloop

今日观察

社交观察

突破开源语音 TTS 天花板

这个 ChatTTS 是专门为对话场景设计的语音生成模型，主要用于 LLM 助手对话任务、对话语音以及视频介绍等。不但支持中英文混合文本合成语音，更重要音色表现非常强，能达到真假难辨程度！

GitHub：github.com/2noise/ChatTTS

- 微博 GitHubDaily

CB Insights列出了6个趋势：
1. AI 伴侣初创公司 Character AI 在移动端的使用量紧随 ChatGPT 之后。
—— AI 伴侣可能是第二重要的消费者 AI 应用场景。
2. Character AI的400万用户中有一半以上年龄在24岁以下。
—— Z世代对AI伴侣的接受度非常高，随着大语言模型 (LLM) 能力的提升，这种接受度将会更强。
3. 在智能手机时代，Z世代与朋友面对面相处的时间大幅减少
4. 越来越多的人会觉得孤独
5. 越来越多的美国成年人没有配偶或伴侣
6. 年轻人的性生活越来越少

-微博 宝玉xp

杨立昆的卷积神经网络就是强化信念的一盏明灯

论AI方面的贡献，如果没有杨等三巨头长达20年以来的坚持的话，哪来后来的AI革命？而在那段「漫漫长夜」时期，杨的卷积神经网络就是强化信念的一盏明灯。再后来，FB的Llama系列模型及其开源理念也造福了很多有志于投身这股AI浪潮的人。马一龙要在这方面跟杨立昆比贡献吗？

-微博 陈晓鸣在湾区

大模型降价背后，国产大模型的竞争逻辑变了

大模型API降价给行业内卷敲响了警钟，单纯的堆参数、拼算力、价格，并不是行业健康发展的最优解，未来只有差异化才有出路。与所有的行业一样，从混沌初开到进入大混战，多是以惨烈的价格战作为标志。如今大模型经过狂热的“百模大战”之后，价格战初步显现，同质化竞争的恶果逐步出现。

- 自媒体刘旷

大模型价格战下的推理优化

在大模型架构层面去从系统的角度考虑推理的算力优化, 无论是MLA的工作还是Dense-MoE或者是Google MoD, Medusa, SplitWise这样的工作,再来反推寻找出一个合适的大模型架构, 只可惜大多数的草台班子大概只知道有什么抄什么, 或者利用泄漏的数据打个榜,天天自嗨超越GPT-N, 摊手

- 微信 zartbot

媒体观察

人工智能现在有多“像人”？

美国斯坦福大学计算机科学系教授李飞飞日前也在美国《时代》周刊刊文称，在通往通用智能的道路上，“感觉”是至关重要的一步，即拥有主观体验的能力。目前大模型并没有像人类一样的“感觉”，它可以说“自己脚趾痛”，尽管它根本就没有脚趾，它只是一个编码在硅芯片上的数学模型。

“我们还没有实现有感觉的人工智能，而更大的语言模型也无法实现这一目标。如果想在人工智能系统中重现这一现象，就需要更好理解感觉是如何在拥有实体的生物系统中产生的。”她说。

- 新华社

Mistral AI以开源模型瞄准美国市场

欧洲生成人工智能工具开发商法国Mistral AI已将目光投向美国市场。据彭博社周二（5 月 28 日）报道，这家初创公司本月聘请了Foursquare前首席营收官Marjorie Janiewicz担任其首位美国总经理。

Janiewicz 在报告中表示，Mistral AI 的目标是利用企业日益增长的需求，这些企业寻求替代人工智能模型以及OpenAI和谷歌等大型科技公司提供的服务的方案。

据报道，该公司进军美国市场的势头正在增强。这家初创公司计划招聘更多员工，并且已经在那些希望在 AI 解决方案中拥有更多选择和灵活性的企业中获得了关注。

Mistral的开源方法（底层代码是公开共享和可定制的）被视为比竞争对手提供的封闭系统更安全、更通用的替代方案。

- 鞭牛士Bianews

更高效的Scaling技术：MoE架构为何获得大模型厂商青睐？

En 2023, après une année de roulage effréné, le grand modèle se heurte rapidement à un goulot d'étranglement. En raison de l'existence de la loi de mise à l'échelle (ce qui signifie qu'à mesure que le nombre de paramètres augmente, les performances du modèle augmenteront également), les capacités des grands modèles ne semblent pas avoir de limite supérieure. Cependant, les données et la puissance de calcul utilisées pour entraîner les grands modèles sont très importantes. limité. Dans ce contexte, l’industrie doit explorer des architectures de modèles plus efficaces, et l’émergence de l’architecture MoE (Mixture of Experts) a donné de l’espoir à l’industrie.

- Héraut des affaires du 21e siècle

La Silicon Valley a son propre Lu Xun ! Le magnat de l'IA, LeCun, continue de devenir fou et tout le monde, de Musk à OpenAI, a été critiqué

Bien que Llama ait été initialement développé par FAIR, dirigé par LeCun, il a désormais été confié au département GenAI, qui se concentre sur le développement de technologies et de produits, tandis que FAIR se concentre sur l'objectif à long terme : développer de nouvelles architectures et méthodes d'IA capables d'atteindre intelligence au niveau humain.

Beaucoup de gens pensent que Yann LeCun aime faire des remarques controversées, mais le contexte le plus important est celui des problèmes actuels liés au développement futur de l'IA. Yann LeCun, l’un des noms les plus connus de l’intelligence artificielle, se sent quelque peu obligé de monter au créneau et d’apporter quelques éclaircissements sur ce domaine controversé.

LeCun a déclaré que la mise en œuvre de l'AGI n'est pas une question de conception de produit ni même une question de développement technologique, mais est dans une large mesure une question scientifique.

Si cette affirmation est vraie, alors nous avons évidemment besoin de plus de « Lu Xuns » comme lui sur la voie de l’exploration de l’AGI.

-Pinwan

Y a-t-il un préjugé sexiste dans les « personnes qui réussissent » par défaut en tant que modèles masculins ?

Le professeur Qiu Xipeng a observé les progrès des grands modèles au cours des deux dernières années grâce aux données. Pour la formation de grands modèles, l'alignement des valeurs est un élément important, et la cible est la valeur qui lui est attribuée par les humains. Cela inclut également les questions de genre. Cependant, le nuage de mots formé par l'analyse des mots montre également l'impression inhérente à l'AIGC (intelligence artificielle générative). Par exemple, les mots décrivant les hommes se concentrent sur le monde, la découverte, la vie, la simplicité, etc. mari, défi, mère et autres mots.

Qiu Xipeng a déclaré : « Dans la recherche réelle, la correction du genre du corpus nécessite un investissement très important. L'alignement du modèle doit être effectué et le résultat du modèle est ajusté pour produire un contenu plus positif grâce à des méthodes telles que la modélisation des préférences humaines et l'alignement des valeurs.

- Réseau d'information Jining

La recommandation du jour

Projets open source

vuejs/outils-langage

https://github.com/vuejs/langage-tools

Volar est un plug-in VS Code pour Vue et un outil de support officiel IDE/TS pour Vue. En plus d'intégrer des fonctions liées à Vetur, telles que la mise en évidence, les invites de syntaxe, etc., il inclut également des fonctions uniques.

Blogue quotidien

Application de dizaines de milliards d'images à grande échelle dans des scénarios publicitaires

Cet article utilise des éléments de recommandation de recherche pour combler la faible offre d'annonces de recherche à emporter afin d'améliorer l'efficacité de la monétisation du trafic. Nous proposons la voie d'évolution de la technologie de modélisation en ligne de grandes images hétérogènes multi-scénarios à emporter et de la technologie de modélisation en ligne de grandes images hétérogènes pour résoudre les défis multicanaux et en temps réel des activités de recherche et de recommandation de plats à emporter. Les résultats pertinents ont été publiés dans un article lors de la conférence CIKM2023. La plateforme commune d'apprentissage automatique crée une formation graphique à grande échelle et un moteur d'inférence en ligne GraphET pour répondre aux besoins de multiples implémentations commerciales avec près de dizaines de milliards d'arêtes et de structures graphiques complexes.

Commentaires sur l'événement

La première base de données open source massivement parallèle au monde - le dépôt GitHub de Greenplum a soudainement reçu "404". Broadcom va-t-il facturer sa source fermée ?

La célèbre base de données MPP open source Greenplum a modifié les autorisations d'accès à l'entrepôt de code source pour prendre uniquement en charge la "lecture seule" et a effacé toutes les informations originales sur les branches, balises, pr, problèmes et autres. La bannière de notification indique que le référentiel est entré dans le statut d'archive le 5.25.

Revoir

En tant que base de données MPP open source bien connue, le référentiel de code source de Greenplum est devenu des informations connexes en lecture seule et effacées, ce qui pourrait constituer un coup dur pour la communauté open source qui s'appuie sur la base de données. Les membres de la communauté et les contributeurs peuvent se sentir incertains quant à l'avenir du projet, soulevant des questions sur l'orientation future et la maintenance de Greenplum.

Pour les utilisateurs et les entreprises utilisant Greenplum Database, ce changement peut affecter la continuité de leurs activités et leur choix technologique. Les modifications apportées à Greenplum pourraient avoir des effets d'entraînement sur d'autres projets open source, en particulier ceux qui dépendent de Greenplum ou sont maintenus par la même société.

S'il est réellement affecté par l'acquisition de VMware par Broadcom, ce sera un autre exemple de projets open source se tournant vers la commercialisation, ce qui pourrait provoquer mécontentement et résistance au sein de la communauté open source. L'incident met également en évidence la tension entre les projets open source et les intérêts commerciaux. Si Greenplum devenait une source fermée, cela pourrait avoir un impact négatif sur la culture open source et réduire la confiance de la communauté et sa participation aux projets open source.

Des recherches montrent que les ingénieurs en IA gagnent bien plus que leurs pairs

Les données de l'enquête sur les salaires des ingénieurs en IA pour le premier trimestre 2024 publiées par Levels.fyi ont souligné qu'il existe une différence significative entre les salaires des ingénieurs logiciels spécialisés dans l'IA et ceux des ingénieurs logiciels non IA.

Revoir

Le salaire élevé des ingénieurs en IA reflète la forte demande du marché pour des compétences professionnelles en IA. Alors que la technologie de l’IA continue de se développer et d’être appliquée, les entreprises sont prêtes à payer plus cher pour les talents possédant ces compétences. À mesure que de plus en plus d’entreprises s’impliquent dans le domaine de l’IA, la concurrence pour les ingénieurs en IA s’intensifie. Pour attirer et retenir les meilleurs talents, les entreprises doivent offrir une rémunération plus compétitive.

Du niveau débutant au niveau supérieur, les ingénieurs en IA sont mieux payés que les ingénieurs non-IA, ce qui indique que les compétences en IA sont très appréciées à toutes les étapes du développement de carrière. À mesure que le marché des talents en IA mûrit, les entreprises peuvent ajuster leurs stratégies de recrutement et de rémunération pour rapprocher les salaires des normes du marché et réduire l'écart salarial entre les postes IA et non IA.

Des salaires élevés peuvent inciter davantage d’étudiants et de professionnels à se consacrer à l’apprentissage et au développement de carrière dans le domaine de l’IA, affectant ainsi l’orientation de l’éducation et la planification de carrière. Les entreprises doivent reconnaître l’importance des talents en IA et réfléchir aux moyens d’attirer, de développer et de retenir ces talents dans la planification stratégique pour rester compétitives.

L'ancien chef de la sécurité d'OpenAI rejoint son rival Anthropic

Plus tôt ce mois-ci, Jan Leike, ancien directeur de la sécurité d'OpenAI et chef de l'équipe Superalignment, a annoncé sa démission d'OpenAI et a publiquement critiqué les problèmes de sécurité de l'entreprise. Maintenant, Leike a annoncé qu'il avait rejoint le concurrent d'OpenAI Anthropic et qu'il dirigerait une nouvelle équipe de « super alignement ».

Revoir

En tant que directeur de la sécurité d'OpenAI et chef d'équipe super aligné, l'arrivée de Leike pourrait renforcer la recherche et le développement d'Anthropic dans le domaine de la sécurité de l'IA, intensifiant ainsi la concurrence dans le domaine de la sécurité de l'IA. Pendant ce temps, Leike a choisi de rejoindre un concurrent après avoir publiquement critiqué les problèmes de sécurité d'OpenAI, une dynamique qui pourrait affecter le moral et la loyauté des autres employés.

Cette décision pourrait avoir un certain impact sur la réputation d'OpenAI. Dans le même temps, OpenAI doit réfléchir à la manière de maintenir son leadership dans le domaine de l'IA après la fuite des cerveaux.

De plus, les actions et remarques de Leike pourraient accroître l’attention du public sur les questions d’éthique et de gouvernance de l’IA. À mesure que la technologie de l’IA se développe, garantir sa sécurité et son éthique devient de plus en plus important. Le nouveau rôle de Leike chez Anthropic stimulera probablement l'innovation de l'entreprise en matière de sécurité et d'éthique de l'IA, ce qui est un signe positif pour l'industrie dans son ensemble.

L'incident peut être révélateur de l'intensité de la bataille pour les talents au sein de l'industrie de l'IA, ainsi que des ajustements stratégiques entre les entreprises pour obtenir un avantage concurrentiel.

La voix de l'open source

opinion des médias

Il n’est pas facile d’utiliser l’IA même si vous la payez, car elle n’a pas de « système d’exploitation »

Malgré l’essor actuel de la technologie et des prix, seul un nombre limité d’entreprises peuvent faire bon usage des capacités de l’IA. Au stade actuel, la mise en œuvre de grands modèles légèrement « tarifés mais non commercialisables » est un problème évident.

-Parc des Geeks

Dernière interview de Musk : Vous vous inquiétez de la valeur de l'intelligence artificielle ; pas besoin de travailler à l'ère de l'IA, tout le monde a des revenus élevés ?

La tendance à un politiquement correct excessif m’inquiète quant à l’avenir de l’intelligence artificielle. Je pense que cette tendance est très dangereuse.

Pour xAI, notre objectif est de rechercher la vérité absolue, même si la vérité est impopulaire.

-Réflexion financière

Pourquoi l’art de l’IA a-t-il toujours l’air plutôt mauvais ?

Cependant, au fil du temps, de plus en plus de gens commencent à découvrir qu’il y a un vide derrière les œuvres d’art IA. Nous ne pouvons pas voir la représentation délicate de la vie tranquille de Vermeer dans les peintures d'AI, ni la purification et le passage du réalisme à l'abstraction de Picasso.

-Aifan'er

Point de vue de l'utilisateur

La première base de données open source massivement parallèle au monde - le dépôt GitHub de Greenplum a soudainement reçu "404". Broadcom va-t-il facturer sa source fermée ?

Point de vue 1 : Broadcom est vraiment un paraquat dans l'industrie. Si le capital opérationnel avait vraiment englouti Qualcomm à l'époque, je ne peux pas imaginer à quoi ressemblerait le marché mobile aujourd'hui.

Point de vue 2 : Chen, le patron de Broadcom, se lance dans des fusions et acquisitions de type capital financier. VMware est open source, alors pourquoi s'embêter à commercialiser ce produit de base de données open source ?

Point de vue 3 : VMware n'est pas open source, il n'est gratuit que pour les utilisateurs individuels

Point de vue 4 : Ce serait très amusant si un jour le framework Spring était intégré dans la tarification des entreprises.

Avis 5 : Haha, je n'ose jamais utiliser cette base de données

Point de vue 6 : Si le propriétaire change, démolir la maison immédiatement

Tencent App Store et Microsoft Store ont conclu une coopération, Windows peut exécuter directement des applications mobiles

Point de vue 1 : Amazon : Si vous souhaitez remplacer quelqu'un, dites-le

Point de vue 2 : L'expérience d'utilisation de wsa est trop mauvaise.

Point de vue 3 : émulateur Android de la marque Tencent

Pourquoi JavaScript, Python et Java restent le premier choix des développeurs

Point de vue : 1 : L’écologie joue un rôle déterminant

Point de vue 2 : Si le langage n’est pas facile à utiliser, il n’y aura pas d’écologie.

Opinion 3 : « De plus, Java se classe au premier rang non seulement en raison de sa force historique. Java reçoit des mises à jour majeures de fonctionnalités et de performances tous les six mois, ainsi que des améliorations mineures, des corrections de bogues et des mises à jour de sécurité. "Cependant, beaucoup de gens ne le font pas particulièrement. se soucient des nouvelles fonctionnalités qu'il offre, et même de nombreuses entreprises sont dans le millénaire Java8.

[Comparaison du framework Java orm] Treize nouvelles comparaisons du framework qdbc

Opinion : 1 : mybatis-mp est très simple à utiliser et constitue un nouveau framework ORM qui mérite d'être utilisé.

Point de vue 2 : Chacun a ses avantages et ses inconvénients. Un développement secondaire basé sur mybatis peut en effet économiser beaucoup d'adaptations, comme donner la priorité à Solon.

Point de vue 3 : Le XML de Mybatis est vraiment long et malodorant. Nous sommes déjà en 2024, et vous devez encore définir manuellement le mappage des résultats.

Point de vue 4 : En fait, vous n’avez pas besoin de le paramétrer

Point de vue 5 : mybatis-mp peut être ORM et XML, et la connexion à la table est un petit cas

Point de vue 6 : Il est recommandé d'ajouter jooq

Avis 7 : Après recherche, cela semble trop lourd et nécessite beaucoup de choses pour être généré.

---FIN---

Enfin, vous êtes invités à scanner le code QR pour télécharger « l'application Open Source China » et lire d'énormes rapports techniques et partages de programmeurs et de geeks !