百度正式发布文心大模型 4.5 和文心大模型 X1，使用体验如何？

文心大模型 4.5
多模态理解能力强：作为百度首个原生多模态大模型，它能综合理解文字、图片、音频、视频等内容。可以分析图表、理解梗图、解析歌曲和电影等，例如在分析试卷中的图文题目时，能准确理解并给出详细解题步骤。不过在图片识别方面也存在一些小失误，如在识别《哪吒》电影截图中的角色时，一开始出现错误，但后续能正确判断。
文本和逻辑推理出色：在多项基准测试中成绩优于 GPT4.5、DeepSeek - V3 等，其去幻觉、逻辑推理以及代码能力都有显著增强。能够处理复杂的文本任务，如生成高质量的文本内容、进行文本摘要等。
响应速度较快：在实际使用中，能够快速响应用户的请求，及时给出回答。例如在让它锐评 315 晚会等话题时，能迅速反馈准确的信息。
价格优势明显：其 API 调用价格仅为 GPT4.5 的 1%，输入价格为 0.004 元 / 千 tokens，输出 0.016 元 / 千 tokens，对于需要大量使用模型的用户来说，成本大幅降低。
文心大模型 X1
深度思考能力强：作为深度思考模型，具备 “长思维链”，擅长中文知识问答、文学创作、逻辑推理等。在进行文学创作时，能够提供有创意和深度的内容，例如在重构《滕王阁序》经典段落时，展现出高阶认知推理能力，融入唐代文人轶事，保留了原文意境的同时实现了创新。
多模态与工具调用丰富：增加了多模态能力和多工具调用，能理解和生成图片，还能调用工具生成代码、图表等。如在模拟理财规划时，能调用 “商业信息查询” 工具对比基金费率，并提醒存应急金，还能自动生成树状图梳理剧情线，为自媒体博主和创作者提供了便利。
推理时间较长：在使用过程中，X1 的推理时间有时会比较长，甚至可能会耗费掉 token。例如在回答一些复杂问题或进行多步骤推理时，需要等待较长时间才能得到结果。
工具调用存在优化空间：虽然支持多种工具调用，但在实际使用中还存在一些问题。如在生成 HTML 代码时，开启联网和工具后，会出现调用 Python 编辑器导致没有生成代码的情况，工具调用的稳定性和准确性还有待提高。
价格实惠：定价为输入 0.002 元 / 千 tokens，输出 0.008 元 / 千 tokens，约为 DeepSeek - R1 价格的一半，具有较高的性价比。

百度正式发布文心大模型 4.5 和文心大模型 X1，使用体验如何？

猜你喜欢