文心大模型 4.5
多模态理解能力强:作为百度首个原生多模态大模型,它能综合理解文字、图片、音频、视频等内容。可以分析图表、理解梗图、解析歌曲和电影等,例如在分析试卷中的图文题目时,能准确理解并给出详细解题步骤。不过在图片识别方面也存在一些小失误,如在识别《哪吒》电影截图中的角色时,一开始出现错误,但后续能正确判断。
文本和逻辑推理出色:在多项基准测试中成绩优于 GPT4.5、DeepSeek - V3 等,其去幻觉、逻辑推理以及代码能力都有显著增强。能够处理复杂的文本任务,如生成高质量的文本内容、进行文本摘要等。
响应速度较快:在实际使用中,能够快速响应用户的请求,及时给出回答。例如在让它锐评 315 晚会等话题时,能迅速反馈准确的信息。
价格优势明显:其 API 调用价格仅为 GPT4.5 的 1%,输入价格为 0.004 元 / 千 tokens,输出 0.016 元 / 千 tokens,对于需要大量使用模型的用户来说,成本大幅降低。
文心大模型 X1
深度思考能力强:作为深度思考模型,具备 “长思维链”,擅长中文知识问答、文学创作、逻辑推理等。在进行文学创作时,能够提供有创意和深度的内容,例如在重构《滕王阁序》经典段落时,展现出高阶认知推理能力,融入唐代文人轶事,保留了原文意境的同时实现了创新。
多模态与工具调用丰富:增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等。如在模拟理财规划时,能调用 “商业信息查询” 工具对比基金费率,并提醒存应急金,还能自动生成树状图梳理剧情线,为自媒体博主和创作者提供了便利。
推理时间较长:在使用过程中,X1 的推理时间有时会比较长,甚至可能会耗费掉 token。例如在回答一些复杂问题或进行多步骤推理时,需要等待较长时间才能得到结果。
工具调用存在优化空间:虽然支持多种工具调用,但在实际使用中还存在一些问题。如在生成 HTML 代码时,开启联网和工具后,会出现调用 Python 编辑器导致没有生成代码的情况,工具调用的稳定性和准确性还有待提高。
价格实惠:定价为输入 0.002 元 / 千 tokens,输出 0.008 元 / 千 tokens,约为 DeepSeek - R1 价格的一半,具有较高的性价比。
百度正式发布文心大模型 4.5 和文心大模型 X1,使用体验如何?
猜你喜欢
转载自blog.csdn.net/sanhuyun/article/details/146989602
今日推荐
周排行