【AI日记】24.10.28 大模型推理能力初探

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】


工作

  • 工作1
    • 内容:投简历
    • 时间:1小时
    • 收获:再次被问到项目经验,未来做项目是重中之重
    • 说明:不过我还不急着做项目,我需要先判断天下大势和抓住关键,才知道应该做什么项目和如何去做这个项目,而不是随便选一个项目来做,我认为很多项目失败的根本原因是他们花在思考和研究做什么项目上的时间太少了,很多关键的问题都没有想明白就开始做了。
  • 工作2
    • 内容:初步研究了大模型的推理能力
    • 时间:2小时
    • 收获:关键可能是因果推理能力
  • 工作3
    • 内容:初步研究了大模型的因果推理能力
    • 时间:1小时
  • 工作4
    • 内容:初步研究了大模型的数学推理能力
    • 时间:1小时
  • 工作5
    • 内容:看AI大佬的访谈
    • 时间:1.5小时
    • 说明:任何人都值得我学习,更何况是AI大佬

明日工作计划

  • 进一步研究大模型的因果推理能力
  • 研究o1的推理能力和不足,尤其是因果推理能力
  • 目的:尝试搞清楚最先进大模型的因果推理能力水平、不足的根源和改进方向

备选:

  • 进一步研究大模型的数学推理能力
  • 看下苹果这篇论文,搞明白大模型真实的数学推理能力:GSM-symbolic:understanding the limitation of mathematical reasoning in LLM
  • 看下scaling law 论文,搞明白scaling的到底是哪方面的(推理)能力

读书

书名:權力與進步
时间:1.5小时
目的:了解科技进步(包括AI)对人类社会的负面影响及其应对措施
评估:继续(我分为三类:继续、暂停、放弃)

猜你喜欢

转载自blog.csdn.net/weixin_43221845/article/details/143291840