智源AI日报(2022-08-30): 华为谢凌曦:关于视觉识别领域发展的个人观点

【智源AI日报】每天速读5分钟,AI要事不错过!欢迎点击这里,关注并订阅智源AI日报。

观点 | 华为谢凌曦:关于视觉识别领域发展的个人观点
看点:从计算机视觉和自然语言处理(人工智能中两个最受关注的研究方向)的区别开始谈起,引出图像信号的三个根本性质:信息稀疏性、域间差异性、无限粒度性,并将它们与几个重要的研究方向相对应。

盘点 | 未来十年,AI 语音识别将朝着这五个方向发展 
看点:多语言ASR模型、丰富的标准化输出对象、面向所有人的大规模 ASR、人机协同、负责任的 ASR

解读 | ICLR Spotlight :Facebook提出无损INT8优化器,单机可以跑千亿参数模型了? 
看点:只需更改两行代码,单机即可训练千亿模型。

经验 | Tips:如何对样本不均衡“一顿操作” 
看点:总结了一些常用的针对样本不平均问题的解决方法,如“重采样”、“Tomek links”等

资讯 | ECCV 2022论文,CMU提出首个快速知识蒸馏的视觉框架:ResNet50 80.1%精度,训练加速30% 
看点:是目前精度和速度双双最优的知识蒸馏策略之一,代码和模型已全部开源。

模型 | 加上Web UI,文本-图像模型Stable Diffusion变身绘图工具,生成艺术大片 
看点:这个项目,使得没有系统学习UI知识的朋友,也可以上手操作。

解读 | 同济&优图&西南交大提出用频域信息辅助空域信息,进行准确伪装目标检测 
看点:在三个广泛使用的COD数据集上的综合实验表明,该方法显著优于其他最先进的方法。

下载 | 数学推导详解DL理论!普林斯顿最新127页pdf《深度学习理论》简明书,带你理解深度学习优化、泛化等 
看点:以普林斯顿大学2019年秋季的研究生研讨会为基础,同时与高等研究所的优化、统计和机器学习特别年相结合。

课程 | 康奈尔大学最新《机器人学习与决策》课程 
看点:本课程侧重于算法,从现实世界的机器人经验教训,并具有强大的编程组件。

模型 | ECCV 2022论文:大模型?小模型?我全都要:知识的拆分与解耦!
看点:把一个大模型分解成为得到多个小模型,可极大拓展模型的扩展性,也能保证了任务之间的可解释性。

猜你喜欢

转载自blog.csdn.net/lionkingcz/article/details/126603441