AI应用中的若干思考

前文介绍了人工智能(AI )的不能https://blog.csdn.net/foreseerwang/article/details/80531756 ),这里继续介绍一些学习和应用AI 过程中的感想和心得。
 
个人理解,AI 的应用目的是捕捉大量繁杂干扰下的数据中的规律。暂时不考虑数据是否大量的问题,这里还有两个关键词:干扰、规律。干扰是不需要的、随机化的影响因素;规律则是希望捕捉的影响因素带来的结果。通常来说,干扰和规律是很难区分的,否则直接剔除干扰只剩规律岂不美哉,数据训练时也就不会有“过拟合”的问题了。
 
在应用AI 解决实际问题时一定要想清楚这两个关键词,想清楚哪些是影响需要的规律的因素,哪些是干扰因素。在规律方面,一是千万不要想着去解决没有规律的问题,譬如彩票这种真随机事件(当然,中国彩票可能要归为影响因素不可知的问题);二是要把可能的影响因素都考虑进来,这个在后面还会详细介绍。在干扰方面,要说的是,如果没有繁杂干扰,建议优先考虑确定性方法,而不是AI ,确定性方法比AI 这种本质是函数拟合的技术更为简单快捷,不要为了AI AI
 
基于这两个关键词,对应到无线通信领域,无线传播和应用层这两大方面可能更适合使用AI 技术分析和解决;而中间的各层协议可能更适合使用确定性方法。
 
现在来考虑影响因素的问题。毫无疑问,如果希望准确捕捉规律,当然需要把所有影响因素都考虑进去,然后针对这样一个封闭的问题,依靠AI 强大的函数拟合能力把规律捕捉出来。但是,愿望是美好的,现实是残酷的。在实际工作中,很难准确圈定出所有的影响因素,即使圈定出来了,还可能存在无法获取定量数据的困难。那该如何处理呢?首先,经过充分分析之后,需要了解并考虑最主要的那些影响因素。如果这些因素没能完全纳入进来,放弃不失为一种好的选择;如果仍然不得不要解决这个问题,那就要想清楚,这种情况下AI 模型的局限性,及其对应的使用场景。在一些重要因素未能考虑的情况下,过分强调模型的强大可能会被光速打脸。
 
针对个人工作内容——无线蜂窝通信来说,寻找合适的、封闭的问题就极为重要。例如,现在业内很多同行关注的无线参数智能优化问题,可能就很难封闭:各个小区之间互相耦合、互相影响,大量需要配置的参数无法简单隔离。首先从单小区参数或明确涉及少量小区的参数入手,可能才是明智之举。此外,如果是涉及空口传输的问题,地理环境和用户分布通常也是影响规律是否准确的重要因素,需要考虑进来。
 
再举个例子,人们从来没有停止过应用AI 预测股市的探索。对于中国股市,从来都不只是一个金融问题。若想把握股市大势,可能还需要考虑政策因素、情绪问题。这就意味着,起码需要把每天的几大日报进行深度分析,提取政策的细微变化趋势;及时掌握网上舆论情况,把握民众情绪情况。如此等等。如果不做大势,只做短期微观分析是否可行?当然是可行的,现实中已经有大量此类算法和工具。但是,在应用中可能需要注意两点:一是基于训练数据获得的规律是否适用于预测未来数据?如果模型中未能考虑的影响因素发生了变化,那规律可能也会发生变化。一些模型回测表现很好、实操欠佳可能就是这个原因;二是,即使模型在一段时间内运行良好,也要保持警惕,做好止损。系统是开放的,可能很长时间没有之前未能考虑的影响输入,但某个突发因素或某种大环境的变化就会导致规律发生变化,进而产生不可控的亏损。
 
最后想说的观点是,干扰因素的存在以及AI 的函数拟合特点决定了它是一种近似方法,追求的是一种统计和概率上的准确,而不是处处精准。训练数据处处精准其实是过拟合的表现。这就意味着,作为统计中的个体,可能还达不到大数统计的程度,它的预测很可能是存在偏差的。这种偏差并不是不准确,而是干扰因素影响的结果,更是一种概率分布的必然结果。当然,强调这个观点并不是说就要忽视个体。考虑先验的贝叶斯学习、迁移学习等等都是可能提升个体预测准确度的尝试。
 
基于这个观点,要对AI 的作用有正确的预期。例如,自适应学习是目前教育领域炙手可热的方向。AI 技术的应用当然可以从总体上把握学情、提升学习效果;但是,具体到每个学生的情况,可能偏差会很大。还有一些购物网站的智能推荐,用户个体有时会觉得推荐的商品不够相关,甚至逻辑有些可笑。这完全可以理解,单个用户的数据量太少而干扰因素太多,不太可能高度拟合准确。但从网站总体来说,考虑的是用户总体的推荐匹配度(比例或概率),哪怕只带来一或数个百分点的交易金额提升,都是非常可观的成果。
 
总结一下,在应用AI 解决实际问题时,一定要对问题本身有清醒、准确的分析和认识,而不是上来就套用模型。虽然有AI 先驱提出深度学习不做人工特征提取便可解决所有问题。但很显然这句话有明显的夸张成分,而且他们所拥有的资源也不是普通用户在实际工作中所能想象的。必要的问题分析和预处理可能使工作事半功倍。
 
最后,其实个人更喜欢用机器学习而不是人工智能这个名词。

猜你喜欢

转载自blog.csdn.net/foreseerwang/article/details/80755228
今日推荐