机器学习导论(张志华):条件期望

前言 这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。 正文 这节课主要讲的是常用统计分布里的条件期望。 x‾=1n∗i=1nai \overline{x} =\frac{1}{n}* \quad {i=1}{n} a_i x=n1​∗i=1nai​ 样本矩阵 p(uk−σ1) p(u_k -\sigma_1) p(uk​−σ1​) 总体...
分类: 其他 发布时间: 09-25 23:52 阅读次数: 0

机器学习的明天——迁移学习

          上个月,柯洁大战AlphaGo落下帷幕,19岁的男孩少有地在比赛中落泪,赛后他为我们留下一句话,柯洁说“AlphaGo”看上去像神一样的存在,好像他是无懈可击的···         的确,DeepMind创造的AlphaGo让人为之赞叹,让柯洁为之疯狂。而背后,从机器学习的角度,充分证明了深度强化学习和大数据的重要意义。DeepMind就是将深度学习应用到强化学习的范例,...
分类: 其他 发布时间: 09-25 23:51 阅读次数: 0

什么是迁移学习?迁移学习的实现方法与工具分析

 深度学习主要强调的是特征,强化学习主要强调的是反馈,而迁移学习主要强调的是适应。 之前介绍过人工智能之机器学习算法有前5大类内容,具体请参见相关文章。今天我们重点探讨一下第6类--迁移学习(Transfer Learning)。^_^ 传统的机器学习是种瓜得瓜,种豆得豆,而迁移学习可以举一反三,投桃报李。 人工智能竞争,从算法模型的研发竞争,转向数据和数据质量的竞争,这些成功的模型和算法主...
分类: 其他 发布时间: 09-25 23:51 阅读次数: 0

GMIS 2017大会杨强演讲:迁移学习的挑战和六大突破点

转自:2017-05-28 · 机器之心     5 月 28 日,机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)进入第二天,全天议程中最受关注的是多位重要嘉宾出席的领袖峰会,包括《人工智能:一种现代方法》的作者 Stuart Russell、第四范式联合创始人兼首席科学家杨强、科大讯飞执行总裁兼消费者事业群总裁胡郁、阿尔伯塔大学教授及计算机围棋顶级专家Martin Müll...
分类: 其他 发布时间: 09-25 23:51 阅读次数: 0

小数据、高准确率的文本分类:利用迁移学习创造通用语言模型

作者 | Jeremy Howard、Sebastian Ruder 译者 | Liu Zhiyong 编辑 | Natalie,Vincent AI 前线导读:本文是对 Fast.ai 新论文的介绍,面向大众读者,阐述了如何自动对文档进行分类,同时比以前的方法具有更高的准确率,以及更少的数据需求。本文将用简单的术语来解释:自然语言处理、文本分类、迁移学习、语言建模;以及这个新的方法是如何将...
分类: 其他 发布时间: 09-25 23:51 阅读次数: 0

为什么我们需要研究迁移学习?

  首先,生活上我们遇到更多的是小数据,而在小数据上学习的模型,才是真正的智能。 第二,我们希望构建的系统不仅在那个领域能够发挥作用,在其周边也可以发挥作用。即我们希望系统是可靠的,其可以举一反三和融会贯通,这也是我们赋予智慧的一种定义。 第三,我们希望更重要的是如何能够把一个通用的系统加上个人的小数据,而迁移到个人的场景当中去,因此我们可以向个性化方向发展。迁移学习就是一个必不可少的工具。...
分类: 其他 发布时间: 09-25 23:50 阅读次数: 0

迁移学习和数据扩充(附代码)

一 迁移学习 如果你要做一个计算机视觉的应用,相比于从头训练权重,或者说从随机初始化权重开始,如果你下载别人已经训练好网络结构的权重,你通常能够进展的相当快,用这个作为预训练,然后转换到你感兴趣的任务上。计算机视觉的研究社区非常喜欢把许多数据集上传到网上,如果你听说过,比如 ImageNet, 或者 MS COCO,或者 Pascal 类型的数据集,这些都是不同数据集的名字,它们都是由大家上传到...
分类: 其他 发布时间: 09-25 23:50 阅读次数: 0

SVD在推荐系统中的推导及应用-简单明了

参考自:http://www.igvita.com/2007/01/15/svd-recommendation-system-in-ruby/ 其实说参考也不准确,准确地说应该是半翻译半学习笔记。 仔细整理一遍,感觉还是收获很大的。 线性代数相关知识: 任意一个M*N的矩阵A(M行*N列,M>N),可以被写成三个矩阵的乘积: 1. U:(M行M列的列正交矩阵) 2. S:(M*N...
分类: 其他 发布时间: 09-25 23:49 阅读次数: 0

矩阵分解(MF)方法及代码

一、基于投影梯度法的非负矩阵分解 论文:Projected gradient methods for non-negative matrix factorization  代码:Matlab及Python源码 二、基于类牛顿法的最小二乘矩阵近似解法 论文:Fast Newton-type Methods for the Least Squares Nonnegative Matrix App...
分类: 其他 发布时间: 09-25 23:49 阅读次数: 0

Coursera公开课笔记: 斯坦福大学机器学习第七课“正则化(Regularization)”

斯坦福大学机器学习第七课"正则化“学习笔记,本次课程主要包括4部分: 1)  The Problem of Overfitting(过拟合问题) 2)  Cost Function(成本函数) 3)  Regularized Linear Regression(线性回归的正则化) 4)  Regularized Logistic Regression(逻辑回归的正则化) 以下是每一部分的...
分类: 其他 发布时间: 09-25 23:49 阅读次数: 0

L2正则化推导

在机器学习中,无论是分类还是回归,都可能存在由于特征过多而导致的过拟合问题。当然解决的办法有     (1)减少特征,留取最重要的特征。   (2)惩罚不重要的特征的权重。   但是通常情况下,我们不知道应该惩罚哪些特征的权重取值。通过正则化方法可以防止过拟合,提高泛化能力。   先来看看L2正则化方法。对于之前梯度下降讲到的损失函数来说,在代价函数后面加上一个正则化项,得到   ...
分类: 其他 发布时间: 09-25 23:49 阅读次数: 0

一文概述深度学习中的正则化(含Python代码)

如果图片无法显示,请查看源文章转载之https://www.jqr.com/article/000173 作者:SHUBHAM JAIN 翻译:和中华 校对:丁楠雅 本文约3500字,建议阅读20分钟。 本文简单介绍了什么是正则化以及在深度学习任务中可以采用哪些正则化技术,并以keras代码具体讲解了一个案例。   简介 数据科学家...
分类: 其他 发布时间: 09-25 23:48 阅读次数: 0

pyCharm第三方库安装

在机器学习过程中,我使用的是JetBrains的python开发工具pyCharm,发现很多函数操作借助第三方函数库能够很容易的实现,但是下载好的pyCharm不自带各种类库,网上推荐还要借助其他类似Anaconda的工具导入,十分麻烦,lz更新pyCharm至最新版后发现它自带第三方库添加功能,分享给大家: 1、点击pyCharm右上角的file选中settings 2、找到项目下...
分类: 其他 发布时间: 09-25 23:48 阅读次数: 0

协同过滤算法概述与python 实现协同过滤算法(usr-item,item-item)

协调过滤推荐概述   协同过滤(Collaborative Filtering)作为推荐算法中最经典的类型,包括在线的协同和离线的过滤两部分。所谓在线协同,就是通过在线数据找到用户可能喜欢的物品,而离线过滤,则是过滤掉一些不值得推荐的数据,比比如推荐值评分低的数据,或者虽然推荐值高但是用户已经购买的数据。    协同过滤的模型一般为m个物品,m个用户的数据,只有部分用户和部分数据之间是有评分数据...
分类: 其他 发布时间: 09-25 23:48 阅读次数: 0

最值得看的十大机器学习公开课

在当下的机器学习热潮,人才匮乏十分显著。截至目前,国内开设人工智能(AI)专业的高校不多,相当多的开发者是跨界入门,需要自学大量知识并摸索。因而优质的学习资源至关重要。因此,雷锋网搜集了全世界范围内最受欢迎的机器学习课程,整理成这份“机器学习十大入门公开课”盘点,集中呈现给各位。这份推荐榜颇费心血,综合考虑了难易、侧重点、时效性等诸多因素,希望能帮助大家找到最适合自己的学习资源。 这些课程全部免...
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0

机器学习路线图(附资料)

注:此篇博客为转载,尊重原创。原文链接地址为:http://blog.csdn.net/longxinchen_ml/article/details/50749614 作者: 龙心尘 && 寒小阳  时间:2016年2月。  出处:http://blog.csdn.net/longxinchen_ml/article/details/50749614 http://blog.cs...
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0

关于第三周BeautifulSoup个人作业中的易错点

在BeautifulSoup类库中可用html_parser进行解析 在html的文件中,要获得某标签的文本内容时,可用 对象名.select ('*')[0].text 其中[0]表示索引 *表示标签名 例题: <h1 id=''tittle''> Hello World </h1>\ <a href=''#'' class=''link'' > This is link1 </a>\ <a href=''# link2 '' class=''link''> This is link2 </
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0

第七十二课 图的存储结构(上)

顶点和数据元素相关联: 每个顶点关联着一个字符串,这个就是顶点的数据,这个数据关联着工程意义。 添加MatrixGraph.h文件: 1 #ifndef MATRIXGRAPH_H 2 #define MATRIXGRAPH_H 3 4 #include "Graph.h" 5 #include "Exception.h" 6 #include "DynamicArray.h" 7 8 namespace DTLib 9 { 10 // V是顶点类型,
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0

【Python爬虫学习笔记10】多线程中的生产者消费者模式

在多线程编程中,最经典的模式是生产者消费者模式。其中,生产者是专门用来生产数据的线程,它把数据存放在一个中间变量中;而消费者则从这个中间变量取出数据进行消费。由于生产者和消费者共享中间变量,这些变量大多是全局的,因此需要使用锁来保证数据完整性,防止多线程共享问题的产生。 Python threading模块为我们提供了两种实现生产者消费者模式的方案,分别基于Lock类和Condition类。在具体介绍前,我们先来说明一下我们的生产者消费者模型背景:我们这里有一个金库gMoney,若干个生产者P
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0

LaTeX竖立公式符号

1.LaTeX技巧668:LaTeX如何实现直立积分号 \usepackage{amsmath,amssymb} \DeclareSymbolFont{EulerExtension}{U}{euex}{m}{n} \DeclareMathSymbol{\euintop}{\mathop} {EulerExtension}{"52} \DeclareMathSymbol{\euointop}{\mathop} {EulerExtension}{"48} \let\intop\euintop \l
分类: 其他 发布时间: 09-25 23:47 阅读次数: 0