CS224n笔记——Subword Model(十二)
系列文章Lecture 1: Introduction and Word Lecture 2: Word Vectors and Word SensesLecture 12: Subword Model目录1. ELMO2. GPT2.1 无监督pretrain2.2 有监督finetune3. BERTvery nice的BERT入门级讲解1. ELMO首先介绍一下ELMo(Embeddings from Language Models)算法,可去观摩原文查看更详细的内容。在之前word.
天池NLP赛事-新闻文本分类(一)——赛题理解
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解目录一、赛题理解1.1 学习目标1.2 赛题数据1.3 数据标签1.4 评价标准1.5 读取数据1.6 思路分析一、赛题理解1.1 学习目标通过之前的nlp的第一阶段学习,此前系列的链接https://blog.csdn.net/bosszhao20190517/article/details/106911793,掌握了nlp的基础方法和原理,此次跟随Datawhale参加天池大赛——零基础入门NLP赛事-新闻文本分类,报名链接http.
LeetCode 69. x的平方根
“从0开始做LeetCode”之第八题 tag:双指针——滑动窗口难度:hard给你一个字符串 S、一个字符串 T,请在字符串 S 里面找出:包含 T 所有字符的最小子串。示例:输入: S = “ADOBECODEBANC”, T = “ABC”输出: “BANC”说明:如果 S 中不存这样的子串,则返回空字符串 “”。如果 S 中存在这样的子串,我们保证它是唯一的答案。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/minimu
天池NLP赛事-新闻文本分类(二)——数据读取和数据分析
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析目录二、数据读取与数据分析2.1 数据读取2.2 数据分析2.2.1 句子长度分析2.2.2 新闻类别分布2.2.3 字符分布统计2.3 数据分析的结论二、数据读取与数据分析2.1 数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但仍然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.
天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类目录三、基于机器学习的文本分类3.1 机器学习模型3.2 字词模型3.3 基于机器学习的文本分类三、基于机器学习的文本分类3.1 机器学习模型机器学习能解决一定的问题,但不能奢求机器学习是万能的;机器学习算法有很多种,看具体问题需要什么,再来进行选择;每种机器学习算法有一定的偏好,需要具体问题具体分析;.
天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText目录四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastText4.2 基于FastText的文本分类4.3 如何使用验证集调参四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastTe.
天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN目录五、基于深度学习的文本分类2-TextCNN、TextRNN5.1 文本表示方法——词向量5.1.1 Skip-grams原理和网络结构5.1.
天池NLP赛事-新闻文本分类(六)——基于深度学习的文本分类3-BERT
系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN天池NLP赛事-新闻文本分类(六)——基于深度学习的文本分类3-BERT目录六、基于深度学习的文本分类3-BERT6.1 文本表示方法——Par.
递归和动态规划常见题目
“从0开始做LeetCode”之递归和动态规划常见题目 1.求n!2.汉诺塔问题复杂度:O(2^n)3.打印一个字符串的全部子序列,包括空字符串子序列!=子串4.打印一个字符串的全部排列进阶:另加要求不要出现重复的排列5.母牛N年总数F(n)=F(n-1)+F(n-3)6.暂时没做这个题暂时没做7.二维数组最小路径和尝试,枚举暴力递归的缺点:重复计算 f(1,1)无后效性问题改动态规划8.数组中的累加和...
KMP,Manacher,BFPRT
“从0开始做LeetCode”之KMP,Manacher,BFPRT 1.KMP算法next数组子树问题 也用这个方法2.Manacher算法求最大回文子串暴力解法回文半径,回文右边界,回文中心可能性1:iii不在回文有边界内,暴力解后面的可能性拆为3种可能性2:对称点在回文内,对称点回文半径在内,和对称点的回文半径一样可能性3:对称点在回文内,对称点回文半径在外,iii->RRR可能性4:对称点在回文内,对称点回文半径压线,开始的一段不用管,后面暴力试整
窗口内最大、最小值,单调栈
“从0开始做LeetCode”之窗口、单调栈 1.窗口用双向链表解决2.窗口的应用:生成窗口最大值数组3.窗口的应用:最大值减去最小值小于或等于num的子数组数量Note:子数组连续暴力解法:最优解:总体思路:往右扩4.单调栈时间复杂度:O(N)找大,从栈底到栈顶,从大到小找小,从栈底到栈顶,从小到大找出右边最近和左边最近比这个数大的数项目 spark、hadoop,造项目,分布式计算5.单调栈应用:构造数组的MaxTree大根堆:时间复杂度:O(N
CV目标检测(一)——1×1卷积
1×1卷积1、增加非线性1×1卷积核的卷积过程相当于全连接层的计算过程,并且还加入了非线性激活函数,从而可以增加网络的非线性,使得网络可以表达更加复杂的特征2、特征降维通过控制卷积核的数量达到通道数大小的放缩。特征降维带来的额好处是可以减少参数和减少计算量...
CV目标检测(二)——空洞卷积&转置卷积
空洞卷积在相同感受野的情况下,使用空洞卷积可以得到更大的特征图,可以获得更加密集的数据。在相同感受野的情况下,更大的特征图有助于在目标检测和目标分割的任务中对小物体的识别分割效果转置卷积...
CV目标检测(三)——传统的目标检测方法&FCN
滑动窗口法+传统机器学习分类器SVM、神经网络分类器、KNN分类器识别效果不够好,准确率不高计算量比较大,运行速度慢可能会出现多个正确识别的结果滑动窗口法+卷积神经网络CNN速度可能还是慢全卷积神经网络(FCN)可以输入任意大小的图片...
今日推荐
周排行