CS224n笔记——Subword Model(十二)

系列文章Lecture 1: Introduction and Word Lecture 2: Word Vectors and Word SensesLecture 12: Subword Model目录1. ELMO2. GPT2.1 无监督pretrain2.2 有监督finetune3. BERTvery nice的BERT入门级讲解1. ELMO首先介绍一下ELMo(Embeddings from Language Models)算法,可去观摩原文查看更详细的内容。在之前word.
分类: 其他 发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类(一)——赛题理解

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解目录一、赛题理解1.1 学习目标1.2 赛题数据1.3 数据标签1.4 评价标准1.5 读取数据1.6 思路分析一、赛题理解1.1 学习目标通过之前的nlp的第一阶段学习,此前系列的链接https://blog.csdn.net/bosszhao20190517/article/details/106911793,掌握了nlp的基础方法和原理,此次跟随Datawhale参加天池大赛——零基础入门NLP赛事-新闻文本分类,报名链接http.
分类: 其他 发布时间: 03-19 09:52 阅读次数: 0

LeetCode 69. x的平方根

“从0开始做LeetCode”之第八题 tag:双指针——滑动窗口难度:hard给你一个字符串 S、一个字符串 T,请在字符串 S 里面找出:包含 T 所有字符的最小子串。示例:输入: S = “ADOBECODEBANC”, T = “ABC”输出: “BANC”说明:如果 S 中不存这样的子串,则返回空字符串 “”。如果 S 中存在这样的子串,我们保证它是唯一的答案。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/minimu
分类: 其他 发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类(二)——数据读取和数据分析

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析目录二、数据读取与数据分析2.1 数据读取2.2 数据分析2.2.1 句子长度分析2.2.2 新闻类别分布2.2.3 字符分布统计2.3 数据分析的结论二、数据读取与数据分析2.1 数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但仍然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.
分类: 其他 发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类目录三、基于机器学习的文本分类3.1 机器学习模型3.2 字词模型3.3 基于机器学习的文本分类三、基于机器学习的文本分类3.1 机器学习模型机器学习能解决一定的问题,但不能奢求机器学习是万能的;机器学习算法有很多种,看具体问题需要什么,再来进行选择;每种机器学习算法有一定的偏好,需要具体问题具体分析;.
分类: 其他 发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText目录四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastText4.2 基于FastText的文本分类4.3 如何使用验证集调参四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastTe.
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN目录五、基于深度学习的文本分类2-TextCNN、TextRNN5.1 文本表示方法——词向量5.1.1 Skip-grams原理和网络结构5.1.
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

天池NLP赛事-新闻文本分类(六)——基于深度学习的文本分类3-BERT

系列文章天池NLP赛事-新闻文本分类(一) —— 赛题理解天池NLP赛事-新闻文本分类(二) —— 数据读取和数据分析天池NLP赛事-新闻文本分类(三)——基于机器学习的文本分类天池NLP赛事-新闻文本分类(四)——基于深度学习的文本分类1-FastText天池NLP赛事-新闻文本分类(五)——基于深度学习的文本分类2-TextCNN、TextRNN天池NLP赛事-新闻文本分类(六)——基于深度学习的文本分类3-BERT目录六、基于深度学习的文本分类3-BERT6.1 文本表示方法——Par.
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

哈希表常见题目

“从0开始做LeetCode”之哈希表常见题目 1.认识哈希函数和哈希表2.设计RandomPool结构双哈希3.认识布隆过滤器100亿个url,黑名单 大数据调整哈希函数的个数和开的数组位数决定失误率比特类型的map4.认识一致性哈希服务器设计抗压,负载均衡经典抗压问题:当加机器和减机器,数据需要重新迁移解决:一致性哈希降低数据迁移的代价,同样达到负载均衡哈希域虚拟节点技术Note:没听太明白...
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

并查集常见题目

“从0开始做LeetCode”之并查集常见题目 解决的问题:非常快地 查两个元素是否在一个集合两个元素所在的各自的集合给合并到一起1.认识哈希函数和哈希表2.设计RandomPool结构双哈希3.认识布隆过滤器100亿个url,黑名单 大数据调整哈希函数的个数和开的数组位数决定失误率比特类型的map4.认识一致性哈希服务器设计抗压,负载均衡经典抗压问题:当加机器和减机器,数据需要重新迁移解决:一致性哈希降低数据迁移的代价,同样达到负载均衡哈希域虚拟
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

贪心常见题目

“从0开始做LeetCode”之贪心常见题目 1.前缀树(try-树)·增加前缀树功能2.贪心:N个字符串串起来,怎么最大ab<ba,bc<cb => ac<ca3.贪心:花费最少哈夫曼编码问题尽可能让每一刀下去两边差不多,贪心贪出来贪心策略不用证明4.贪心:利润最多堆,就是优先级队列堆+比较器,生成小根堆,大根堆5.还有一道题,之前讲堆排时候讲过了6.贪心:场次最多按照开始的时间贪心按照持续时间短贪心按照结束的时间贪心
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

递归和动态规划常见题目

“从0开始做LeetCode”之递归和动态规划常见题目 1.求n!2.汉诺塔问题复杂度:O(2^n)3.打印一个字符串的全部子序列,包括空字符串子序列!=子串4.打印一个字符串的全部排列进阶:另加要求不要出现重复的排列5.母牛N年总数F(n)=F(n-1)+F(n-3)6.暂时没做这个题暂时没做7.二维数组最小路径和尝试,枚举暴力递归的缺点:重复计算 f(1,1)无后效性问题改动态规划8.数组中的累加和...
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

KMP,Manacher,BFPRT

“从0开始做LeetCode”之KMP,Manacher,BFPRT 1.KMP算法next数组子树问题 也用这个方法2.Manacher算法求最大回文子串暴力解法回文半径,回文右边界,回文中心可能性1:iii不在回文有边界内,暴力解后面的可能性拆为3种可能性2:对称点在回文内,对称点回文半径在内,和对称点的回文半径一样可能性3:对称点在回文内,对称点回文半径在外,iii->RRR可能性4:对称点在回文内,对称点回文半径压线,开始的一段不用管,后面暴力试整
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

窗口内最大、最小值,单调栈

“从0开始做LeetCode”之窗口、单调栈 1.窗口用双向链表解决2.窗口的应用:生成窗口最大值数组3.窗口的应用:最大值减去最小值小于或等于num的子数组数量Note:子数组连续暴力解法:最优解:总体思路:往右扩4.单调栈时间复杂度:O(N)找大,从栈底到栈顶,从大到小找小,从栈底到栈顶,从小到大找出右边最近和左边最近比这个数大的数项目 spark、hadoop,造项目,分布式计算5.单调栈应用:构造数组的MaxTree大根堆:时间复杂度:O(N
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

二叉树进阶

“从0开始做LeetCode”之二叉树进阶 1+2.morris遍历经典遍历:额外空间复杂度:O(h),因为要回到上级节点,压栈,这个栈可以是递归,也可以自己写递归版过程:有左子树,能来到它两次,没有左子树,只能来到它一次在morris遍历中改先序,中序,后序:难先序:中序:后序:只关注能够来到两次的节点,在第二次来到该节点时候,逆序打印左子树右边界,最后单独打印一下整棵树右边界3.平衡搜索二叉树对比hash_map:时间复杂度:O(1)查:时间复杂度:O(h)
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

从暴力递归到动态规划进阶

“从0开始做LeetCode”之从暴力递归到动态规划进阶 1.换钱的方法数
分类: 其他 发布时间: 03-19 09:51 阅读次数: 0

CV目标检测(一)——1×1卷积

1×1卷积1、增加非线性1×1卷积核的卷积过程相当于全连接层的计算过程,并且还加入了非线性激活函数,从而可以增加网络的非线性,使得网络可以表达更加复杂的特征2、特征降维通过控制卷积核的数量达到通道数大小的放缩。特征降维带来的额好处是可以减少参数和减少计算量...
分类: 其他 发布时间: 03-19 09:50 阅读次数: 0

CV目标检测(二)——空洞卷积&转置卷积

空洞卷积在相同感受野的情况下,使用空洞卷积可以得到更大的特征图,可以获得更加密集的数据。在相同感受野的情况下,更大的特征图有助于在目标检测和目标分割的任务中对小物体的识别分割效果转置卷积...
分类: 其他 发布时间: 03-19 09:50 阅读次数: 0

CV目标检测(三)——传统的目标检测方法&FCN

滑动窗口法+传统机器学习分类器SVM、神经网络分类器、KNN分类器识别效果不够好,准确率不高计算量比较大,运行速度慢可能会出现多个正确识别的结果滑动窗口法+卷积神经网络CNN速度可能还是慢全卷积神经网络(FCN)可以输入任意大小的图片...
分类: 其他 发布时间: 03-19 09:50 阅读次数: 0

CV目标检测(四)——判断目标检测好坏的指标

判断目标检测好坏的指标交并比IoU(intersection-over-unionmAP(mean average precision)平均准确率均值
分类: 其他 发布时间: 03-19 09:50 阅读次数: 0
今日推荐