代码天地

CS224n笔记——Subword Model（十二）

系列文章Lecture 1: Introduction and Word Lecture 2: Word Vectors and Word SensesLecture 12: Subword Model目录1. ELMO2. GPT2.1 无监督pretrain2.2 有监督finetune3. BERTvery nice的BERT入门级讲解1. ELMO首先介绍一下ELMo(Embeddings from Language Models)算法，可去观摩原文查看更详细的内容。在之前word.

分类: 其他发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类（一）——赛题理解

系列文章天池NLP赛事-新闻文本分类（一） —— 赛题理解目录一、赛题理解1.1 学习目标1.2 赛题数据1.3 数据标签1.4 评价标准1.5 读取数据1.6 思路分析一、赛题理解1.1 学习目标通过之前的nlp的第一阶段学习，此前系列的链接https://blog.csdn.net/bosszhao20190517/article/details/106911793，掌握了nlp的基础方法和原理，此次跟随Datawhale参加天池大赛——零基础入门NLP赛事-新闻文本分类，报名链接http.

分类: 其他发布时间: 03-19 09:52 阅读次数: 0

LeetCode 69. x的平方根

“从0开始做LeetCode”之第八题 tag：双指针——滑动窗口难度：hard给你一个字符串 S、一个字符串 T，请在字符串 S 里面找出：包含 T 所有字符的最小子串。示例：输入: S = “ADOBECODEBANC”, T = “ABC”输出: “BANC”说明：如果 S 中不存这样的子串，则返回空字符串 “”。如果 S 中存在这样的子串，我们保证它是唯一的答案。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/minimu

分类: 其他发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类（二）——数据读取和数据分析

系列文章天池NLP赛事-新闻文本分类（一） —— 赛题理解天池NLP赛事-新闻文本分类（二） —— 数据读取和数据分析目录二、数据读取与数据分析2.1 数据读取2.2 数据分析2.2.1 句子长度分析2.2.2 新闻类别分布2.2.3 字符分布统计2.3 数据分析的结论二、数据读取与数据分析2.1 数据读取赛题数据虽然是文本数据，每个新闻是不定长的，但仍然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.

分类: 其他发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类（三）——基于机器学习的文本分类

系列文章天池NLP赛事-新闻文本分类（一） —— 赛题理解天池NLP赛事-新闻文本分类（二） —— 数据读取和数据分析天池NLP赛事-新闻文本分类（三）——基于机器学习的文本分类目录三、基于机器学习的文本分类3.1 机器学习模型3.2 字词模型3.3 基于机器学习的文本分类三、基于机器学习的文本分类3.1 机器学习模型机器学习能解决一定的问题，但不能奢求机器学习是万能的；机器学习算法有很多种，看具体问题需要什么，再来进行选择；每种机器学习算法有一定的偏好，需要具体问题具体分析；.

分类: 其他发布时间: 03-19 09:52 阅读次数: 0

天池NLP赛事-新闻文本分类（四）——基于深度学习的文本分类1-FastText

系列文章天池NLP赛事-新闻文本分类（一） —— 赛题理解天池NLP赛事-新闻文本分类（二） —— 数据读取和数据分析天池NLP赛事-新闻文本分类（三）——基于机器学习的文本分类天池NLP赛事-新闻文本分类（四）——基于深度学习的文本分类1-FastText目录四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastText4.2 基于FastText的文本分类4.3 如何使用验证集调参四、基于深度学习的文本分类1-FastText4.1 文本表示方法——FastTe.