YEY Blog

Life is a long long journey.

自然语言处理 12:语篇

墨尔本大学 COMP90042 课程笔记

Lecture 12 语篇 这节课我们学习 语篇(Discourse),它是关于如何将文档中的句子组织成连贯的故事线。因此,我们将目光从理解单词和上下文含义上转移到一个更高的层次:理解文档含义以及句子是如何在文档中组织的。 1. 语篇 1.1 语篇 目前为止,我们学习的大部分任务/模型都是在 单词或者句子层面 操作的: 词性标注:通常每次标注一个句子中所有单词...

自然语言处理 11:上下文表示

墨尔本大学 COMP90042 课程笔记

Lecture 11 上下文表示 这节课我们学习 上下文表示(Contextual Representation),即单词在上下文中的含义。 1. 上下文表示 1.1 词向量/嵌入 在之前的章节中,我们已经学习过 词向量/嵌入(Word Vectors/Embeddings),我们还学习了如何通过基于计数的方法来得到词向量。 每个单词 type 都有一个表示。 ...

数据科学统计建模 10:Logistic 回归模型分析分类数据

墨尔本大学 MAST90139 课程笔记

Lecture 10 Logistic 回归模型分析分类数据 本章我们主要讨论 GLM 的一个非常特殊的应用案例:基于 Logistic 回归的分类数据分析。主要包含以下内容: 介绍 例子预览 二项分布 Logistic 回归用于分组数据 Logistic 回归模型中的检验 Logistic 回归的残差 例子:Logistic 回归用于分组数据 Logi...

自然语言处理 10:分布语义学

墨尔本大学 COMP90042 课程笔记

Lecture 10 分布语义学 这节课我们继续学习语义学相关内容,这次我们不再关注单词层面的语义学,而是从语料库中直接学习单词含义,这个领域也被称为 分布语义学(Distributional Semantics)。 1. 分布语义学 1.1 词汇数据库的问题 需要手工构建 成本高 人类的注解可能存在偏见和噪音 语言是动态的 ...

自然语言处理 09:词汇语义学

墨尔本大学 COMP90042 课程笔记

Lecture 09 词汇语义学 这节课我们将学习词汇语义学。 1. 词汇语义学 1.1 例子:情感分析 在 NLP 中,我们为什么要关注词汇语义学?我们先来看一个情感分析的例子:假设现在我们有一个情感分析任务,我们需要预测一段给定文本的情感极性。 词袋模型,KNN 分类器。训练数据: $\textit{“This is a good movie.”}\q...