YEY Blog

Life is a long long journey.

数据科学统计建模 03:导论 (3)

墨尔本大学 MAST90139 课程笔记

Lecture 03 导论 (3) 我们将用两周来回顾之前在 MAST90104 中学习过的线性模型的相关内容,上周我们已经回顾了包括如何拟合线性模型、如何解释线性模型等在内的一部分内容,本周我们将继续回顾线性模型中余下的内容。 在这节课中,我们将主要回顾以下内容: 线性模型中的假设检验 线性模型中的置信区间 模型诊断 7. 线性模型中的假设检验 7.1 假设检验 假设检...

数据科学研究项目 01:论文阅读

学习索引笔记

论文阅读 01 The Case for Learned Index Structures 标题: The Case for Learned Index Structures 作者: Tim Kraska, Alex Beutel, Ed H. Chi, Jeffrey Dean, Neoklis Polyzotis 时间: 2018.04 地址: https://arxiv.org/ab...

自然语言处理 04:文本分类

墨尔本大学 COMP90042 课程笔记

Lecture 04 文本分类 本节课我们将学习 文本分类(text classification)。 本节课程大纲 分类的基本原理 文本分类任务 分类算法 模型评估 1. 分类的基本原理 输入 一个文档 $d$ 通常表示为一个特征向量 一个固定的类别输出集...

自然语言处理 03:N-gram 语言模型

墨尔本大学 COMP90042 课程笔记

Lecture 03 N-gram 语言模型 1. 引言 本节课我们将学习 语言模型(Language Models),我们之前在第 1 节课中提到过它。 为什么我们关心语言模型? 因为 NLP 中有很大一部分研究都是关于如何 解释语言(explaining language) 的。 为什么有些句子比其他句子更 流畅(fluent),或者说 更自然(natural)? ...

人工智能自动规划 02:搜索算法 (1)

墨尔本大学 COMP90054 课程笔记

Lecture 02 搜索算法 (1) 1. 基本模型算法 1.1 基本状态模型:经典规划 追求的目标: 写出一个能够解决所有经典搜索问题的程序。 状态模型 $S(P)$: 有限离散状态空间 $S$ 一个 已知的初始状态 $s_0\in S$ 一个目标状态的集合 $S_G\subseteq S$ 每个 $s\in S$ 中可以采取的行动 $A(s)\subseteq A$...