YEY Blog

Life is a long long journey.

人工智能自动规划 01:导论

墨尔本大学 COMP90054 课程笔记

Lecture 01 导论 1. 课程简介 1.1 教学人员 讲师 Chris Ewin 2018 年 PhD 毕业于墨尔本大学。主要研究兴趣为自动规划领域: 知识表示(Knowledge representation) 富域规划(Planning in rich domains) 情景...

自然语言处理 Workshop 01:利用 NLTK 进行预处理

墨尔本大学 COMP90042 Workshop

Workshop 01 利用 NLTK 进行预处理 首先,如果你从来没有使用过 iPython notebooks,为了能够在此工作册上运行代码,你可以选中一个 code cell 之后,点击 Cell 菜单里的运行命令,或者按一下键盘上的 shift + enter。通常,为了使代码能够正常工作,你需要按照程序的顺序运行 cells。一个给定的 cell 的输出(包括图表在内的任何结果)...

数据科学统计建模 02:导论 (2)

墨尔本大学 MAST90139 课程笔记

Lecture 02 导论 (2) 4. 拟合一个关于 gavote 的线性模型 4.1 最小二乘估计 一个线性模型 $\mathbf y=X\boldsymbol \beta+\boldsymbol \varepsilon$ 可以利用 最小二乘法(Least Squares method,LS) 来拟合数据。据此得到的参数 $\boldsymbol \beta$ 的 最小二乘估计量(LS ...

数据科学统计建模 01:导论 (1)

墨尔本大学 MAST90139 课程笔记

Lecture 01 导论 (1) 1. 概览 1.1 线性模型 线性(回归)模型 可以说是几乎所有统计应用中使用的最重要的统计模型。 一个线性模型可以由下面的回归方程定义: \[\begin{align} Y &= \beta_0+\beta_1 X_1+\cdots+\beta_{p-1} X_{p-1}+\epsilon,\qquad 或者 \\\\ Y ...

自然语言处理 02:文本预处理

墨尔本大学 COMP90042 课程笔记

Lecture 02 文本预处理 1. 引言 现在我们将学习文本预处理。通常情况下,语言数据是带有噪声的,是不干净的,你可能是从网上下载的,它可能有自己的格式,所以,在使用这些数据之前,我们需要对其进行清洗。 1.1 定义 语料库(Corpus):一个 文档(documents) 的 集合(collection) 例如:维基百科中全部的英文文章 ...