自然语言(NLP)处理和文本分析

培训费用:¥ 8800

培训周期:32 课时

在线咨询

课程大纲


前置基础:

1,人工智能首先语言Python核心编程

2, Python数据分析挖掘的主要框架、常用算法

 

课程大纲:

第一节

1.NLP的原理与介绍

1)基本算法和模型

2)Viterbi算法详解

3)Metropolis-Hastings算法

4)共轭先验分布

5)Laplace平滑

2.基本算法与模型

1)主题模型LDA

3.案例分析

1)LDA开源包的使用和过程分析

2)文本分析

3)网络爬虫的原理和代码实现


第二节

1.基本算法和模型

1)Gibbs采样详解

2)Metropolis-Hastings算法

3)MCMC

4)TF-IDF算法

5)隐马尔科夫模型的应用优劣比较

6)自然语言推测Natural Language Inference (NLI)

7)上下文词嵌入模型Embedding from Language Model (ELMo)

2.案例分析

1)HMM用于中文分词

2)文件数据格式UFT-8、Unicode

3)发现新词和分词效果分析


第三节

1.基本算法和模型

1)词性标注(POS)

2)支持向量机SVM

3)线性回归LR

4)命名实体识别NER(Named Entity Recognition)

2.案例分析

1)高斯混合模型HMM

2)GMM-HMM用于股票数据特征提取

3)Keras开工具的使用


第四节

1.基本算法和模型

1)词性标注算法

2)近义词与相似词算法

3)字符级嵌入算法

4)FastText算法

5)语境相似度算法

2.案例分析


第五节

1.基本算法和模型

1)循环神经网络RNN

2)长短记忆模型LSTM

3)门循环单元GRU

4)注意力机制

5)广义Transformer模型

6)BERT模型

7)对抗网络

2.案例分析

1)IMDB评论分析

2)文本分类

3)机器翻译与机器备注


第六节

1.基本算法和模型

1)动态记忆网络DMN

2)语义角色标注SRL(Semantic Role Labeling)

3)词袋模型CBOW(continuous bag-of-words)

4)卷积神经网络隐马尔科夫模型CNN-HMM

5)卷积神经网络CNN

2.案例分析

1)采样总结

2)问答系统

3)对话系统(Dialogue Systems)