Python网络爬虫与文本分析【2018旧版本|不建议购买】

2018-09-02

立即购买
  • 课程介绍
  • 听课列表
  • 用户评价

简介

讲师简介
邓旭东.jpg
大邓
哈工大在读博士

公众号:大邓和他的Python

 

课程简介
1
课程特色

 

课程设计面向人文社科类科研工作者

python编程、爬虫、文本分析、机器学习一站式学懂学会

全程使用jupyter notebook,方便您课后学习和复习。

简单易懂的理论+接地气的案例

2
课程内容

【第一部分】学前准备

课程介绍

环境配置

jupyter notebook使用方法

【第二部分】python快速入门

简单的编程语言

数据结构

循环控制语句

常用函数、常用库

文件读写操作

常见错误

【第三部分】网络爬虫快速入门

网络爬虫原理

爬虫库requests、pyquery、re

数据抓包(开发者工具使用)

数据的存储

案例1:天涯论坛

案例2:大众点评

案例4:BOSS直聘

案例5:**企业信用

案例6:京东评论数据

【第四部分】文本分析快速入门

文本分析应用场景

文件的读取(txt、pdf、word等)

中文分词库-jieba学习

可视化库-pyecharts

数据分析库-pandas

构建和使用情感词典

案例1:词频统计

案例2:制作词云图

案例3:excel文件中时间及文本数据处理方法

案例4:基于词典法对上市公司进行情感计算

【第五部分】文本分析进阶

监督学习与半监督学习

使用机器学习方法进行文本分析的方法和步骤

表达文本数据信息的方式(one-hot、bag-of-words、TF-IDF)

理解特征矩阵、语料、文档、特征

文档相似性计算

公司年报信息含量计算思路

机器学习库-sklearn学习

了解协同过滤-推荐系统

案例1-在线评论情感分析

案例2:文本相似度计算

案例3:LDA话题模型

3
课程福利

提供本课程全部的jupyter notebook课件

适合谁听

据面向编程0基础者,想:-入门python编程-收集网络数据-文本分析的高校人文社科类相关专业师生。

 

直播间

一起学Python

话题 142

最新问答

专题推荐