Python网络爬虫实习报告材料(共14页).doc

上传人:晟*** 文档编号:6141335 上传时间:2021-08-18 格式:DOC 页数:13 大小:157KB
下载 相关 举报
Python网络爬虫实习报告材料(共14页).doc_第1页
第1页 / 共13页
Python网络爬虫实习报告材料(共14页).doc_第2页
第2页 / 共13页
Python网络爬虫实习报告材料(共14页).doc_第3页
第3页 / 共13页
Python网络爬虫实习报告材料(共14页).doc_第4页
第4页 / 共13页
Python网络爬虫实习报告材料(共14页).doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

Python 网络爬虫实习报告 目录 一、选题背景 .- 2 - 二、爬虫原理 .- 2 - 三、爬虫历史和分类 .- 2 - 四、常用爬虫框架比较 .- 5 - 五、数据爬取实战(豆瓣网爬取电影数据) .- 6 - 1 分析网页 .- 6 - 2 爬取数据 .- 7 - 3 数据整理、转换 .- 10 - 4 数据保存、展示 .- 12 - 5 技术难点关键点 .- 12 - 六、总结 .- 14 - 一、 选题背景 二、 爬虫原理 三、 爬虫历史和分类 四、 常用爬虫框架比较 Scrapy 框架:Scrapy 框架是一套比较成熟的 Python 爬虫框架,是使 用 Python 开发的快速、高层次的信息爬取框架,可以高效的爬取 web 页面并提取出结构化数据。Scrapy 应用范围很广,爬虫开发、数 据挖掘、数据监测、自动化测试等。 Crawley 框架:Crawley 也是 Python 开发出的爬虫框架,该框架致力 于改变人们从互联网中提取数据的方式。 Portia 框架:Portia 框架是一款允许没有任何编程基础的用户可视化 地爬取网页的爬虫框架。 newspaper 框架

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 公文范文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。