我们在利用Python说话编写法式时,经常需要利用爬虫从网页中爬取一些数据,这时辰往往获取到的数据是一长串的字符串,我们该若何从此中提掏出来页面字段而且显示出来?
打开一个工作文件夹,在左侧的文件列表中,点击新建按钮,新建一个新的源文件,注重后缀名要为.py表白这是一个python文件
在文件的首部起首导入我们需要用到的包,因为需要获取网页请求要用到request,对具体的数据进行解析要用到json
然后建立几个url对象,别离为我们需要爬取数据的网址,再利用一个对象保留请求返回的数据
利用with as语句指心猿意马获取到的数据要保留到的位置,此中要传入文件名,利用write函数写入文件,并利用print打印出
因为我们需要与办事器进行交互,需要发送HTTP请求,在报文中指心猿意马所有应该发送的参数
确认上述代码输入无误后,点击运行按钮,稍等半晌即可看到获取到的数据,必需对此中的内容进行提取才可显示出具体的页面字段
我们只需要利用json包的load语句在对应[]的内传入需要提取的关头字,即可获得对应的信息,点击运行即可看到简约的成果
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!