mathpython thesaurus

広告

Python3系でurllib2は使えない:代わりにurllib.requestとurllib.errorを使う

Python3 系でウェブスクレイピングを行うときは

import urllib.request, urllib.error

とインポートします。下のコードは Python2 系です。

import urllib2

urllib.request, urllib.error は 2 がつきません。Python3 では urllib2 が urllib.request と urllib.error に分かれたとイメージしてもいいでしょう。

URLのオープンは

url = 'https://www.mathpython.com/'
html = urllib.request.urlopen(url=url)

とやります。ここでurlopen に url を入れると、その url のページの情報を GET できます。引数を指定するときは url=url と書くといいかも。

参考: Effective Python ―Pythonプログラムを改良する59項目

○ html = urllib.request.urlopen(url=url)
△ html = urllib.request.urlopen(url)

広告

広告