response = requests.get(url, headers=headers_dic)
res_bs = response.content
soup = BeautifulSoup(res_bs, 'html.parser', from_encoding="shift-jis")
beautifulsoup4==4.10.0
bs4==0.0.1
chardet==3.0.4
requests==2.26.0
response.encoding = response.apparent_encoding
import requests
url = 'https://example.com'
response = requests.get(url)
response.encoding = 'utf-8' # 強制的にUTF-8を使用
response = requests.get(url, headers=headers_dic)
response.encoding = 'shift-jis' # 強制的に文字コードを指定
res_bs = response.content
soup = BeautifulSoup(res_bs, 'html.parser', from_encoding="shift-jis")
GB 18030は、中華人民共和国(中国)が制定した文字コード(文字セット)の国家規格である。
GB 18030は従来の文字コードと互換性を維持したUnicode伝送形式(Unicode Transformation Format、すなわちすべてのUnicode符号位置を符号化する文字符号化方式)であるとみなせる。言いかえると、GB 18030はUTF-8(ASCIIと互換性を維持している)の中国版である。
response = requests.get(url, headers=headers_dic)
response.encoding = 'shift-jis' # 強制的に文字コードを指定
res_bs = response.content
soup = BeautifulSoup(res_bs, 'html.parser', from_encoding="shift-jis")
response = requests.get(url, headers=headers_dic)
response.encoding = 'shift-jis' # 強制的に文字コードを指定
res_bs = response.text
soup = BeautifulSoup(res_bs, 'html.parser')
GitHubDesktopにてOAuth認証を何度も要求… 2023.01.19
AWS SAA C03資格取った時の話 2022.12.22
中古PC買って匂いのお掃除してみた 2022.02.10