for script in soup(["script", "style"]):.decompose()は、削除のメソッドだそうです。次に前回も行いましたが、テキストを取得します。
script.decompose()
#print(soup)
text=soup.get_text()
#print(text)
lines= [line.strip() for line in text.splitlines()]
# textを改行ごとにリストに入れて、リスト内の要素の前後の空白を削除
i = 0
for line in lines:
if lines[i]=="" :
del lines[i]
# print (i)
else:
print(lines[i])
i += 1
lines_s0 = lines
i = 0
j = 0
for line in lines_s0:
if lines_s0[i] != "11R" : # a != b # a が b と異なる
del lines_s0[i]
else:
j += 1
i += 1
if j == 2: # 2回目の11Rで抜ける 2回目の11Rの次がレース名
print("11R 2times out loop")
break
else :
print(lines_s0[i],j)
lines_s0[2] # レース名が表示されればOK
i = 0
for line in lines_s1:
if lines_s1[i] != "--◎◯▲△☆✓消" : # a != b # a が b と異なる
del lines_s1[i]
else:
break
lines_s1 #以降が馬の情報
for script in soup(["script", "style"]):
script.decompose()
#print(soup)
text=soup.get_text()
#print(text)
lines= [line.strip() for line in text.splitlines()]
# textを改行ごとにリストに入れて、リスト内の要素の前後の空白を削除
i = 0
for line in lines:
if lines[i]=="" :
del lines[i]
# print (i)
else:
print(lines[i])
i += 1
i = 0
j = 0
for line in lines_s0:
if lines_s0[i] != "11R" : # a != b # a が b と異なる
del lines_s0[i]
else:
j += 1
i += 1
if j == 2: # 2回目の11Rで抜ける 2回目の11Rの次がレース名
print("11R 2times out loop")
break
else :
print(lines_s0[i],j)
i = 0
for line in lines_s1:
if lines_s1[i] != "--◎◯▲△☆✓消" : # a != b # a が b と異なる
del lines_s1[i]
else:
break
Python で 競馬予想 実践第12回 2020年… Dec 26, 2020
Python で 競馬予想 実践第11回 阪神JF… Dec 13, 2020
Python で 競馬予想 実践第10回 チャン… Dec 6, 2020 コメント(2)
PR
Free Space
Calendar
Comments
Freepage List