import requests from bs4 import BeautifulSoup r=requests.get("http://smeshariki-mir.ru/forum/viewtopic.php?p=123222#p123222") text=r.text[17310:63620] bs=BeautifulSoup(text,"html.parser") while True: try: a=str(bs.find("img")) bs=str(bs)[(str(bs).index(a)+1):] bs=BeautifulSoup(bs,"html.parser") ind=a.index('src="') path="" for i in range(ind+5, len(a)): if a[i]=='"': break else: path+=a[i] if path[len(path)-4:]!=".gif": path+=".gif" try: file=requests.get(path) with open("images\\"+path[path.index("/")+1:], "wb") as f: f.write(file.content) f.close() except: pass except: break
Все равно не работает.
_________________ Л-я с-я - это та, к-ю я ещё не с-л! С-м п-о я п-л, что о-е - и е-ь н-а ж-ь, и все ее м-ы б-ы, д-е с-е д-е и н-е. (с) Бараш
Извини, у меня мало времени, поэтому решил попробовать сам.
Код:
from urllib.request import urlopen from bs4 import BeautifulSoup r=urlopen("http://smeshariki-mir.ru/forum/viewtopic.php?f=37&t=5704") bs=BeautifulSoup(r, "html.parser") the_list = bs.findAll('img')[51:][:-102] srcs = [image['src'] for image in the_list][1: -1] for number in range(len(srcs)): if not srcs[number].endswith('.gif'): srcs[number] += '.gif'
Этот код помещает список всех адресов гифок в список srcs. Сейчас очень занят. Доделай сам скачивание, ладно?
_________________ АМБАССАДОР ПОСТИРОНИИ Форума Мира Смешариков