«» '
Ползать IMDb сообщение:
Название фильма, фильм URL, режиссер
кинозвезда, фильм год, жанр
оценка фильма, кино, обзоры фильмов
«» '
Пресмыкающихся трехчастной песни
импорт запросов импорта повторно
# 1 посылает запрос
Защиту get_page (URL): réponse = requests.get (URL) возвращение réponse
# 2. Синтаксический данные
Защиту parse_index (HTML): movie_list = re.findall ( ' .? <DIV класс = "пункт"> * <эм класс = "">.? (*) </ EM> * <A HREF =.? "(. *) "?> * <пролет класс =" название "> (*) </ SPAN> *导演:.?.? (*)主演:.? (*) <br> (*).?.? </ р>. *? <промежуток класс = "rating_num". *?> (. *?) </ SPAN>. *? <SPAN> (. *?)人评价</ SPAN>. *? <пролет класс = "Inq"> (. *?) </ SPAN> ' , HTML, re.S) возвращение movie_list
# 3 Сохранить данные
DEF save_data (видео): Top, m_url, имя, daoyan, актер, year_type, точка, разговоры, убывание = Movie year_type = year_type.strip ( ' \ п ' ) Данные = F '' ' ======== ======= Добро пожаловать на IMDb =============== рейтинги фильмов: {} топ фильмов URL: {} m_url название фильма: {имя} кинорежиссеров: {daoyan } фильм с участием актера: {} Жанр: {year_type} рейтинги фильмов: {точка} фильм: {} убывание обзор фильма: {} Обсуждение ================= может прийти снова ================== \ п \ о н- «» ' Print (данные) Открыть с помощью ( ' douban_top250.text ' , ' A ' , кодирование = 'UTF- 8 ' ) AS F: f.write (Data) Печать (F ' фильм: {имя} успешно написано ... ' )
# Колющие все Главная
если __name__ == ' __main__ ' : Num = 0 для линии в диапазоне (10 ): URL = F ' https://movie.douban.com/top250?start={num}&filter= ' Num + = 25 печати (URL )
# 1 посылает запрос на каждый дом
index_res = get_page (URL)
# 2. Синтаксическая домашняя страница для информации фильма
movie_list = parse_index (index_res.text)
# 3 Сохранить данные
для фильма в movie_list: save_data (фильм)