day02 ползет IMDb сообщение

«» ' 
Ползать IMDb сообщение:
Название фильма, фильм URL, режиссер 
кинозвезда, фильм год, жанр
оценка фильма, кино, обзоры фильмов
«» ' 
Пресмыкающихся трехчастной песни
импорт   запросов
 импорта   повторно
# 1 посылает запрос
Защиту get_page (URL): 
    réponse = requests.get (URL)
     возвращение réponse
# 2. Синтаксический данные
Защиту parse_index (HTML): 
    movie_list = re.findall ( ' .? <DIV класс = "пункт"> * <эм класс = "">.? (*) </ EM> * <A HREF =.? "(. *) "?> * <пролет класс =" название "> (*) </ SPAN> *导演:.?.? (*)主演:.? (*) <br> (*).?.? </ р>. *? <промежуток класс = "rating_num". *?> (. *?) </ SPAN>. *? <SPAN> (. *?)人评价</ SPAN>. *? <пролет класс = "Inq"> (. *?) </ SPAN> ' , 
            HTML, 
            re.S) 
    возвращение movie_list
# 3 Сохранить данные
DEF save_data (видео): 
    Top, m_url, имя, daoyan, актер, year_type, точка, разговоры, убывание = Movie 
    year_type = year_type.strip ( ' \ п ' ) 
    Данные = F '' ' 
              ======== ======= Добро пожаловать на IMDb =============== 
                              рейтинги фильмов: {} топ 
                              фильмов URL: {} m_url 
                              название фильма: {имя} 
                              кинорежиссеров: {daoyan } 
                              фильм с участием актера: {} 
                              Жанр: {year_type} 
                              рейтинги фильмов: {точка} 
                              фильм: {} убывание 
                              обзор фильма: {} Обсуждение
              ================= может прийти снова ================== 
              \ п 
              \ о н- 
            «» ' 
    Print (данные) 
    Открыть с помощью ( ' douban_top250.text ' , ' A ' , кодирование = 'UTF- 8 ' ) AS F: 
        f.write (Data) 

    Печать (F ' фильм: {имя} успешно написано ... ' )
# Колющие все Главная
если  __name__ == ' __main__ ' : 
    Num = 0
     для линии в диапазоне (10 ): 
        URL = F ' https://movie.douban.com/top250?start={num}&filter= ' 
        Num + = 25
         печати (URL )
# 1 посылает запрос на каждый дом
index_res = get_page (URL)
# 2. Синтаксическая домашняя страница для информации фильма
movie_list = parse_index (index_res.text)
# 3 Сохранить данные
        для фильма в movie_list: 
            save_data (фильм)

 

рекомендация

отwww.cnblogs.com/changgeyimeng/p/11120471.html