今日は再び時間を無駄に忘れ防止の記録、長い時間のためにもつれた正規表現を爬虫類
コンテンツ=要求。取得(URL) M = re.findall(R ' <A HREF = \ "([0-9A-ZA-Z \ _ \ / \ \%\ \ = \ - ?\&] +)\" '、content.text、 re.I)
最初は、私は、コンテンツがSTR(コンテンツ)が空であるためか、一致するように、できない通常の試合でSTR(コンテンツ)となっ置きます。
それはcontent.text一致する必要があります