12.9

2016-12-09 14:22:52 +08:00 · 2016-12-09 14:22:52 +08:00 · 18419910fd
parent 04ecaaaa5e
commit 18419910fd
4 changed files with 58 additions and 40 deletions
--- a/ModifyFilename.py
+++ b/ModifyFilename.py
@ -2,9 +2,10 @@ import os
 dir = os.getcwd()
 subdir = os.listdir(dir)
 for i in subdir:
-	path = os.path.join(dir,i)
+    path = os.path.join(dir, i)
    if os.path.isdir(path):
        end_dir = os.listdir(path)
        for i in range(len(end_dir)):
            newname = end_dir[i][0:50]
-	    	os.rename(os.path.join(path,end_dir[i]),os.path.join(path,newname))
+            os.rename(os.path.join(path, end_dir[
+                      i]), os.path.join(path, newname))
--- a/biyingSpider.py
+++ b/biyingSpider.py
@ -0,0 +1,14 @@
+import requests
+import re
+import time
+local = time.strftime("%Y.%m.%d")
+url = 'http://cn.bing.com/'
+con = requests.get(url)
+content = con.text
+reg = r"(http://s.cn.bing.net/az/hprichbg/rb/.*?.jpg)"
+a = re.findall(reg, content, re.S)[0]
+print(a)
+read = requests.get(a)
+f = open('%s.jpg' % local, 'wb')
+f.write(read.content)
+f.close()
--- a/douban_movie.py
+++ b/douban_movie.py
@ -1,6 +1,7 @@
 #!/usr/bin/env python
 # encoding=utf-8
-import requests,re
+import requests
+import re
 import codecs
 from bs4 import BeautifulSoup
 from openpyxl import Workbook
@ -24,56 +25,58 @@ def download_page(url):
 def get_li(doc):
    soup = BeautifulSoup(doc, 'html.parser')
    ol = soup.find('ol', class_='grid_view')
-    name = [] #名字
-    star_con = [] #评价人数
-    score = []  #评分
-    info_list = []  #短评
+    name = []  # 名字
+    star_con = []  # 评价人数
+    score = []  # 评分
+    info_list = []  # 短评
    for i in ol.find_all('li'):
        detail = i.find('div', attrs={'class': 'hd'})
-        movie_name = detail.find('span', attrs={'class': 'title'}).get_text() #电影名字
-        level_star = i.find('span',attrs={'class':'rating_num'}).get_text() #评分
-        star = i.find('div',attrs={'class':'star'})
-        star_num = star.find(text=re.compile('评价'))  #评价
+        movie_name = detail.find(
+            'span', attrs={'class': 'title'}).get_text()  # 电影名字
+        level_star = i.find(
+            'span', attrs={'class': 'rating_num'}).get_text()  # 评分
+        star = i.find('div', attrs={'class': 'star'})
+        star_num = star.find(text=re.compile('评价'))  # 评价

-        info = i.find('span',attrs={'class':'inq'})  #短评
-        if info:     #判断是否有短评
+        info = i.find('span', attrs={'class': 'inq'})  # 短评
+        if info:  # 判断是否有短评
            info_list.append(info.get_text())
        else:
            info_list.append('无')
        score.append(level_star)

-
        name.append(movie_name)
        star_con.append(star_num)
-    page = soup.find('span', attrs={'class': 'next'}).find('a') #获取下一页
+    page = soup.find('span', attrs={'class': 'next'}).find('a')  # 获取下一页
    if page:
-        return name,star_con,score,info_list,DOWNLOAD_URL + page['href']
-    return name,star_con,score,info_list,None
+        return name, star_con, score, info_list, DOWNLOAD_URL + page['href']
+    return name, star_con, score, info_list, None


 def main():
    url = DOWNLOAD_URL
    name = []
-    star_con=[]
+    star_con = []
    score = []
    info = []
    while url:
        doc = download_page(url)
-        movie,star,level_num,info_list,url = get_li(doc)
+        movie, star, level_num, info_list, url = get_li(doc)
        name = name + movie
        star_con = star_con + star
-        score = score+level_num
-        info = info+ info_list
-    for (i,m,o,p) in zip(name,star_con,score,info):
-        col_A = 'A%s'%(name.index(i)+1)
-        col_B = 'B%s'%(name.index(i)+1)
-        col_C = 'C%s'%(name.index(i)+1)
-        col_D = 'D%s'%(name.index(i)+1)
-        ws1[col_A]=i
+        score = score + level_num
+        info = info + info_list
+    for (i, m, o, p) in zip(name, star_con, score, info):
+        col_A = 'A%s' % (name.index(i) + 1)
+        col_B = 'B%s' % (name.index(i) + 1)
+        col_C = 'C%s' % (name.index(i) + 1)
+        col_D = 'D%s' % (name.index(i) + 1)
+        ws1[col_A] = i
        ws1[col_B] = m
        ws1[col_C] = o
        ws1[col_D] = p
    wb.save(filename=dest_filename)

+
 if __name__ == '__main__':
    main()
--- a/readExcel.py
+++ b/readExcel.py
@ -3,15 +3,15 @@ from openpyxl.compat import range
 from openpyxl.cell import get_column_letter
 wb = Workbook()
 dest_filename = 'empty_book2.xlsx'
-ws1 = wb.active              #第一个表
-ws1.title = "range names"    #第一个表命名
-#遍历第一个表的1到40行，赋值一个600内的随机数
-for row in range(1,40):
+ws1 = wb.active  # 第一个表
+ws1.title = "range names"  # 第一个表命名
+# 遍历第一个表的1到40行，赋值一个600内的随机数
+for row in range(1, 40):
    ws1.append(range(60))
 ws2 = wb.create_sheet(title="Pi")
 ws2['F5'] = 3.14
 ws3 = wb.create_sheet(title="Data")
-for row in range(10,20):
-    for col in range(27,54):
-        _=ws3.cell(column=col,row=row,value="%s" % get_column_letter(col))
+for row in range(10, 20):
+    for col in range(27, 54):
+        _ = ws3.cell(column=col, row=row, value="%s" % get_column_letter(col))
 wb.save(filename=dest_filename)