将爬取的数据保存为CSV格式，python

qq_32289115 2017-04-23 10:29:47

代码如下，之前是直接输出的，但是现在我想将结果直接存为csv,导入了csv跟codecs但是后面的不知道要怎么写

import requests

import re

import csv

import codecs



def getHTMLText(url):

    try:

        r = requests.get(url, timeout=30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return ""

     

def parsePage(ilt, html):

    try:

        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)

        tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)

        

        for i in range(len(plt)):

            price = eval(plt[i].split(':')[1])

            title = eval(tlt[i].split(':')[1])

            ilt.append([price , title])

    except:

        print("")

 

#def printGoodsList(ilt):

    #tplt = "{:4}\t{:8}\t{:16}"

    #print(tplt.format("序号", "价格", "商品名称"))

    #count = 0

    #for g in ilt:

        #count = count + 1

        #print(tplt.format(count, g[0], g[1]))

         

def main():

    goods = '书包'

    depth = 3

    start_url = 'https://s.taobao.com/search?q=' + goods

    infoList = []

    for i in range(depth):

        try:

            url = start_url + '&s=' + str(44*i)

            html = getHTMLText(url)

            parsePage(infoList, html)

        except:

            continue

    #printGoodsList(infoList)

with codecs.open('打开.csv',"wb")as f:

    f.write(codecs.BOM_UTF8)

    writer=csv.write(c)

    writer.writerow(['序号','价格','商品名称'])

     

main()

...全文

4454 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

chuifengde 2017-08-07

打赏
举报

def main():
    goods = '书包'
    depth = 3
    start_url = 'https://s.taobao.com/search?q=' + goods
    infoList = []
    for i in range(depth):
        try:
            url = start_url + '&s=' + str(44*i)
            html = getHTMLText(url)
            parsePage(infoList, html)
        except:
            continue
    #printGoodsList(infoList)
    with codecs.open('打开.csv',"w",encoding='utf-8-sig')as f:
        writer=csv.writer(f)
        writer.writerow(['序号','价格','商品名称'])
        for i,l in enumerate(infoList):
            writer.writerow([i,l[0],l[1]])
main()

qq_39664654 2017-08-07