分类标签归档:爬虫

cookie 转dict


cookie 转dict

from http.cookies import SimpleCookie
rawdata = """
JSESSIONID=867C9C59CA63A01545CAD001334E6CDB; Hm_lvt_62d92d99f7c1e7a31a11759de376479f=1560419858,1560428313,1560429324,1560429869; ymtinfo=eyJ1aWQiOiIzODU2MzA0IiwicmVzb3VyY2UiOiIiLCJhcHBfbmFtZSI6IiIsImV4dF92ZXJzaW9uIjoiMSJ9; _pk_ref....

Read more

xpath 表达式


Xpath表达式

/
    代表从顶端开始寻找标签一层层寻找
    例子:/html/head/title
    text()
    提取文本信息
    例子:/html/head/titile/text()
    @[]
    提取属性
    例子://li[@class=””]/a/@href       标签[@属性=值]
    //
    寻找所有标签
    例子://li
    / /*
    例子/div/* 选取属于div元素的所有子节点
    //*
    例子//* 选取所有元素
    //div[@*]
    选取所有带属性的titl...

Read more