CSDN文章獲取器可以用來幫助我們打開CSDN網(wǎng)站中的各種文章,并把它們提取出來,可以直接獲取csdn文章并轉(zhuǎn)換為markdown格式。CSDN文章獲取器的功能還是比較實(shí)用,對(duì)于需要這些文章的人來說很有效。
軟件介紹
需要先創(chuàng)建一個(gè)parsel.Selector對(duì)象
from parsel import Selector
html 可以是請(qǐng)求某個(gè)網(wǎng)頁的源碼,也可以是html,xml格式的字符串
selector = Selector(html)
創(chuàng)建Selector對(duì)象之后就可以開始使用了
tags = selector.css(’.content’)
我們平時(shí)使用的css中,對(duì)某一個(gè)標(biāo)簽進(jìn)行修飾時(shí),使用的是 .class_attr
在這里也是如此
.content 就是指查詢所有 class 為 content 的標(biāo)簽
查詢的結(jié)果是一個(gè)特殊的對(duì)象,不能直接得到需要的數(shù)據(jù)
將css()函數(shù)查詢到的結(jié)果轉(zhuǎn)換為字符串或者列表,需要使用一個(gè)函數(shù)
如何轉(zhuǎn)載
用瀏覽器加載文章地址,打開文章
F12打開Developer Tools,并打開Elements頁面
這里寫圖片描述
將文章開頭部分的文字作為關(guān)鍵字在Elements界面搜索
以此文為例:http://blog.csdn.net/aggressive_snail/article/details/54375876
搜索找了好久關(guān)鍵字
這里寫圖片描述
向上選則div元素,一個(gè)一個(gè)查看,直到要轉(zhuǎn)載的原文變成被選取狀態(tài),如下圖,
這里寫圖片描述
復(fù)制該div元素
這里寫圖片描述
粘貼到自己的博客編輯器里(markdown編輯器)
把div源代碼,直接復(fù)制到編輯器里