RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Python的簡便易用的數(shù)據(jù)接口

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 2023-03-10 09:45 ? 次閱讀
想必大家平時(shí)可能會做一些數(shù)據(jù)分析,那么數(shù)據(jù)分析肯定就少不了數(shù)據(jù)。

數(shù)據(jù)從哪里來呢?我們可以通過網(wǎng)絡(luò)爬蟲來爬取數(shù)據(jù),但是這個(gè)還是需要耗費(fèi)一定時(shí)間的。

這時(shí)候就會有朋友說了,有沒有現(xiàn)成的數(shù)據(jù)呢?當(dāng)然有了,今天就給大家分享一個(gè)基于 Python 的、簡便易用的數(shù)據(jù)接口,可能包含我們想要的各種各樣的數(shù)據(jù)。

簡介

這個(gè)庫的名字叫 GoPUP,GitHub 主頁是:https://github.com/justinzm/gopup

這其實(shí)是一個(gè)基于公開 API 的數(shù)據(jù)接口庫,這個(gè)庫封裝了各種各樣的方法,比如通過 wx_hot_list 這個(gè)方法我們就可以獲取實(shí)時(shí)的微信熱門文章榜單。

基本使用

下面我們來簡單介紹下它的使用方法,首先是安裝,使用 pip3 即可:

pip3installgopup

因?yàn)檫@個(gè)庫會不斷升級,如果要升級的話大家可以運(yùn)行如下命令:

pip3install-Ugopup

安裝完畢之后就可以開始使用了,其實(shí)使用起來還是非常簡單的。

比如這里我們以「微博指數(shù)」為例來說明下用法,官方文檔見 http://doc.gopup.cn/#/data/index_data?id=微博指數(shù)數(shù)據(jù)

  • 接口: weibo_index

  • 目標(biāo)地址: https://data.weibo.com/index/newindex

  • 描述: 獲取指定 詞語 的微博指數(shù)

  • 輸入參數(shù)

名稱 類型 必須 描述
word str Y 關(guān)鍵詞
time_type str Y time_type="1hour"; 1hour, 1day, 1month, 3month 選其一.
  • 輸出參數(shù)
名稱 類型 默認(rèn)顯示 描述
date datetime Y 日期-索引
index float Y 指數(shù)

大家可以看到,這個(gè)接口的目標(biāo)地址實(shí)際上就是一個(gè)公開 API,然后我們只需要輸入對應(yīng)的詞語和時(shí)間段,就可以輸出對應(yīng)的指數(shù)結(jié)果。

接口用法如下:

importgopupasgp
df_index=gp.weibo_index(word="疫情",time_type="3month")
print(df_index)

這里我們先導(dǎo)入了 gopup 庫,然后調(diào)用了它的 weibo_index 方法,傳入關(guān)鍵詞和時(shí)間段,這里我們查詢的是最近三個(gè)月的疫情對應(yīng)的微博指數(shù),也就對應(yīng)這個(gè)詞在微博的熱度。

運(yùn)行結(jié)果如下:

疫情
index
2022-07-041518338
2022-07-051950590
2022-07-061924655
2022-07-071825620
2022-07-081768546
......
2022-09-302083183
2022-10-011365015
2022-10-021498437
2022-10-031323310
2022-10-041244449

[93rowsx1columns]

可以看到輸出的實(shí)際上是 Pandas 的 DataFrame 數(shù)據(jù)結(jié)構(gòu),如果我們用 Jupyter 運(yùn)行的話可能更直觀一些。

安裝并運(yùn)行 Jupyter

pip3installjupyter
jupyternotebook

運(yùn)行類似的代碼,結(jié)果如下:

a40313fc-be5e-11ed-bfe3-dac502259ad0.png

我們還可以進(jìn)一步將其轉(zhuǎn)化為可視化圖表:

importmatplotlib.pyplotasplt

plt.figure(figsize=(15,5))
plt.title("微博「疫情」熱度走勢圖")
plt.xlabel("時(shí)間")
plt.ylabel("指數(shù)")
plt.plot(df_index.index,df_index['疫情'],'-',label="指數(shù)")
plt.legend()
plt.grid()
plt.show()

結(jié)果如下:

a47dbb16-be5e-11ed-bfe3-dac502259ad0.png

這樣通過簡單的幾行代碼我們就可以輕松將某個(gè)詞的熱度走勢可視化出來了,繪制成折線圖之后,熱度走勢一目了然。

更多數(shù)據(jù)

當(dāng)然上面僅僅是冰山一角,GoPUP 集成了各種公開 API,就像個(gè)爬蟲一樣給各種 API 提供了封裝,數(shù)據(jù)可謂是應(yīng)有盡有。

根據(jù) GoPUP 的簡介,這里面的數(shù)據(jù)包括這些類別:

  • 指數(shù)數(shù)據(jù):微博指數(shù)數(shù)據(jù),百度指數(shù)數(shù)據(jù),百度搜索數(shù)據(jù),百度資訊指數(shù),百度媒體指數(shù),百度需求圖譜,百度人群畫像年齡分布,百度人群畫像性別分布,百度人群畫像興趣分布;

  • 算數(shù)數(shù)據(jù):算數(shù)指數(shù)數(shù)據(jù),算數(shù)相關(guān)性分析,算數(shù)地域分析,算數(shù)城市分析,算數(shù)年齡分析,算數(shù)性別分析,算數(shù)用戶閱讀興趣分類,谷歌指數(shù)數(shù)據(jù),谷歌指數(shù)數(shù)據(jù),谷歌事實(shí)查證;

  • 宏觀數(shù)據(jù):中國宏觀數(shù)據(jù),中國宏觀杠桿率數(shù)據(jù),貨幣匯率數(shù)據(jù);

  • 利率數(shù)據(jù):Shibor數(shù)據(jù),Shibor報(bào)價(jià)數(shù)據(jù),Shibor均值數(shù)據(jù),LPR數(shù)據(jù);

  • 公司數(shù)據(jù):千里馬公司,獨(dú)角獸公司,倒閉公司,商業(yè)特許經(jīng)營公司;

  • 信息數(shù)據(jù):新聞聯(lián)播文字稿;

  • 生活數(shù)據(jù):中國油價(jià)數(shù)據(jù),汽柴油歷史調(diào)價(jià)信息,調(diào)價(jià)日的地區(qū)油價(jià)歷史數(shù)據(jù);

  • 詩詞數(shù)據(jù):唐代詩人,唐詩數(shù)據(jù);

  • 影視數(shù)據(jù):實(shí)時(shí)電影票房數(shù)據(jù),單日電影票房數(shù)據(jù),單日影院票房數(shù)據(jù),實(shí)時(shí)電視劇播映指數(shù),實(shí)時(shí)綜藝播映指數(shù),藝人商業(yè)價(jià)值,藝人流量價(jià)值;

  • 全國高校數(shù)據(jù):全國普通高等學(xué)校名單,全國成人高等學(xué)校名單,全國高等學(xué)校詳情數(shù)據(jù);

  • 疫情數(shù)據(jù):網(wǎng)易疫情數(shù)據(jù),丁香園疫情數(shù)據(jù)……

當(dāng)然這個(gè)庫也在不斷更新,更多詳細(xì)的內(nèi)容大家可以到官方文檔了解下:http://doc.gopup.cn/#/README

有了這些數(shù)據(jù),我們做數(shù)據(jù)分析和可視化就不用再去寫爬蟲啦,直接拿來用就好了,簡直不要太方便!

好了,關(guān)于 GoPUP 就介紹這么多了,大家可以來試試看吧


審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1499

    瀏覽量

    61959
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1445

    瀏覽量

    34048
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    6867

原文標(biāo)題:有了這個(gè)庫,這些爬蟲都不用親自寫了!

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Python存儲數(shù)據(jù)詳解

    用的存儲方式,Python標(biāo)準(zhǔn)數(shù)據(jù)接口Python DB-API,Python DB-API為開發(fā)人員提供了
    發(fā)表于 03-29 15:47

    專業(yè)python web編程工具

    還自帶服務(wù)器。其它方面,Python擁有足夠多的免費(fèi)數(shù)據(jù)函數(shù)庫、免費(fèi)的Web網(wǎng)頁模板系統(tǒng)、還有與Web服務(wù)器進(jìn)行交互的庫、這些都可以設(shè)計(jì)到你的Web應(yīng)用程序里面。在這篇文章里,我們將為Python
    發(fā)表于 06-12 16:23

    三種提高Python代碼性能的簡便方法

      在互聯(lián)網(wǎng)編程語言盛行的今天,Python是比較流行的編程語言之一。但很多程序員對于Python代碼性能的方法并不了解。今天這里主要為大家介紹三種提高Python代碼性能的簡便方法,
    發(fā)表于 08-03 18:37

    TekVPITM新型探頭接口提供了杰出的通用性和簡便易用

    TekVPITM新型探頭接口提供了杰出的通用性和簡便易用性 在過去50年中,各種示波器探頭接口設(shè)計(jì)一直在不斷演進(jìn),以滿足提高的儀器帶寬速度和測量性能要求
    發(fā)表于 03-22 11:27 ?26次下載

    SPB TV:面向iPhone最簡便易用的移動電視應(yīng)用

    SPB TV:面向iPhone最簡便易用的移動電視應(yīng)用 領(lǐng)先的移動應(yīng)用和游戲開發(fā)商 SPB Software 宣布推出 SPB TV for iPhone,該產(chǎn)品正在成為 SPB Softwa
    發(fā)表于 04-07 08:19 ?852次閱讀

    Python的幾個(gè)自然語言處理工具介紹

     NLTK是使用Python處理語言數(shù)據(jù)的領(lǐng)先平臺。它為像WordNet這樣的詞匯資源提供了簡便易用的界面。它還具有為文本分類(classification)、文本標(biāo)記(tokeniz
    發(fā)表于 12-29 14:21 ?5298次閱讀

    python串口接收數(shù)據(jù)

    本文主要介紹了python串口接收數(shù)據(jù)。其中涉及了Python使用線程來接收串口數(shù)據(jù),以及python3 Serial 串口助手的接收讀取
    發(fā)表于 01-15 09:52 ?4.6w次閱讀
    <b class='flag-5'>python</b>串口接收<b class='flag-5'>數(shù)據(jù)</b>

    python接口文件使用說明

    首先,python接口文件在安裝好的darknet目錄下的python文件夾,打開就可以看到
    發(fā)表于 05-18 11:30 ?2066次閱讀
    <b class='flag-5'>python</b><b class='flag-5'>接口</b>文件使用說明

    Python編程用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)

    Python是一種通用的,高級的,面向?qū)ο蟮模子趯W(xué)習(xí)的編程語言。它由Guido van Rossum創(chuàng)建,他被稱為Python的教父。Python是一種流行的編程語言,因?yàn)樗唵?b class='flag-5'>易用
    發(fā)表于 07-05 14:44 ?773次閱讀

    Danfo.js提供高性能、直觀易用數(shù)據(jù)結(jié)構(gòu),支持結(jié)構(gòu)化數(shù)據(jù)的操作和處理

    Danfo.js 是個(gè) JavaScript 開源庫,提供了高性能、直觀易用數(shù)據(jù)結(jié)構(gòu),支持結(jié)構(gòu)化數(shù)據(jù)的操作和處理。Danfo.js 深受 Python Pandas 庫的啟發(fā),并提供
    的頭像 發(fā)表于 09-23 18:21 ?5283次閱讀

    詳談Python數(shù)據(jù)模型和對象模型

    Python官方文檔說法是“Python數(shù)據(jù)模型”,大多數(shù)Python書籍作者說法是“Python對象模型”,它們是一個(gè)意思,表示“計(jì)算機(jī)編
    的頭像 發(fā)表于 02-10 15:59 ?2545次閱讀
    詳談<b class='flag-5'>Python</b>的<b class='flag-5'>數(shù)據(jù)</b>模型和對象模型

    python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

    python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) Python是一個(gè)非常流行的編程語言,被廣泛用于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域。在本篇文章中,我們將探討Python
    的頭像 發(fā)表于 08-17 16:29 ?1312次閱讀

    python有什么用 如何用python創(chuàng)建數(shù)據(jù)

    python有什么用 如何用python創(chuàng)建數(shù)據(jù)Python是一種高級編程語言,可以用于開發(fā)各種類型的應(yīng)用程序和工具。它的廣泛應(yīng)用使它在編程領(lǐng)域中極為受歡迎。
    的頭像 發(fā)表于 08-28 16:41 ?1172次閱讀

    python讀取數(shù)據(jù)數(shù)據(jù) python查詢數(shù)據(jù)python數(shù)據(jù)庫連接

    python讀取數(shù)據(jù)數(shù)據(jù) python查詢數(shù)據(jù)python
    的頭像 發(fā)表于 08-28 17:09 ?1813次閱讀

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而
    的頭像 發(fā)表于 08-01 15:27 ?1883次閱讀
    RM新时代网站-首页