(Python) Pandas的loc與iloc用法
在 Python 中,Pandas 是一個廣泛用於資料操作和分析的套件。
其中,loc 和 iloc 是兩個關鍵的索引方法,用於選擇 Pandas DataFrame 或 Series 中的特定資料。
本文將介紹這兩種方法的基本使用和區別。
在 Python 中,Pandas 是一個廣泛用於資料操作和分析的套件。
其中,loc 和 iloc 是兩個關鍵的索引方法,用於選擇 Pandas DataFrame 或 Series 中的特定資料。
本文將介紹這兩種方法的基本使用和區別。
本文說明如何取得DataFrame行數、列數、大小、及其他相資訊(number of rows, columns, elements)。
首先建立一個DataFrame,下面各方法都以此DataFrame做範例:
1 | import pandas as pd |
*args
和**kwargs
是Python程式中能夠接收可變長度的參數。*args
打包成元組(Tuple)資料型態,**kwargs
打包成字典(Directory)資料型態。*args
與**kwargs
可一起使用,但*args
要放在**kwarg
之前,不然會發生語法錯誤。程式範例:
用pip更新
1 | pip install --upgrade pip |
用python命令來安裝
1 | python -m pip install --upgrade pip |
在Windows中,若遇權限問題而無法執行,可加上–user試看看
爬蟲程式會消耗網站伺服器系統資源,因此有些網站會檢查偵測網站訪問是否為爬蟲程式,並進一步阻擋爬蟲程式,常見的像是封鎖IP來阻擋請求。
本文介紹一個Python套件fake_useragent,將爬蟲程式偽裝為瀏覽器提出請求訪問網站。
User-Agnet(使用者代理,簡稱UA),會告訴網站伺服器,你是透過什麼工具(作業系統、瀏覽器名稱、瀏覽器版本、渲染引擎、外掛程式…等資訊)發送請求的。
本篇將使用pandas.read_html()函式,實作爬取台銀上一個營業日匯率的網路爬蟲。
可用Google Colab線上實作,不需安裝Python與套件。