(Python) Pandas的loc與iloc用法

在 Python 中,Pandas 是一個廣泛用於資料操作和分析的套件。

其中,loc 和 iloc 是兩個關鍵的索引方法,用於選擇 Pandas DataFrame 或 Series 中的特定資料。

本文將介紹這兩種方法的基本使用和區別。

繼續閱讀

(Pandas) 如何取得DataFrame資訊及大小等資訊(number of rows, columns, elements)

本文說明如何取得DataFrame行數、列數、大小、及其他相資訊(number of rows, columns, elements)。

首先建立一個DataFrame,下面各方法都以此DataFrame做範例:

1
2
3
4
5
6
7
8
9
10
11
>>> import pandas as pd 
>>> df = pd.DataFrame({
'col1': [1, 2],
'col2': ['VAL1', 'VAL2'],
'col3': [5.555, 6.666],
'col4': [None, 4]
})
>>> print(df)
col1 col2 col3 col4
0 1 VAL1 5.555 NaN
1 2 VAL2 6.666 4.0
繼續閱讀

*args和**kwargs可變參數用法

  • *args**kwargs是Python程式中能夠接收可變長度的參數。
  • *args打包成元組(Tuple)資料型態,**kwargs打包成字典(Directory)資料型態。
  • *args**kwargs可一起使用,但*args要放在**kwarg之前,不然會發生語法錯誤。

程式範例:

繼續閱讀

Python更新pip到最新版本

用pip更新

1
2
pip install --upgrade pip
pip install -U pip

用python命令來安裝

1
2
python -m pip install --upgrade pip
python -m pip install -U pip

在Windows中,若遇權限問題而無法執行,可加上–user試看看

繼續閱讀

(Python)爬蟲偽裝User-Agent - fake_useragent套件

前言

爬蟲程式會消耗網站伺服器系統資源,因此有些網站會檢查偵測網站訪問是否為爬蟲程式,並進一步阻擋爬蟲程式,常見的像是封鎖IP來阻擋請求。

本文介紹一個Python套件fake_useragent,將爬蟲程式偽裝為瀏覽器提出請求訪問網站。

什麼是User-Agent

User-Agnet(使用者代理,簡稱UA),會告訴網站伺服器,你是透過什麼工具(作業系統、瀏覽器名稱、瀏覽器版本、渲染引擎、外掛程式…等資訊)發送請求的。

繼續閱讀