[Pandas教學] Pandas 是什麼?

應用篇

Pandas是什麼?

Pandas 是一個 python 數據分析的Library,可以處理大型表數據和矩陣。 特別適合分析時間序列的數據。

可以進行數據透視表、sorting、以及可以與matplotlib聯動可視化等處理。也可以取代表格軟體的大部分功能(例如Excel)

因此,除了分析之外,Pandas對於使用 Excel 的自動化工作也很有用。

Pandas的缺點

使用Pandas雖然可以簡單地處理很多數據分析,特別是複雜的統計處理只需要幾行的代碼就可以解決,但是他還是有些缺點。

因為Python是Script語言,因此雖然可以用很直觀的方式寫代碼但他的缺點就是速度較慢。

因此如果要優先運算速度,或是處理PDP(parallel distributed processing)的話,會比較推薦以下幾種方式。

  • 可以快速Compile的語言(C++, Java等)
  • 統計專用軟體(R, SPSS)
  • Excel也意外的很快(笑)

留言