Pandas是什麼?
Pandas 是一個 python 數據分析的Library,可以處理大型表數據和矩陣。 特別適合分析時間序列的數據。
可以進行數據透視表、sorting、以及可以與matplotlib聯動可視化等處理。也可以取代表格軟體的大部分功能(例如Excel)
因此,除了分析之外,Pandas對於使用 Excel 的自動化工作也很有用。
Pandas的缺點
使用Pandas雖然可以簡單地處理很多數據分析,特別是複雜的統計處理只需要幾行的代碼就可以解決,但是他還是有些缺點。
因為Python是Script語言,因此雖然可以用很直觀的方式寫代碼但他的缺點就是速度較慢。
因此如果要優先運算速度,或是處理PDP(parallel distributed processing)的話,會比較推薦以下幾種方式。
- 可以快速Compile的語言(C++, Java等)
- 統計專用軟體(R, SPSS)
- Excel也意外的很快(笑)
留言