pythonpandas常用索引方式-tft每日頭條

pythonpandas常用索引方式?前言：今天為大家帶來的内容是：pandas DataFrame中的tuple元素遍曆的實現，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面随着小編來一起學習學習吧，我來為大家科普一下關于pythonpandas常用索引方式?下面希望有你要的答案，我們一起來看看吧!

pythonpandas常用索引方式

前言：

今天為大家帶來的内容是：pandas DataFrame中的tuple元素遍曆的實現，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面随着小編來一起學習學習吧！！！

pandas中遍曆dataframe的每一個元素

假如有一個需求場景需要遍曆一個csv或excel中的每一個元素，判斷這個元素是否含有某個關鍵字

那麼可以用Python的pandas庫來實現。

方法一：

pandas的dataframe有一個很好用的函數applymap，它可以把某個函數應用到dataframe的每一個元素上，而且比常規的for循環去遍曆每個元素要快很多。如下是相關代碼：

代碼中，bool_array為一個邏輯矩陣，滿足條件元素的位置為true，否則為false。然後通過邏輯矩陣去索引dataframe1，就可以得出滿足條件的元素。

方法二：

第一種方法是一次性遍曆每個元素，這樣不好分column去處理，那換一種方式可以每次遍曆一列。

代碼種 Series.str.contains 是 Series 才有的一個操作。另外，filter_data隻輸出每一列中滿足條件的元素，更方便下一步的操作。

簡單說明：

針對pandas的dataframe和series，有強大的高階函數：apply，applymap和map函數等，它們比簡單的for循環要快很多，善用這些高階函數會讓你事半功倍。

Pandas DataFrame中的tuple元素遍曆

在用Word2vec計算出詞語的相似度之後，得到的DataFrame格式如下：

1. 索引（index）為輸入的關鍵詞，從第0列開始為相似度最高的詞語和它的餘弦相似度。

2. 這個DataFrame 中每一個元素，比如(通話, 0.21321064233779907)的格式為tuple。

輸入數據：

期望輸出的數據

1. 隻取相似度最高的詞語，丢棄餘弦相似度。

2. 把關鍵詞從索引中取出來，單獨作為1列。

期望輸出：

Python 實現的代碼：

主要使用1）applymap，2）lambda，3）reset_index，4）rename

以上就是本文的全部内容，希望對大家的學習有所幫助！！！

最後多說一句，小編是一名python開發工程師，這裡有我自己整理了一套最新的python系統學習教程，包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編，并在後台私信小編：“07”即可領取。