pythonpandas常用索引方式?前言:今天為大家帶來的内容是:pandas DataFrame中的tuple元素遍曆的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面随着小編來一起學習學習吧,我來為大家科普一下關于pythonpandas常用索引方式?下面希望有你要的答案,我們一起來看看吧!
pythonpandas常用索引方式
前言:
今天為大家帶來的内容是:pandas DataFrame中的tuple元素遍曆的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面随着小編來一起學習學習吧!!!
pandas中遍曆dataframe的每一個元素
假如有一個需求場景需要遍曆一個csv或excel中的每一個元素,判斷這個元素是否含有某個關鍵字
那麼可以用Python的pandas庫來實現。
方法一:
pandas的dataframe有一個很好用的函數applymap,它可以把某個函數應用到dataframe的每一個元素上,而且比常規的for循環去遍曆每個元素要快很多。如下是相關代碼:
代碼中,bool_array為一個邏輯矩陣,滿足條件元素的位置為true,否則為false。然後通過邏輯矩陣去索引dataframe1,就可以得出滿足條件的元素。
方法二:
第一種方法是一次性遍曆每個元素,這樣不好分column去處理,那換一種方式可以每次遍曆一列。
代碼種 Series.str.contains 是 Series 才有的一個操作。另外,filter_data隻輸出每一列中滿足條件的元素,更方便下一步的操作。
簡單說明:
針對pandas的dataframe和series,有強大的高階函數:apply,applymap和map函數等,它們比簡單的for循環要快很多,善用這些高階函數會讓你事半功倍。
Pandas DataFrame中的tuple元素遍曆
在用Word2vec計算出詞語的相似度之後,得到的DataFrame格式如下:
1. 索引(index)為輸入的關鍵詞,從第0列開始為相似度最高的詞語和它的餘弦相似度。
2. 這個DataFrame 中每一個元素,比如(通話, 0.21321064233779907)的格式為tuple。
輸入數據:
期望輸出的數據
1. 隻取相似度最高的詞語,丢棄餘弦相似度。
2. 把關鍵詞從索引中取出來,單獨作為1列。
期望輸出:
Python 實現的代碼:
主要使用1)applymap,2)lambda,3)reset_index,4)rename
以上就是本文的全部内容,希望對大家的學習有所幫助!!!
最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,并在後台私信小編:“07”即可領取。