首页
/
每日頭條
/
科技
/
python word文檔處理庫
python word文檔處理庫
更新时间:2025-01-08 23:39:35
Python-docx 模塊基礎入門之一 Word文件讀取操作1.打開Word文檔document

讀取存在的文件,要用到docx庫中的Document

document = Document(file_path),file_path表示要打開的Word路徑,沒有參數表示新建文檔。

代碼:

from docx import Document document = Document('test.docx')

python word文檔處理庫(python辦公自動化之Word篇)1

docx打開文件

獲取段落paragraph

一個document文檔包括一個或者多個段落,都在document的paragras屬性中,document.paragraphs返回所有段落對象的列表。

例如paragrahps = document.paragraphs

paragraphs[0] --> 表示第1段對象

paragraphs[1] --> 表示第2段對象

……

len(pargraphs) --> 查看文檔有多少個自然段

代碼:

paragraphs = document.paragraphs # paragraphs表示得到的所有段落列表 type(paragraphs) # 返回列表 p1 = paragraphs[0] # p1表示第一段段落對象 len(paragraphs) # 檢查文檔一共有多少段

python word文檔處理庫(python辦公自動化之Word篇)2

段落對象

獲取段落paragraph文本内容

.text用于獲取文本内容,不僅可以獲取段落對象的,還可以獲取塊對象的文本内容

代碼:以p2第二段對象為例

p2.text

python word文檔處理庫(python辦公自動化之Word篇)3

獲取文字塊run及其文本内容

一個段落有多個文本塊run對象組成,我們可以通過paragraph.runs獲取所有塊對象,然後通過.text獲取其内容,這裡以第4段為例p4 = paragraphs[3]

python word文檔處理庫(python辦公自動化之Word篇)4

代碼:

for run in p4.runs: print(run.text)

python word文檔處理庫(python辦公自動化之Word篇)5

完整遍曆文檔document文本内容

代碼:

for paragraph in document.paragraphs: for run in paragraph.runs: print(run.text)

遍曆文檔document的表格table對象

和openpyxl 操作excel類似,table表格遍曆采取三級循環樣式

A:按照行遍曆

for table in document.tables: for row in table.rows: for cell in row.cells: print(cell.text)

B: 按照列遍曆

for table in document.tables: for column in table.columns: for cell in column.cells: print(cell.text)

概況一下:要獲得文本,都可以使用.text,不管是段落paragraph,還是run,或者是table表格的cell單元格。

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
如何重新安裝系統
如何重新安裝系統
如何重新安裝系統?點擊【電腦管家】圖标,打開電腦管家,我來為大家科普一下關于如何重新安裝系統?以下内容希望對你有幫助!如何重新安裝系統點擊【電腦管家】圖标,打開電腦管家。找到【工具箱】,點擊【工具箱】。點擊【軟件管理】,找到【搜索框】,輸入...
2025-01-08
将系統安裝到ssd中
将系統安裝到ssd中
電腦很卡,但捉襟見肘的你卻無法給它升級硬件,加個固态硬盤緩解一下。但即便如此,我們還是有辦法解決問題的!科普小知識:RAM(内存),也叫主存,是與CPU直接交換數據的内部存儲器,簡單理解就是臨時存儲數據的地方,它的速度是機械硬盤的50-10...
2025-01-08
rfid工器具管理系統方案
rfid工器具管理系統方案
rfid工器具管理系統方案?設備管理是許多不同行業中的企業最緊迫地需要解決的資産管控問題使用深圳艾森物聯技術有限公司的的最新的RFID工具跟蹤和庫存管理解決方案可以使設備管理的時間大大減少,同時提供了前所未有的準确性和安全性,我來為大家講解...
2025-01-08
兩個蘋果手機可以共用一個id嗎
兩個蘋果手機可以共用一個id嗎
兩個蘋果手機可以共用一個id嗎?完全可以的一個appleid賬号可以同時登陸在五台設備上,今天小編就來說說關于兩個蘋果手機可以共用一個id嗎?下面更多詳細答案一起來看看吧!兩個蘋果手機可以共用一個id嗎完全可以的。一個appleid賬号可以...
2025-01-08
程序員怎樣清理手機垃圾
程序員怎樣清理手機垃圾
程序員怎樣清理手機垃圾?今天教大家一個手機程序員都不會說的手機清理方法,你的手機用過一段時間是不是覺得很卡内存滿了,速度還很慢,很多人會清理聊天記錄、照片、視頻、文件等資料,就沒有其他辦法了,其實照片、視頻等文件隻占手機内存極小的一部分,今...
2025-01-08
Copyright 2023-2025 - www.tftnews.com All Rights Reserved