當前位置:首頁(yè) > 軟件 > 正文內容

多文件夾下Excel指定列的提取合并

祿以山2年前 (2023-03-16)軟件21
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

一、前言

大家好,我是崔艷飛,工作中經(jīng)常遇到,從多個(gè)文件夾下的Excel中,提取指定列,再合并成新的Excel。幾個(gè)文件夾還能應付,但要是有成百上千個(gè)文件夾,你就要哭了,本文針對此問(wèn)題,實(shí)現Python自動(dòng)處理。

二、導入庫

只需導入OS庫,進(jìn)行文件查詢(xún),和pandas庫進(jìn)行數據處理。

import pandas as pd

import os

三、編寫(xiě)代碼

*. 定義要提取Excel的總文件夾路徑

輸入要提取的文件夾、定義要提取的列、指定要保存輸出結果的文件位置

#要提取EXCEL的總文件夾路徑

path="D:/a/"

# 定義要提取的列名

key=['A','B']

path2 = os.listdir(path)

#定義輸出合并結果文件名

bb = path + 'result.xlsx'

writer = pd.ExcelWriter(bb,engine='openpyxl')

2. 獲取所有待提取的Excel文件List

file_names=[]

for p in path2:

if '.xl' in p:

continue

path3=path+p+"/"

#獲取文件夾下所有EXCEL名

xlsx_names = [x for x in os.listdir(path3) if x.endswith(".xlsx")]

for f in xlsx_names:

file_names.append(path3+f)

3. 循環(huán)讀取所有Excel,提取指定列進(jìn)行合并

df = None

for xlsx_name in file_names:

df* = pd.read_excel(xlsx_name, sheet_name=0, index_col=None,header=0)

_df=df*.loc[:, key]

if df is None:

df = _df

else:

df = pd.concat([df, _df], ignore_index=True)

print(xlsx_name + " 保存成功!共%d個(gè),第%d個(gè)。" % (len(file_names), num))

四、執行效果

所有待提取合并的文件夾如下圖:

執行代碼成功:

保存結果文件:

提取結果文件內容如下:

五、總結

本文介紹了利用Pandas對批量Excel進(jìn)行提取合并的有關(guān)操作。通過(guò)代碼的演示、運行效果的展示,對Pandas的強大功能有了進(jìn)一步地了解。有你真好,我愛(ài)Python。

收藏0
標簽: excel

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全